ROC-AUC, PR-AUC 개념 비교 정리
머신러닝에서 분류 모델에 대한 평가 지표로 자주 활용되는 지표로 ROC-AUC, PR-AUC가 있다. 이진 분류 모델의 경우 0에서 1사이의 확률값을 예측한 뒤 임계값 (Threshold) 을 기준으로 0, 1을 분류한다. 대부분의 불균형 데이터에서 모델의 정확도 (Accuracy) 뿐만 아니라, 임계값에 따른 정밀도 (Precision) 와 재현율 (Recall) 의 상충관계를 고려하여 최적의 임계값을 결정하게 된다. 이때 특정 임계값에 영향을 받지 않고, 모델 간의 성능을 비교하기 위해 ROC-AUC 및 PR-AUC 지표가 활용된다. 1. Confusion matrix (혼동 행렬) 우선 분류의 평가지표를 계산하기 위한 기초가 되는 Confusion matix의 구성을 살펴보자. 실제 값 (Actua..
2022.07.21