[음악] 회귀 모델에서는 회귀 모델 맞춤을 통해 주택 가격을 예측하고 제곱합으로 오차를 구했습니다 분류에서는 오차(오류)가 조금 다른데 어떤 입력에 대해 맞고 틀린지를
알아야 하기 때문이죠 분류의 오류 측정에 대해 좀 더 알아봅시다 분류기를 배울 때 입력 데이터 세트가 주어졌습니다 긍정적, 부정적인 감성으로 표시된 문장인데 회귀에서와 같이 훈련 세트와 테스트 세트로 나눕니다 훈련 세트를 분류기에 집어넣으면 알고리즘이 단어 가중치를 학습합니다 예를 들어 좋다가 가중치 1.0, 굉장하다 1.7, 나쁘다 -1.0 끔찍하다 -3.3이라고 학습합니다 그렇게 얻은 가중치로 테스트 세트의 모든 샘플에 점수를 매겨 분류가 얼마나
정확한지 확인합니다 평가가 어떤 식인지 설명드리죠 분류 오류 측정을 어떻게 하는지부터 짚고 넘어갑시다 다음의 테스트 예제가 있다고 합시다 초밥은 훌륭했다는 긍정적인 문장인데
얼마나 많은 테스트 문장을 맞추고 틀리는지 보죠 이제부터 문장 초밥은 훌륭하다를 이미 학습된 분류기에 넣습니다 학습된 분류기가 참 라벨을 보지 않고도 맞추기를 바랍니다 그러기 위해 참 라벨을 감춥니다 참 라벨이 숨겨진 문장이 학습된 분류기에 들어갑니다 문장이 주어졌을 때 y^이 긍정이라고 예측합니다 긍정적인 문장이라고 했으니 올바른 예측입니다 맞은 문장 수가 하나 올라갑니다 다른 문장을 테스트해보죠 음식은 그럭저럭이었다는 부정적인 문장입니다 약간 모호한 문장이지만 훈련 세트에서 부정적으로 분류되어 있습니다 이 문장의 라벨을 감추고 분류기에 넣습니다 분류기가 뭘 하나 지켜보죠 이 경우 음식은 그럭저럭이었다가 긍정적이란 예측을 하면 틀린 것인데 실제 라벨은 부정적이기 때문이죠 실수를 했습니다 실수를 하나 더합니다 올바른 분류 1개와 실수 1개입니다 말뭉치의 모든 문장에 대해 이 테스트를 합니다 분류에서는 흔히 쓰는 품질 기준이
두 개 있습니다 하나는 실수를 기준으로 삼습니다 오류 기준은 실수하는 테스트 예제의 비율입니다 분류된 모든 문장에 대해 실수가 몇 개 있었는지 세서 총 테스트 문장 수로 나눕니다 예를 들어 테스트 문장 100개에서 실수가 10개라고 하면 오류는 0.1, 10%입니다 가장 낮은 오류는 0, 그러니까 실수 하나 없는 상태가 되겠죠 오류 대신에 분류기의 정확도로 측정하는 경우도 많습니다 정확도는 정반대지요 정확도에선 오류 개수를 세는 대신에 올바른 분류의 수를 측정합니다 올바른 분류 수 나누기 총 문장 수가 비율이 됩니다 따라서 오류와 달리 가장 좋은 수치가 0이 아니라 모든 문장을 맞춘 1이 되겠죠 둘 사이에는 당연한 관계가 있습니다 오류 = 1 - 정확도이고 그 반대도 같습니다 [음악]