예측으로써의 분류만 알아봤는데 이 문장이 긍정적인지 부정적인지, 이 이메일이 스팸인지 아닌지, 일반적으로는 한 걸음 더 나아가서 이 이메일이 스팸일 확률은 얼만지 알고자 합니다 예측에 대해 얼마나 자신이 있나? 긍정과 부정만이 아니라 예측이 얼마나 확실한지도 알고 싶습니다 초밥을 포함한 모든 건 굉장했다라는 문장을 예로 들어보겠습니다 분명히 긍정적이죠 분명히 긍정적입니다 하지만 초밥은 좋았지만 서비스는 별로였다 이건 긍정적인 것 같지만 확실하지는 않습니다 아까만큼 분명하지 않죠 그래서 분류기는 흔히 결과를 긍정, 부정으로만 나타내지 않고 얼마나 확실한지, 자신이 있는지도 나타냅니다 이를 위해 쓰이는 게 확률입니다 입력 문장 x에 대해 긍정인지 부정인지 확률을 제시합니다 결과 라벨은 입력 문장이 주어졌을 때 확률 결과 라벨은 무엇인가? 아까의 예를 들면 분명히 긍정이라고 하는 대신에 확률이 0.99라고 할 수도 있습니다 두번째 x에 대한 확률은 0.55인데 확신이 없기 때문이죠 확률이나 신뢰 수준 예측은 분류 강의에서 보게 되겠지만 매우 중요한데 여러 가지에 도움을 주기 때문입니다 확률을 알면 결정경계를 어떻게 선택해야 거짓 긍정과 거짓 부정 사이의 균형을 잡을 수 있는지 알게 됩니다 [음악]