[음악] 분류기는 결정을 내립니다 문장이 긍정적인지 부정적인지 진단 결과와 x-ray, 분석을 통해 독감인지 감기인지 알아내는 등 말입니다 이런 결정은 누군가 내려야만 하죠 분류기 중에서도 선형 분류기가 어떻게 결정을 내리는지 알아봅시다 결정경계를 이해하기 위해서 단어 2개가 0이 아닌 가중치를 갖고 있다고 합시다 굉장하다, 양수 가중치 1과 끔찍하다, 음수 가중치 1.5입니다 이럴 경우 점수는 1 * 굉장하다 등장 횟수 - 1.5 * 끔찍하다 횟수가 될 겁니다 그래프에 그려볼텐데 굉장하다 축과 끔찍하다 축으로 이루어져 있습니다 예를 들어 문장 초밥은 굉장했다 음식은 굉장했다, 하지만 서비스는 끔찍했다 굉장하다 2개과 끔찍하다 1개죠 그래프 (2,1)에 점을 찍습니다 비슷한 방식으로 끔찍하다 3개와 굉장하다 1개 굉장하다만 3개 있으면 (3,0)에 점을 찍습니다 다른 문장에도 똑같이 적용합니다 문장 점수를 어떻게 매기는지, 결정에 어떤 영향을 끼치는지 더 알아봅시다 예를 들어 (3,0) 점은 굉장하다 3개와 끔찍하다 0개입니다 굉장하다 3개는 긍정적인 예측을 안겨주는데 점수가 0보다 크기 때문이죠 오른쪽 밑에 있는 모든 점이 그렇습니다 왼쪽 위에 있는 모든 점은 0보다 낮은 점수를 가졌는데 예를 들어 끔찍하다 3개와 굉장하다 1개는 0보다 낮은 점수입니다 부정적이라는 라벨이 붙는 것이죠 부정적인 예측과 긍정적인 예측을 나누는 선은 긍정인지 부정인지 알 수 없는 지점인데 1.0 * 굉장하다 횟수 - 1.5 * 끔찍하다의 결과가 0이 되는 곳이죠 이렇게 예측이 불확실해지는 선을 결정경계라고 부릅니다 그 선을 기준으로 한쪽은 긍정이고 다른 쪽은 부정입니다 결정경계 1.0 * 굉장하다 횟수 - 1.5 * 끔찍하다 횟수 0이 직선임을 확인할 수 있습니다 선형분류기라 불리는 이유죠 선형결정경계입니다 결정경계는 긍정적인 예측과 부정적인 예측을 분리합니다 특징이 2개인 경우에는 지금과 같이 직선이 됩니다 하지만 특징 수가 늘어나면 상황이 달라지죠 2차원에서 선형 함수는 직선입니다 3차원에서 예를 들어 3단어가 0가 아닌 가중치를 갖고 있으면 평면이 됩니다 3차원으로 그리기는 조금 어렵지만 긍정적인 예측은 평면 위에, 부정적인 예측은 평면 밑에 존재하며 평면은 공간에서 약간 기울어져 있습니다 실제 애플리케이션에서는 3단어가 아니라 수 만 단어가 0이 아닌 가중치를 가질 확률이 높습니다 그럴 경우 고차원 분리기를 초평면이라고 합니다 물론 선형 분류기만 쓸 수 있는 건 아닙니다 더 복잡한 분류기도 사용할 수 있죠 직선, 초평면보다 복잡한 모양과 구불구불한 구분선을 가지게 됩니다 분류 강의에서 자세히 배웁니다 [음악]