[음악] 감성 분류기 만들기 #를 붙여서 제목으로 만들겠습니다 이게 다음 작업으로 넘어가죠 감성 분류기를 만들 때 긍정, 부정을 다루게 되죠 강추나, 비추냐 상품 평점은 긍정, 부정이 아니라 그저 숫자일 뿐입니다 예를 들어 모든 상품의 평점 열에 기린에게 했듯이 카테고리가 일치하는 모든 열에 .show를 붙이면 모든 뷰에 대한 히스토그램이 나오고, 잠깐 살펴보면 거의 모든 리뷰가 긍정적으로 107000개의 리뷰가 5점입니다 대부분의 사람은 좋아하는 상품에 대한 긍정적인 리뷰를 남깁니다 좋아하지 않는 상품에 대해서는 보통 안 쓰죠 다음으론 4점이 33000개 있습니다 그리고 3점, 그리고 낮은 1점, 2점 대체 왜 2점을 줄까요? 그렇게 싫으면 차라리 1점을 주지요 지금까지 히스토그램을 살펴봤습니다 감성분석을 위해선 강추와 비추를 구분해야 합니다 일단 아무렇게나 해봅니다 4,5점은 사람들이 좋아하는 긍정적인 리뷰라고 가정합니다 1,2점은 부정적이고요 3점은 중간입니다 그냥 버립시다 데이터 공학이라는 걸 조금 할 텐데 어떤 게 긍정적이고 부정적인지 밝히는 작업입니다 바로 해보죠 부제로 긍정적, 부정적 감성 구분하기라고 씁니다 먼저 별점 3개 리뷰를 전부 무시합니다 그러려면 상품 변수 표에서 별점 3개가 아닌 것만 선택합니다 products[products['rating'] != 3] 이렇게 하죠 데이터 공학을 위한 첫걸음을 디뎠습니다 다음으로 강추와 비추를 구분합니다 긍정적 감성은 별점이 4,5개인 리뷰입니다 이제 딥 특징이 표에 새로운 감성 열을 추가해 줍니다 상품의 새 열인 감성은 0이나 1인 이진 열이 될 겁니다 그러기 위해 열에 상품 평점이 4보다 크거나 같으면 1을 넣고 아니면 0을 넣습니다 이제 상품 표 헤드를 보면 감성이란 열이 오른쪽에 추가되어 있습니다 감성은 대부분 긍정적이지만 몇몇은 부정적입니다 이제 준비를 마쳤으니 감성 분류기를 훈련시킬 차례입니다 [음악]