[NHẠC] Xây dựng một bộ phân loại cảm tính. Và tôi sẽ đặt một # ở đây để tạo một tiêu đề đẹp. Đây là nhiệm vụ tiếp theo của chúng ta. Khi bạn xây dựng một bộ phân loại cảm tính, bạn nói về tích cực và tiêu cực. Hướng ngón tay xuông dưới và hướng ngón tay lên trên. Nhưng nếu bạn còn nhớ, mức đánh giá sản phẩm của chúng ta, chúng ta không có tích cực và tiêu cực, chúng là những con số. Ví dụ, nếu tôi lấy tất cả các sản phẩm và tôi sẽ lấy cột đánh giá và tôi thực hiện .show, chúng ta đã làm bên trên cho hươu cao cổ nhưng thực hiện .show cho mọi thứ với view là Categorical, bây giờ chúng ta sẽ có một histogram cho tất cả các views và nếu bạn xem lướt qua chúng bạn sẽ thấy hầu hết các đánh giá là tích cực trên bảng 107,000 các đánh giá là năm sao. Hầu hết mọi người đánh giá tích cực và chỉ viết các đánh giá về các sản phẩm họ thích. Họ không viết các đánh giá về các sản phẩm họ không thích. Các đánh giá tiếp theo 33,000 bốn sao. Sau đó ba sao và lại tiếp tục, nhiều người viết đánh giá tệ một sao, hai sao, tại sao bạn lại đưa ra đánh giá sản phẩm hai sao? Bạn có thể cho họ một sao nếu bạn ghét nó. Và đây là cái mà chúng ta quan sát trong biểu đồ. Nhưng một lần nữa với phân tích cảm tính, chúng ta phải xác định ngón tay đưa xuống là gì và đưa ngón tay lên là gì. Và tôi sẽ thực hiện một lựa chọn tùy ý ở đây. Hãy nói những thứ đó là bốn, năm sao mà mọi người thích. Đó là tích cực. Những thứ có một, hai sao là tiêu cực. Nhưng những thứ có ba sao, loại ở giữa. Hãy để chúng ra ngoài. Chúng ta sẽ làm cái gọi là kỹ thuật dữ liệu, xác định cái nào là cảm tính tích cực và tiêu cực. Hãy làm điều đó bây giờ. Trong đề mục nhỏ chúng ta sẽ xác định cái nào là cảm tính tích cực và tiêu cực. Và cái mà tôi sẽ làm đầu tiên là bỏ qua tất cả các đánh giá thành phố. Cách làm là nói, ok tôi sẽ lấy product stable từ các sản phẩm khác nhau. Và tôi sẽ chỉ lựa chọn mọi thứ ra khỏi bảng products với đánh giá không bằng ba. products[products['rating'] |=3]. Đó là bước đầu tiên trong việc kỹ thuật dữ liệu của chúng ta. Và bây giờ bước tiếp theo trong nhiệm vụ này là tìm những điểm bắt đầu đi lên và đi xuống Tôi sẽ nói một cảm tính tích cực bằng bốn sao hoặc năm sao. Hãy cùng thực hiện và thêm cột mới vào bảng của chúng ta cái mà xác định cảm tính thực sự. products cột mới được gọi là sentiment. Nó sẽ là một cột nhị phân, 0 1. Và cách chúng ta sẽ định nghĩa cột là chúng ta sẽ nói đánh giá sản phẩm có lớn hơn hoặc bằng bốn không? Nếu nó lớn hơn hoặc bằng bốn, nó sẽ nhận được 1 và nếu nó nhỏ hơn bốn nó sẽ nhận 0, bây giờ nếu tôi nhìn vào product stable, bạn sẽ thấy rằng tôi đã thêm một cột mới bên phải được gọi là Sentiment. Hầu hết các sentiment là tích cực, như chúng ta đã thấy ở trên nhưng cũng nhiều tiêu cực, bằng 0. Ok bây giờ chúng ta đã sẵn sàng, chúng ta cuối cùng đã sẵn sàng để huấn luyện bộ phân loại cảm tính. [NHẠC]