1 00:00:03,630 --> 00:00:06,840 Chúng ta đã nói về sự phân loại theo dự đoán, 2 00:00:06,840 --> 00:00:11,744 là một câu tích cực hay một câu tiêu cực, là email rác hay không phải email rác, 3 00:00:11,744 --> 00:00:15,210 nhưng nói chung bạn muốn nói một chút ngoài điều đó và 4 00:00:15,210 --> 00:00:19,550 hỏi về khả năng có email rác là gì? 5 00:00:19,550 --> 00:00:22,500 Tôi đã tự tin vào dự đoán như thế nào? 6 00:00:22,500 --> 00:00:24,260 Nếu bạn chỉ nhìn vào tích cực hoặc tiêu cực, 7 00:00:24,260 --> 00:00:27,200 tôi muốn biết sự chắc chắn về dự đoán như thế nào. 8 00:00:27,200 --> 00:00:30,550 Ví dụ, nếu bạn lấy câu như là the sushi and 9 00:00:30,550 --> 00:00:32,110 everything else were awesome. 10 00:00:33,540 --> 00:00:35,920 Đó là một câu thêm vào. 11 00:00:35,920 --> 00:00:37,730 Chắc chắn tích cực. 12 00:00:37,730 --> 00:00:41,330 Tuy nhiên the sushi was good, the service was okay. 13 00:00:41,330 --> 00:00:43,890 Nó có thể là một điểm cộng nhưng tôi không chắc. 14 00:00:43,890 --> 00:00:45,810 Nó không rõ ràng. 15 00:00:45,810 --> 00:00:51,824 Và vì thế cái mà phân loại thường làm không chỉ đầu ra là tích cực hay 16 00:00:51,824 --> 00:00:56,800 tiêu cực, mà đầu ra tự tin và chắc chắn như thế nào. 17 00:00:56,800 --> 00:00:59,440 Một cách để làm điều đó là nói về các khả năng. 18 00:00:59,440 --> 00:01:03,352 Bạn phải đưa ra khả năng của câu tích cực hay 19 00:01:03,352 --> 00:01:07,570 tiêu cực, đã đưa vào câu x. 20 00:01:07,570 --> 00:01:08,810 Vì thế nhãn mác đầu ra, 21 00:01:08,810 --> 00:01:12,190 xác suất của mác đầu ra là gì khi đưa câu vào? 22 00:01:12,190 --> 00:01:19,219 Ví dụ, ví dụ ở bên trên thay vì nói đó là + 23 00:01:19,219 --> 00:01:25,530 chúng ta có thể nói nó là + với giá trị x đưa vào là 0.99. 24 00:01:25,530 --> 00:01:29,880 X là 0.55 bởi vì tôi không chắc về điều đó. 25 00:01:29,880 --> 00:01:34,149 Các khả năng dự đoán hoặc mức độ tự tin là cực kì quan trọng và 26 00:01:34,149 --> 00:01:38,430 cũng như chúng ta sẽ thấy trong bài học phân loại, nó cho phép bạn làm rất nhiều thứ. 27 00:01:38,430 --> 00:01:42,786 Ví dụ khi bạn biết xác suất, bạn có thể đưa ra quyết định như 28 00:01:42,786 --> 00:01:46,667 một ranh giới quyết định tốt đánh đổi các tích cực sai và 29 00:01:46,667 --> 00:01:49,480 tiêu cực sai, và sự cân bằng giữa hai cái đó. 30 00:01:49,480 --> 00:01:53,749 [NHẠC]