[NHẠC] Như Emily vừa trao đổi, chúng ta sẽ xem học máy qua lăng kính một phạm vi rộng các tình huống nghiên cứu trong các lĩnh vực khác nhau với các khái niệm đằng sau chúng. Vì vậy các lớp học máy khác bạn có thể đưa ra đang thực sự cung cấp một danh sách dài các thuật toán và các phương pháp. Những thứ như máy hỗ trợ vector và hạt nhân, thành phần logistic, mạng lưới, vân vân. Và các khóa học đó chỉ như một danh sách dài các phương pháp. Vấn đề với cách tiếp cận là khi bạn bắt đầu từ các thuật toán bạn kết thúc bằng các use case đơn giản với các ứng dụng, chúng thực sự không liên quan đến thực tế. Vì thế, chúng tôi đang làm rất khác trong chuỗi khóa học này, và chúng tôi đã làm cách này cho đến tận bây giờ. Emily và tôi đã tạo ra một khóa học ở trường Đại học Washington về học máy ở quy mô dữ liệu lớn. Chúng tôi đi tiên phong bằng cách tiếp cận use case trong giảng dạy học máy. Và trong khóa học đó, chúng tôi đã thấy nhiều phản hồi tích cực từ những người thực sự hiểu các khái niệm. Vì vậy chúng tôi sẽ bắt đầu từ các use case trong khóa học đầu tiên. Và bắt đầu từ các use case, bạn sẽ có thể nắm bắt được các khái niệm mấu chốt và các kỹ thuật cho phép bạn xây dựng, đo lường chất lượng và hiểu liệu những ứng dụng thông minh của bạn đang hoạt động tốt hay không. Và cuối cùng, bạn sẽ tạo ra một loạt các ứng dụng thông minh này. Để xây dựng các ứng dụng thông minh này, bạn phải nghĩ về những việc gì tôi sẽ làm, tôi sẽ giải quyết vấn đề phân tích cảm tính và các mô hình gì, các mô hình học máy nào tôi sẽ sử dụng, và những thứ như các máy vector hỗ trợ hoặc sự hồi quy, các phương pháp khi họ sử dụng để tối ưu hóa tham số của các mô hình là gì? Sau đó tôi hỏi một câu hỏi như là điều này có thực sự cung cấp cho bộ thông minh mà tôi đang mong đợi không? Chúng tôi đo chất lượng của hệ thống đó như thế nào? Trong chuỗi khóa học này, những gì chúng tôi sẽ làm là trì hoãn các mảnh cốt lõi của cách mô tả một mô hình và tối ưu hóa nó ở trong các khóa học này. Và khóa học đầu tiên này sẽ tập trung vào việc giúp chúng ta hình dung những việc gì chúng ta đang cố giải quyết, các phương pháp học máy có ý nghĩa gì, và đo lường chúng như thế nào. Và với điều đó, sử dụng thuật toán như hộp đen, chúng ta sẽ có thể xây dựng một loạt các ứng dụng thực sự thông mình cùng nhau. Và chúng tôi sẽ lập trình chúng và xây dựng chúng và minh họa chúng trong một loạt các cách khác nhau. Những điều tiếp theo trong khóa học, sẽ có 4 khóa học bao gồm cả bài tập lớn. Chúng thực sự đi sâu vào các lĩnh vực khác nhau. Vì vậy, hãy để tôi cho bạn một vài ví dụ nhanh chóng về độ sâu mà chúng ta sẽ tiếp cận xuyên suốt chuỗi khóa học này. Khóa học hồi quy sẽ nói về các mô hình khác nhau cho dự đoán một giá trị thực, ví dụ, giá 1 ngôi nhà từ các đặc điểm của ngôi nhà. Và chúng ta sẽ thảo luận về các kỹ thuật hồi quy tuyến tính, chúng ta sẽ thảo luận về các kỹ thuật tiên tiến như là hồi quy đỉnh sóng và lasso cho phép bạn lựa chọn các đặc điểm thích hợp nhất với vấn đề của bạn. Chúng tôi sẽ nói về các kỹ thuật tối ưu hóa như gradient descent và coordinate descent để tối ưu hóa các tham số của các mô hình này. Cũng như các khái niệm học máy quan trọng như là hàm mất mát, sự cân bằng biến thiên, kiểm chứng chéo. Những thứ mà bạn cần biết để hiểu phương pháp này và cải thiện chúng, phát triển chúng và xây dựng các ứng dụng với chúng. Khóa học thứ 2 về phân loại, chúng ta sẽ xây dựng, ví dụ, use case về phân tích cảm tính mà Emily đã đề cập, và nói nhiều hơn về các kiểu phân loại. Từ bộ phân loại tuyến tính tới những điều tiên tiến hơn như là hồi quy tuyến tính, xin lỗi, hồi quy logistic, máy hỗ trợ vector. Nhưng sau đó thêm hạt nhân và cây quyết định cho phép bạn giải quyết các đặc điểm phức tạp phi tuyến tính. Chúng ta nói về các phương pháp tối ưu kết hợp với các công nghệ này để xây dựng sự thống nhất giữa chúng được gọi là thúc đẩy. Và sau đó các khái niệm nhấn mạnh trong học máy mà thực sự giúp bạn nắm bắt bộ phân loại và quy mô nó lên và áp dụng vào các phương pháp khác nhau. Bây giờ, trong khóa học tiếp theo, chúng tôi sẽ tập trung vào phân nhóm và khôi phục, đặc biệt trong ngữ cảnh tài liệu. Vì vậy chúng ta sẽ nói về các kỹ thuật cơ bản như hàng xóm gần nhất cũng như các kỹ thuật tiên tiến hơn, hỗn hợp Gauss, và thậm chí phân bố Dirichlet ẩn có thể là kỹ thuật phân nhóm tiên tiến. Chúng tôi sẽ nói về các thuật toán là nền tảng cho những điều này và mở rộng chúng như thế nào với các kỹ thuật như cây KD và lấy mẫu và sự tối đa hóa kì vọng. Bây giờ các khái niệm cốt lõi ở đây xung quanh cách mở rộng những việc này như thế nào, đo lường chất lượng như thế nào và làm thế nào để viết chúng như thuật toán phân tán sử dụng kỹ thuật map-reduce, sử dụng xây dựng các hệ thống như Hadoop mà bạn có thể đã học. Vì vậy trong bài học thứ tư, bạn sẽ thực sự viết mã map-reduce cho học máy phân tán. Bây giờ trong khóa học kỹ thuật cuối cùng, chúng ta sẽ tập trung vào các kỹ thuật phân tích ma trận và giảm chiều được ứng dụng rộng rãi, cụ thể với hệ thống tư vấn nói riêng, cho việc tư vấn sản phẩm. Vì vậy, những thứ như lọc cộng tác, phân tích ma trận, PCA, và những kỹ thuật nhấn mạnh cho cho sự tối ưu hóa, như là coordinate descent, sự phân rã ELgen, SVD. Và sau đó, một loạt các khái niệm học máy thực sự hữu ích. Đặc biệt trong lĩnh vực tư vấn. Như là việc chọn lựa một tập các tư vấn phong phú và mở rộng tới những vấn đề lớn như thế nào. Bây giờ bài tập lớn sẽ thực sự thú vị và hướng tới kết thúc khóa học này, tôi sẽ quay trở lại và nói thêm một chút về bài tập lớn. Nhưng cung cấp cho bạn một gợi ý nhỏ, bạn sẽ xây dựng cái gì đó thật hay mà bạn có thể cho tất cả bạn bè, các nhà tuyển dụng tiềm năng xem. Và bạn sẽ thấy rằng nó có thể xây dựng nên ứng dụng vô cùng thông minh về hệ tư vấn thiệu, kết hợp dữ liệu văn bản, dữ liệu hình ảnh, phân tích cảm tính, học sâu, điều này sẽ rất thú vị. [NHẠC]