[NHẠC] Như Emily vừa trao đổi, chúng ta sẽ xem học máy qua lăng kính
một phạm vi rộng các tình huống nghiên cứu trong các lĩnh vực khác nhau với
các khái niệm đằng sau chúng. Vì vậy các lớp học máy khác bạn có thể đưa ra đang thực sự cung cấp một danh sách dài
các thuật toán và các phương pháp. Những thứ như máy hỗ trợ vector và hạt nhân, thành phần logistic, mạng lưới, vân vân. Và các khóa học đó chỉ như một
danh sách dài các phương pháp. Vấn đề với cách tiếp cận là
khi bạn bắt đầu từ các thuật toán
bạn kết thúc bằng các use case đơn giản với các ứng dụng, chúng thực sự không liên quan đến thực tế. Vì thế, chúng tôi đang làm rất khác
trong chuỗi khóa học này, và chúng tôi đã làm cách này cho đến tận bây giờ. Emily và tôi đã tạo ra một khóa học
ở trường Đại học Washington về học máy ở quy mô dữ liệu lớn. Chúng tôi đi tiên phong bằng cách
tiếp cận use case trong giảng dạy học máy. Và trong khóa học đó,
chúng tôi đã thấy nhiều phản hồi tích cực từ những người thực sự hiểu các khái niệm. Vì vậy chúng tôi sẽ bắt đầu từ
các use case trong khóa học đầu tiên. Và bắt đầu từ các use case, bạn sẽ có thể
nắm bắt được các khái niệm mấu chốt và các kỹ thuật cho phép bạn
xây dựng, đo lường chất lượng và hiểu liệu những ứng dụng thông minh
của bạn đang hoạt động tốt hay không. Và cuối cùng, bạn sẽ tạo ra một loạt
các ứng dụng thông minh này. Để xây dựng các ứng dụng thông minh này, bạn phải nghĩ về những việc gì tôi sẽ làm, tôi sẽ giải quyết vấn đề phân tích
cảm tính và các mô hình gì, các mô hình học máy nào tôi sẽ sử dụng,
và những thứ như các máy vector hỗ trợ hoặc sự hồi quy, các phương pháp khi họ sử dụng
để tối ưu hóa tham số của các mô hình là gì? Sau đó tôi hỏi một câu hỏi như là 
điều này có thực sự cung cấp cho bộ thông minh mà tôi đang mong đợi không? Chúng tôi đo chất lượng của hệ thống đó như thế nào? Trong chuỗi khóa học này, những gì
chúng tôi sẽ làm là trì hoãn các mảnh cốt lõi của cách mô tả một mô hình
và tối ưu hóa nó ở trong các khóa học này. Và khóa học đầu tiên này sẽ tập trung
vào việc giúp chúng ta hình dung những việc gì chúng ta đang cố giải quyết,
 các phương pháp học máy có ý nghĩa gì, và đo lường chúng như thế nào. Và với điều đó, sử dụng thuật toán
như hộp đen, chúng ta sẽ có thể xây dựng một loạt các ứng dụng
thực sự thông mình cùng nhau. Và chúng tôi sẽ lập trình chúng và xây dựng chúng và minh họa chúng
trong một loạt các cách khác nhau. Những điều tiếp theo trong khóa học, sẽ có 4 khóa học bao gồm cả bài tập lớn. Chúng thực sự đi sâu vào
các lĩnh vực khác nhau. Vì vậy, hãy để tôi cho bạn một vài ví dụ
nhanh chóng về độ sâu mà chúng ta sẽ tiếp cận xuyên suốt chuỗi khóa học này. Khóa học hồi quy sẽ nói về
các mô hình khác nhau cho dự đoán một giá trị thực, ví dụ, giá 1 ngôi nhà
từ các đặc điểm của ngôi nhà. Và chúng ta sẽ thảo luận về
các kỹ thuật hồi quy tuyến tính, chúng ta sẽ thảo luận về các kỹ thuật tiên tiến
như là hồi quy đỉnh sóng và lasso cho phép bạn lựa chọn các đặc điểm
thích hợp nhất với vấn đề của bạn. Chúng tôi sẽ nói về các kỹ thuật
tối ưu hóa như gradient descent và coordinate descent để tối ưu hóa
các tham số của các mô hình này. Cũng như các khái niệm học máy
quan trọng như là hàm mất mát, sự cân bằng biến thiên, kiểm chứng chéo. Những thứ mà bạn cần biết để hiểu
phương pháp này và cải thiện chúng, phát triển chúng và xây dựng các ứng dụng với chúng. Khóa học thứ 2 về phân loại,
chúng ta sẽ xây dựng, ví dụ, use case về phân tích cảm tính
mà Emily đã đề cập, và nói nhiều hơn về các kiểu phân loại. Từ bộ phân loại tuyến tính tới những điều
tiên tiến hơn như là hồi quy tuyến tính, xin lỗi, hồi quy logistic,
máy hỗ trợ vector. Nhưng sau đó thêm hạt nhân và cây quyết định cho phép bạn giải quyết
các đặc điểm phức tạp phi tuyến tính. Chúng ta nói về các phương pháp
tối ưu kết hợp với các công nghệ này để xây dựng sự thống nhất giữa chúng
được gọi là thúc đẩy. Và sau đó các khái niệm nhấn mạnh
trong học máy mà thực sự giúp bạn nắm bắt bộ phân loại và quy mô nó lên và
áp dụng vào các phương pháp khác nhau. Bây giờ, trong khóa học tiếp theo,
chúng tôi sẽ tập trung vào phân nhóm và khôi phục, đặc biệt trong ngữ cảnh tài liệu. Vì vậy chúng ta sẽ nói về các kỹ thuật cơ bản
như hàng xóm gần nhất cũng như các kỹ thuật tiên tiến hơn,
hỗn hợp Gauss, và thậm chí phân bố Dirichlet ẩn có thể là
kỹ thuật phân nhóm tiên tiến. Chúng tôi sẽ nói về các thuật toán
là nền tảng cho những điều này và mở rộng chúng như thế nào
với các kỹ thuật như cây KD và lấy mẫu và sự tối đa hóa kì vọng. Bây giờ các khái niệm cốt lõi ở đây xung quanh
cách mở rộng những việc này như thế nào, đo lường chất lượng như thế nào
và làm thế nào để viết chúng như thuật toán phân tán
sử dụng kỹ thuật map-reduce, sử dụng xây dựng các hệ thống như
 Hadoop mà bạn có thể đã học. Vì vậy trong bài học thứ tư,
bạn sẽ thực sự viết mã map-reduce cho học máy phân tán. Bây giờ trong khóa học kỹ thuật cuối cùng,
chúng ta sẽ tập trung vào các kỹ thuật phân tích ma trận và giảm chiều
được ứng dụng rộng rãi, cụ thể với hệ thống tư vấn nói riêng,
cho việc tư vấn sản phẩm. Vì vậy, những thứ như lọc cộng tác, phân tích ma trận, PCA, và
những kỹ thuật nhấn mạnh cho cho sự tối ưu hóa, như là coordinate descent,
sự phân rã ELgen, SVD. Và sau đó, một loạt các khái niệm
học máy thực sự hữu ích. Đặc biệt trong lĩnh vực tư vấn. Như là việc chọn lựa một tập các tư vấn phong phú và mở rộng tới những vấn đề lớn như thế nào. Bây giờ bài tập lớn sẽ thực sự
thú vị và hướng tới kết thúc khóa học này, tôi sẽ quay trở lại và
nói thêm một chút về bài tập lớn. Nhưng cung cấp cho bạn
một gợi ý nhỏ, bạn sẽ xây dựng cái gì đó thật hay mà bạn có thể cho tất cả
bạn bè, các nhà tuyển dụng tiềm năng xem. Và bạn sẽ thấy rằng nó có thể xây dựng nên ứng dụng vô cùng thông minh về
hệ tư vấn thiệu, kết hợp dữ liệu văn bản, dữ liệu hình ảnh, phân tích cảm tính,
học sâu, điều này sẽ rất thú vị. [NHẠC]