[NHẠC] Cách chúng ta sẽ học về dữ liệu đưa vào mô hình thông minh là xem xét một số các tình huống nghiên cứu dựa trên các phương pháp mà chúng tôi đưa vào trong các ứng dụng thực tế. Và đó là một trong những đặc điểm thực sự độc đáo của khóa học này. Trong tình huống nghiên cứu đầu tiên, chúng ta sẽ xem về dự đoán giá trị nhà. Bộ thông minh mà chúng ta dùng ở đây chính là giá trị gắn liền với một số ngôi nhà không phải trên thị trường. Vì vậy, chúng ta không biết cái giá trị đó là gì và chúng ta muốn học điều này từ dữ liệu. Và dữ liệu của chúng ta là gì? Trong tình huống này, chúng ta sẽ xem những ngôi nhà khác và nhìn vào giá bán nhà của họ để biết giá trị của ngôi nhà chúng ta quan tâm. Và bên cạnh giá bán, chúng ta sẽ xem những đặc điểm khác của ngôi nhà. Như là số phòng ngủ trong nhà, số lượng phòng tắm, số diện tích, vân vân. Và chúng ta sẽ làm là, phương pháp học máy ở đây là liên hệ các đặc tính của ngôi nhà với giá bán. Nếu chúng ta có thể học hỏi được mô hình này, mối quan hệ giữa các đặc điểm ngôi nhà với giá bán quan sát được, thì chúng ta có thể áp dụng để dự đoán giá cho ngôi nhà mới. Chúng ta lấy chính đặc điểm của ngôi nhà và dự đoán giá bán của nó. Và phương pháp này được gọi là hồi quy. Trong tình huống nghiên cứu thứ hai, chúng ta sẽ khám phá cách phân tích cảm tính khi chúng ta có các phản hồi về một số nhà hàng. Ví dụ trong trường hợp này, nói rằng sushi rất tuyệt, thức ăn rất ngon, nhưng dịch vụ thì khủng khiếp. Và chúng ta muốn sử dụng ý kiến này để phân loại liệu rằng nó có phải là ý kiến tích cực không. Đó là một ý kiến tốt, ngón tay cái đưa lên hay một ý kiến tiêu cực, ngón tay cái hướng xuống. Vậy chúng ta sẽ làm như thế nào? Chúng ta sẽ nhìn vào rất nhiều ý kiến. Vì thế chúng ta sẽ xem xét cả nội dung và đánh giá của các ý kiến. Để hiểu mối quan hệ ở đây là gì, cho sự phân loại cảm tính này. Ví dụ trong trường hợp này, có lẽ chúng tôi có thể phân tích nội dung theo số lần sử dụng từ tuyệt vời so với số lần sử dụng từ khủng khiếp. Và từ những ý kiến khác nhau mà chúng ta có, chúng ta sẽ tìm hiểu ranh giới quyết định dựa trên tỉ lệ sử dụng các từ này để biết ý kiến là tích cực hay là ý kiến tiêu cực. Và cách chúng ta học từ những ý kiến khác là dựa trên những đánh giá kết hợp với nội dung ý kiến. Và vì vậy phương pháp này được gọi là phương pháp phân loại. Trong tình huống nghiên cứu thứ ba, chúng ta sẽ làm về thu thập tài liệu, cái mà chúng ta muốn làm, bộ thông minh chúng ta đưa ra là một bài viết hoặc một cuốn sách hoặc thứ gì đó mà thu hút người đọc. Và dữ liệu chúng ta có là một số lượng lớn những bài viết mà chúng ta có thể giới thiệu. Và chúng ta sẽ làm gì, trong trường hợp này là chúng ta sẽ thử và tìm kiếm cấu trúc trong dữ liệu này dựa trên những nhóm bài viết liên quan. Như là, có thể là các bài viết về thể thao và tin tức thế giới và giải trí và khoa học. Nếu chúng ta tìm thấy cấu trúc này và chú thích các văn bản, các tập tài liệu với những loại nhãn mà chúng ta không có từ trước, chúng ta sẽ cố gắng lấy ra từ dữ liệu. Sau đó chúng ta có thể sử dụng điều này cho việc thu thập tài liệu nhanh chóng bởi vì nếu tôi đang ngồi đọc vài bài báo về tin tức thế giới, sau đó có thể nếu tôi muốn thu thập bài viết khác, thì tôi đã biết loại bài để tìm kiếm. Và loại tiếp cận này được gọi là phân cụm. Trong tình huống nghiên cứu thứ tư, chúng ta sẽ làm về một kiểu thực sự thú vị được gọi là sàng lọc hợp tác có rất nhiều ảnh hưởng ở nhiều mảng trong thập kỉ qua. Đặc biệt, chúng ta sẽ nhìn vào cách tư vấn sản phẩm, nơi mà bạn từng mua hàng và cố gắng sử dụng điều này để tư vấn các bộ sản phẩm khác bạn có thể muốn mua. Vì thế trong trường hợp này, dữ liệu mà chúng ta sẽ sử dụng để suy diễn thông minh cho việc tư vấn sản phẩm là chúng ta muốn hiểu mối quan hệ giữa những gì bạn đã mua trước đây và những gì bạn có thể mua trong tương lai. Và để làm điều này, chúng ta sẽ sử dụng lịch sử mua hàng của người dùng. Và có thể, các đặc điểm của người sử dụng. Nhưng ý tưởng then chốt ở đây là chúng ta sẽ lấy dữ liệu này và chúng ta sẽ sắp xếp nó với khách hàng bằng ma trận sản phẩm, trong đó những hình vuông chỉ ra những sản phẩm khách hàng thực sự đã mua Vì vậy đây là những sản phẩm mà khách hàng thích. Và từ ma trận này, chúng ta sẽ học biết các đặc điểm về người sử dụng và các đặc điểm về sản phẩm. Và khi mà chúng ta học về những đặc trưng của người dùng và sản phẩm từ dữ liệu tôi đã mô tả, Chúng ta có thể nghĩ về việc sử dụng những đặc điểm này để xem có bao nhiêu sự đồng ý giữa những gì người dùng thích, các thuộc tính khác nhau mà người dùng thích và liệu sản phẩm thực sự có những đặc tính này. Vì thế trong ví dụ tôi đưa ra ở đây, người dùng có thể là 1 người mẹ, có những đặc điểm giống với những người dùng khác cũng là mẹ. Và từ đó, chúng ta có thể suy ra nhiều thứ về sản phẩm. Những thuộc tính về cái gì? Ví dụ, sản phẩm cho trẻ em rất thu hút các bà mẹ. Và chúng ta đang sử dụng thông tin đó để xây dựng các tư vấn. Và cách tiếp cận từ ma trận này, ma trận sản phẩm khách hàng, đưa ra những đặc điểm đã học về người dùng và sản phẩm được gọi là phép phân rã ma trận. Okay, trong tình huống nghiên cứu cuối cùng, chúng ta sẽ xem xét một hệ thống tư vấn sản phẩm hình ảnh. Ở đây, dữ liệu của chúng ta là 1 người nào đó vào trang web và họ nhập đầu vào, không phải chữ mà là hình ảnh. Họ sẽ đưa vào 1 hình ảnh như là chiếc giày đen hoặc chiếc bốt đen hoặc giày cao gót, hoặc giày chạy. Và cái họ muốn là một tập các kết quả về giầy có thể phù hợp với sở thích của họ. Vì vậy, đôi giày về trực quan giống như bức hình họ có. Và họ muốn có thể tìm kiếm giữa nhiều đôi giầy để mua được món đồ này. Và cái cách chúng tôi sẽ làm, có thể đi từ hình ảnh tới tập các hình ảnh liên quan là chúng ta cần phải có các tính năng tốt về hình ảnh đó để tìm ra các hình ảnh khác tương tự như thế. Và cách chúng ta lấy các tính năng thật chi tiết được gọi là học sâu. Cụ thể chúng ta sẽ nhìn vào các mạng nơ ron nơi mỗi lớp mạng nơ ron cung cấp nhiều các tính năng hơn. Trong ví dụ nhỏ chung ta thấy ở đây, lớp đầu tiên chỉ có thể phát hiện trong hình ảnh như là các cạnh khác nhau. Trong khi đó lớp thứ hai chúng ta bắt đầu phát hiện các góc và nhiều tính năng thú vị hơn như thế này. Khi bạn tìm hiểu càng sâu các lớp, bạn càng có được các tính năng phức tạp. Như bạn thấy chúng ta sẽ đi qua một chuỗi các trường hợp nghiên cứu thế giới thực, các vấn đề thế giới thực và cách giải quyết sử dụng học máy. Và qua đó chúng ta sẽ khám phá một chuỗi các phương pháp và lấy nhiều năng lượng. Và sẽ cho phép bạn có thể phát triển và triển khai các kỹ thuật học máy mới trên các vấn đề mới không phải các trường hợp nghiên cứu chúng ta đã từng làm. Nhưng các trường hợp nghiên cứu sẽ cho phép chúng ta tạo dựng các phương pháp mà chúng ta đang mô tả bằng những thứ có thể giải thích được. [NHẠC]