[NHẠC] Được rồi. Thay vì phân tích cái chúng ta đã làm, chúng ta có thể nghĩ đến lập mô hình mối quan hệ giữa diện tích nhà và giá bán nhà. Để làm điều này chúng ta sẽ sử dụng quy hồi tuyến tính. OK để tận dụng tất cả các sự quan sát mà chungst a thu thập, cái chúng ta muốn làm là có thể hiểu mối quan hệ giữa diện tích nhà và giá bán căn nhà. Mô hình đơn giản nhất chúng ta có thể sử dụng cho điều này là tạo đường qua dữ liệu. Đây là ví dụ về đường với dữ liệu này. Đường này được xác định bởi đường chắn w0 và mặt phẳng dốc w1. Thông thường chúng ta sẽ nói về w1 là hiệu suất trên tính năng X hoặc hệ số quy hồi. Hiệu suất có sự giải thích là khi chúng ta thay đổi X, diện tích nhà, Có bao nhiêu tác động thay đổi trong giá nhà đã được quan sát? Hai thứ, đoạn chắn và mặt phẳng dốc là các thông số mô hình của chúng ta. Ở đây rất phức tạp, chúng ta sẽ viết chức năng này, chức ăng tuyến tính ở đây với chỉ số dưới W, chỉ ra răng chức năng này được chỉ định bởi các thông số. W là tập của w0 và w1. Đây là đường chúng ta tạo qua dữ liệu. Nhưng câu hỏi là đường nào là đúng hoặc tốt để sử dụng cho tập dữu liệu cho trước. Có thể chúng ta có thể vẽ đường này thay thế. Mỗi một cái được đưa ra bởi các thông số w khác nhau. Và câu hỏi là chúng ta muốn chọn mô hình nào? Ok để nghĩ về điều này hãy nói về việc xác định chi phí cho đường đã cho. Một chi phí phổ biến liên quan đến dữ liệu cụ thể được gọi là tổng bình phương phần dư góc vuông. Chúng ta lấy đường phù hợp và chúng ta nhìn vào mỗi sự quan sát. Chúng ta nhìn vào sự quan sát từ cái mà mô hình sẽ dự đoán. Đó chỉ là điểm trên đường. Chúng ta nhìn vào các khoảng cách ở đây và chúng ta nhìn vào các khoảng cách. Đó là lí do nó được gọi là dư. Phần dư là sự khác biệt của dự đoán và sự quan sát thực. Chúng ta sẽ nhìn vào ô vuông và chúng ta sẽ tổng hợp chúng. Ok đây là phương trình, ở đây rõ ràng hơn, nơi mà chúng ta có giá cả, đây là giá bán nhà đã được quan sát cho ngôi nhà đầu tiên. Thuật ngữ này ở đây là gì? Nếu đó là cái tôi gọi là nhà một đô, thì điểm này ở đây, nếu đó là diện tích của nhà. Thì x này tôi vẽ ở đây thể hiện chính xác thuật ngữ này ở đây. Đây là giá trị, điểm trên đường. Đô la này kí hiệu trừ là sự khác biệt giữa giá nhà với mô hình của chúng ta. Đường này dự đoán diện tích nhà cho trước. Chúng ta bình phương cái đó và chúng ta tính tổng các ngôi nhà khác nhau trong bộ dữ liệu của chúng ta. Ok chungsta nghĩ đến việc cố gắng tìm đường tốt nhất theo số liệu này mà tôi đã xác định ở đây, tổng bình phương phần dư hình vuông, cái mà chúng ta làm là chúng ta tìm kiếm trên tất cả w0 và w1. Tất cả các đường có thể, và chúng ta lựa chọn cái mà tổi giản tổng bình phương phần dư hình vuông. Chúng ta sẽ biểu thị kết quả w là w mũ. Nhớ rằng đó sẽ là bộ w mũ 0 và w mũ 1. Hệ số chặn của chúng ta và mặt phẳng dốc. Được rồi. Tồn tại các thuật toán hiệu quả cho việc tính toán w mũ này, nó tìm kiếm trên tất cả ws có thể. Chúng ta có thể nhìn vào các thông số của mô hình này. Nhưng chúng ta sẽ thảo luận các thuật toán nhiều hơn trong khóa học quy hồi. Bây giờ hãy nói về cách lấy mô hình thông số đã ước tính và sử dụng chúng để dự đoán giá trị của ngôi nhà. Tôi đã làm, xin lỗi ngôi sao này không nên ở đây. Đó nên là một mũ, phải rõ ràng. Và tôi đã vẽ đường liên quan đến w0 mũ và w1 mũ. Đây là nhà của tôi. Đó là foot vuông. Và dự đoán tốt nhất giá nhà là cái mà đường dự đoán. Tôi tính giá trị foot vuông của ngôi nhà. Đó là w0 mũ cộng w1 mũ lần foot vuông. của ngôi nhà của tôi, rất, rất đơn giản. [NHẠC]