[NHẠC] Với mỗi mô hình để bạn có thể cân nhắc, ví dụ một mô hình tuyến tính hoặc chúng ta cũng đã nói về việc sử dụng mô hình bậc hai, tất cả các cách đưa ra đa thức thứ 13. Và tất nhiên chúng ta có thể xem xét thậm chí cao hơn các mô hình đã cho. Điều gì xảy ra để kiểm tra lỗi? Xin lỗi, tôi không có ý kiểm làm ra lỗi. Hãy bắt đầu với việc huấn luyện lỗi. Dễ hơn bạn nghĩ rất nhiều. Lỗi huấn luyện. Khi bạn tăng cấp bậc mô hình, các mô hình có thể phù hợp với sự quan sát trong tập dữ liệu huấn luyện. Cái mà chúng ta sẽ có là chúng ta sẽ làm lỗi huấn luyện của chúng ta giảm bằng việc tăng cấp bậc mô hình. Hãy nhớ các đường mà chúng ta đã có. Chúng ta đã có tổng bình phương phần dư liên quan đến tuyến tính, hàm bậc hai, đa thức thứ 13 mà ấn mỗi một sự quan sát. Ví thế chúng ta thấy rằng tổng bình phương phần dư sẽ đi xuống và xuống và xuống. Điều đó là đúng thậm chí chúng ta nắm sự quan sát và chỉ nhìn vào tập dữ liệu huấn luyện của chúng ta. Vì thế chúng ta sẽ có lỗi huấn luyện giảm và giảm khi chúng ta tăng sự linh hoạt của mô hình. Nhưng hãy chỉ chú thích điều này là lỗi huấn luyện của chúng ta, đặc biệt với mô hình được các thông số w mũ mô hình được ước tính của chúng ta. Hãy làm rõ w mũ. Với mỗi mô hình phức tạp như mô hình tuyến tính, mô hình bậc hai và vân vân. Cái chúng ta sẽ làm là chúng ta sẽ tối ưu hóa và tìm các thông số w mũ cho mô hình tuyến tính. Chúng ta đang tìm kiếm tất cả các khả năng tối giản hóa các dòng lỗi huấn luyện. Nhớ rằng cái chúng ta đã nói, hai slide trước chúng ta đã nói rằng cách chúng ta ước tính mô hình của chúng ta là chúng ta sẽ tối giản hóa không khí trên sự quan sát đó trong tập dữ liệu huấn luyện của chúng ta. Đó là cách chúng ta có w mũ cho mô hình tuyến tính, và chúng ta tính tóa lỗi huấn luyện liên quan đến w mũ. Sau đó chúng ta nhìn vào tất cả các khả năng hàm bậc hai. Tôi giản lỗi huấn luyện trên tất cả các hàm bậc hai, đó là cách chúng ta có w mũ cho mô hình bậc hai. Sau đó chúng ta vẽ lỗi huấn luyện liên quan đến w mũ cho mô hình hàm bậc hai và vân vân. Vâng chúng ta cũng nói về lỗi kiểm tra nhưng ở đây nó có một chút phức tạp bởi vì cái chúng ta nghĩ sẽ xảy ra khi chúng ta tăng bậc mô hình. Cái chúng ta thấy, nếu bạn còn nhớ đa thức thứ 13, nó hình sóng, nó thực sự, thực sự, thực sự có dự đoán tệ. Khi chúng ta nghĩ về việc nắm dữ liệu thử nghiệm, đa thức thứ 13 chỉ trên dữ liệu huấn luyện, chúng ta sẽ có một số thứ tồi tệ. Sau đó khi chúng ta nhìn vào sự quan sát thử nghiệm, những ngôi nhà chúng ta có, chúng ta có thể sẽ có rất ít sự dự đoán về giá trị thực của chúng. Cái chúng ta mong muốn là ở tại một vài điểm, lỗi kiểm tra có thể tăng. Các đường cong cho lỗi kiểm tra có xu hướng giống như sau đây nơi mà có thể lỗi sẽ đi xuống trong một khoảng thời gian nhưng sau đó ở một điểm lỗi đó bắt đầu tăng trở lại. Đường cong này là lỗi kiểm tra của chúng ta với các mô hình này, các mô hình phù hợp sử dụng dữ liệu huấn luyện. Những điều này là cái mà các đường cong có xu hướng giống như lỗi huấn luyện và lỗi thử nghiệm như một chức năng của mô hình phức tạp, cách chúng ta nghĩ về việc sử dụng các ý tưởng này để lụa chọn mô hình hoặc sự phức tạp của mô hình là chúng ta sẽ sử dụng cho việc tạp ra sự dự đoán. Chúng ta sẽ thảo luận chi tiết hơn trong quy hồi và khóa học phân loại. [NHẠC]