[NHẠC] Trong bài học này chúng ta đã nói về cách thực hiện quy hồi từng phần. Chúng ta đã nói về cách sử dụng nó để dự đoán giá. Bây giờ chúng ta sẽ xây dựng và dự đoán ghi chú sử dụng python để dự đoán giá nhà cho một tập dữ liệu dựa trên cái được gọi là dữ liệu King County. King County là một đất nước hoặc một vùng có thủ đô là Seattle, nơi Emmy và tôi sống. Vì thế chúng ta sẽ lấy một số dữ liệu, nó là dữ liệu hồ sơ công khai và thực sự xây dựng một ghi chí quy hồi cùng nhau để dự đoán giá nhà. Nào ta bắt đầu OK đây là notebook ipython trống. Và chỉ cần bắt đầu, cái tôi sẽ làm là giáu the, đầu tiên hãy thay đổi tiêu đề, vì thế chúng ta sẽ thay đổi tiêu đề để dự đoán giá nhà. Chúng ta chỉ đặt lại tên nó và tôi muốn xem toàn bộ và giấu tiêu đề, và thanh công cụ, phần này ở phía dưới, chúng ta nó nhiều khoảng trống hơn trên slide. Chúng ta đã hoàn thành việc ẩn. Và điều đầu tiên chúng ta sẽ làm là tạo ra Graphbab Create, công cụ mà chúng ta sẽ sử dụng để chạy các thuật số trong python. Tôi sẽ nhập M và tôi sẽ tạo graphlab create. Vì thế chúng ta ta làm điều đó bằng việc nhập graphlab. Và đó chỉ là bắt đầu graphlab create. Nhiệm vụ của chúng ta bây giờ là dự đoán giá nhà. Điều đầu tiên mà chúng ta sẽ làm là tải một số dữ liệu bán nhà. Điều này là dữ liệu công khai, hồ sơ công khai của ngôi nhà được bán ở vùng Settle. Tôi sẽ lấy dữ liệu bảng này, và tôi sẽ giả sử graphlab.sFrame. Nhớ rằng chúng ta đã nói về SFrame như một cấu trúc dữ liệu cho việc đại diện dữ liệu bảng trong graphlab create đúng không? Nó thực sự là một giờ nhanh chóng của cấu trúc dữ liệu và chúng ta sẽ tải một số thứ vào đó. Điều này sẽ được gọi là dữ liệu nhà, và lưu ý rằng dữ liệu là đầy đủ cho bạn. VÌ thế nếu tôi chỉ nhập trong khi điều này đang tải lên và nó tạo graphlab create, nếu tôi chỉ nhập các loại bán hàng ở đây, bạn sẽ thấy dữ liệu đó như thế nào. Tôi sẽ di chuyển lên một chút, tôi chỉ nhập các loại bán hàng, có một ID cho một dữ liệu với giá bán, số lượng các phòng ngủ, số lượng các phòng tắm, feet vuông, giống như phiên bản Mỹ của mét vuông nếu bạn đang sống trong các quốc gia khác cho ngôi nhà, feet cho nhiều đất, số lượng tầng. Ngôi nhà có tầm nhìn hay không có nghĩa là nó ở trên một ngọn đồi và một loạt các phép đo khác. Chúng ta đã tải dữ liệu nhà và nó trông khá hay. Điều đầu tiên mà chúng ta sẽ làm sử dụng graph lab canvas và làm một chút hiện thị. Cái mà tôi sẽ làm là một lần nữa tạo ra các tế bào. Và điều này khám phá dữ liệu cho ngôi nhà. Các doanh số bán hàng. Vì thế chúng ta sẽ làm một số thăm dò dữ liệu. Chúng ta sẽ lấy dữ liệu bán hàng và tôi sẽ chỉ ra, khi tôi nhập .show, nó sẽ hiển thị dư liệu đó, cụ thể cái mà tôi sẽ làm là tầm nhìn, hơn là để graphlab làm điều này, chúng ta sẽ làm một biểu đồ phân tán, chúng ta sẽ xem biểu đồ phân tán là gì trong một giây. Chúng ta sẽ chỉ nhập biểu đồ phân tán mới liên quan đến hai biến. Trên trục X, chúng ta sẽ có feet vuông không gian sống. Và trên trục y chúng ta sẽ đặt giá. Điều đó sẽ hiển thị cho chúng ta, trong mối quan hệ với diện tích feet vuông và giá. Bây giờ một mẹo nhỏ tôi muốn làm khi tôi tạo ra ghi chú đôi khi bạn đẩy ra graph lab canvas nhưng nó cũng thú vị với biểu đồ phân bán và các biểu đồ đơn giản bên trong ghi chú, vì thế nó có thể xuất và đưa nó ra cho ai đó. Cách để làm điều này là tôi chỉ có thể dùng graph lab canvas để tạo mục tiêu của nó, không phải là một trình duyệt trong mục tiêu mặc định, mà là một notebook ipython. Tôi chỉ cần nhập canvas.set_target('ipynb'), notebook ipython và nó sẽ phân tán trên ghi chú. Nếu tôi ấn enter ở đây, cái sẽ làm là lấy hai trục này và chỉ cần vẽ chúng cùng nhau. Chúng ta bắt đầu nhé. Trên trục X là feet vuông của ngôi nhà, trục Y là giá. Hãy nói về trình duyệt này một chút. Ví dụ càng nhiều feet vuông ngôi nhà càng lớn, vì thế nếu tôi di chuột qua đây bạn sẽ thấy rằng ngôi nhà lớn có 5,990 feet vuông, nó khá lớn, nó khoảng 600 met, và nó được bán với giá 2,2 triệu đô. Bạn cũng lưu ý có một mối quan hệ chặt chẽ rằng nhà càng lớn thì giá càng cao. Có một nhóm những ngôi nhà ở đây, vì thế hầu hết ngôi nhà ở khoảng 1,000 tới 3,000 feet vuông. Thậm chí ở mức độ này, nhìn ngôi nhà ở trên đây, nó ở ngoài phạm vi. Mặc dù nó chủ có 1,910 feet vuông, nó được bán với giá 1.5 triệu đô. Vâng, dưới đây có một ngôi nhà tương tự với 1,7000 feet vuông, được bán 149,000 đô. Đó là sự khác biệt lớn. Đây là điểm khác biệt lớn nhất của tập dữ liệu. Ngôi nhà này có 3,730 feet vuông và được bán với 2,5 triệu đô. [NHẠC]