[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 让我们先看这个例子 我们现在看第二幢房子 我现在要来预测 第二个更加好的房屋价格 先看一下 我们把它叫做房屋2 所以说是来自销售数据 (sales) 的房屋2 我们在这里会用到过滤条件 这栋房子 它的ID是 1925069082 让我们先看看房屋2具体什么情况吧 房屋2 在2015年被卖出 售价是220万 一共五个卧室 4.25个卫生间 很多个卫生间 4640平方尺居住面积 比之前那一栋大了好多 大概是460平方米 真的是个大房子 再看一下图片 我下载了这个房子的图片 这是我图片的备注 我将要插入这个图片 输入代码 我要输入 imgage 它的来源是 这是直接下载到默认路径中的 这张图叫做 house-1925069082.jpg 噢不是jpg 而是jpeg格式 这样代码就应该能运行了 记住之前房子的售价是 62万 这一次的是220万 看一下这个图 这房子挺漂亮啊 看起来酷酷的 还有一个大院子 还有一点 在河边上噢 河景房! 也难怪要卖2百多万 比上一个房子漂亮 漂亮好多 让我们看看我们的模型对于这个房子预测的价格是多少 它实际卖了220万 让我们打印出sqft_model的结果吧 像之前一样 我们用 sqft_model.predict来打印结果 我们模型给出的售价仅仅只有125万 这个模型不是很好 看看那个有着更多特征的高级模型 输入 my_features model.predict 在我打回车之前 我们来猜猜看结果怎么样吧 之前的房子 我们两个不同的模型 并没有很大的差距 虽然一个有着很多特征 一个只有一个特征 那是一个西雅图很普通的房子 很标准的房间数 标准的卫生间数 非常的普通 标准 所以你会觉得 两个模型会有着差不多的结果 这个房子却不一样 这个房子的特征很难单纯用房屋面积去捕捉 这是河景房 有很多卫生间和卧室 所以我们猜测 有着更多特征的高级模型能更好的预测售价 我拼错了 (代码写错了) 应该是 my_features_model.predict (教授少打了个model) 抱歉 实在是不好意思 如果我们运行这段代码 我们会得到预测的售价是138万 稍微接近了一点真实售价 记住的是 虽然误差还是很大 至少 离真实售价 更近了一步 所以说 高级的模型在这栋房子的预测上面更加好 总结一下 我们来预测一个更加好的房屋 来看第三栋房屋 最后一栋房子是个豪宅 事实上 我们要来预测比尔盖茨的房子 比尔盖茨住在西雅图 让我们来试着预测他房子的售价 这个房子有着不同的特点 与其一个一个输入 我还不如直接复制黏贴 所以我要在这里黏贴了 这就是比尔盖茨的房子 也在这个数据里 8个卧室 25个卫生间 显然 比尔盖茨真的很需要去卫生间 25个卫生间 至少他网上是这么说的 50000平方公尺 大概是5000平米 豪宅 四层楼 有很多东西 看看这房子到底长啥样吧 事实上我们并不知道这个房子值多少钱 因为它没有被卖过 我猜比尔盖茨应该不需要这笔钱 (哈哈) 让我们先看看 它的庐山真面目吧 我有一个备注 里面有着这个房子图片的链接 这就是比尔盖茨房子的照片 我们去到这里 额 抱歉 我忘记了 需要告诉python这边有一个 好了 让我们看看预测的售价吧 继续 用print my_features_model打印出售价 比尔盖茨房子的售价 这是Graphlab 创建的模型 所以只能用SFrame作为输入 所以我需要用到 用来描述比尔盖茨房子的 字典 先把字典转换成SFrame 我输入graphlab.SFrame(bill_gates) bill_gates是一个字典 我们之前定义过了 这样就转换成SFrame了 然后执行 它预测的售价是1300万 这些都不一定 不过听起来还挺合理 但是很可能这个房子会超过1300万 谁知道呢? 这些是不是很有趣 我们建立了两个模型 用了数据 我们深入探索数据 并且使用 然后应用于预测房屋售价 我们甚至发现 比尔盖茨的房子的价格也能大概估测 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community