[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 现在我们有了训练集和测试集 我们接下来做的是 #Build 我们在这里添加一个子标题 建立回归模型 GraphLab Create有许多已经编写的算法 供不同的机器和任务使用 你也可以自己编写 在我们专项课程期间 你会自己写许多算法 但这次课 我们只是用内置的算法 这样的话你就能真正试着去理解 机器学习是怎么进行的 所以你怎么来实现机器学习呢? 我们准备建立一个平方英尺的预测模型 把它命名为sqft_model 在GraphLab中 有个称为线性回归的函数 线性回归是我们已经学习、探索 并且讨论过的东西 我们在Ann讲授的模块中对它有了充分的了解 既然这样 如果你只敲下 linear_regression.create 它就会为你创建一个线性回归模型 然后它使用GraphLab Create项目建立了图形 create同样也是用GraphLab Create来 创造各种各样形状的关键词 我们现在准备建立创建一个线性回归模型 我需要给它一个输入 我将训练集作为输入 这是我们的训练集 你还需要说明你想预测哪个变量 这称为目标 我准备将目标设为价格 这就是说 我要预测价格 那么问题是 输入与特征有什么不同 我想说明的是 顺便提一下 即使你在 敲函数的参数时也是可以使用便捷的自动补全功能 话说回来 特征是一系列特征 如果你不给函数输入的话 它会使用所有的特征 全部的数据 但现在 我们想使用的输入特征只是 居住面积 我需要在里面放个字符串 我忘记把它放在引号里了 让我来快速改正一下 前引号 后引号 好了 让我们再快速浏览一下 soft_model = graphlab.linear_regression.create 用了训练集中的数据 预测目标是价格 使用居住面积作为特征 让我们来执行一下 在训练集这里出问题了 我写了两次data 你可以看到错误发生在这里 训练集 现在让我们执行一下 现在发生了什么? 它实际上执行了 我们做的是创建一个线性回归模型 它使用了一种特定的算法——牛顿迭代法 GraphLab Create会自动为你选择算法 除非你告诉它使用哪一个 这个算法允许你对数据做一些预测 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community