[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 到现在我们做了一个简单的散点图 我们对数据有了大体的印象 那么问题是 我们能不能用散点图来通过房屋面积预测价格 所以我们来建立一个简单的回归模型 让我们做一下 我们点击SM 然后我们写道 #建立一个 房屋面积与价格的简单回归模型 好 让我们来实现 从这一课你们就要记住 在你们对 数据做任何处理之前 都要先把它分为训练集和测试集 因为你从来不会 把训练和学习的处理 放在测试数据上 你只会把这些用在训练集中的数据 让我们来做分离的工作 我准备把我的数据 分为训练集和测试集 通过调用一个函数 我们把它称为随机分布函数 Sales.random_split 顺便 我刚刚使用了tab来自动补全 让我教你们一个小技巧 就几秒 当我写到 sale.r 然后敲一下tab键 你会看到有很多能完成的命令 random_split, read_csv, remove_columns rename_columns 还有很多 于是我选择random_split 接下来我要做的是a.8.split .8意味着数据中的80%将作为训练集 20%将作为测试集 最后一件你会在作业或整个课程中用到的 就是确保你总是得到同样的结果 你需要为分布函数设一个随机种子 因为随机分布 并不是真正意义上的随机数产生器 而是伪随机数产生器 我们需要给它一个种子 我们可以把这个种子设为任一个数 例如 我把它设为2015 它还可以是其它任何数 我可以将它设为0 现在每次做随机分布 它会用同样的方式分离数据 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community