[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 首先让我们一起看一下机器学习模型。 这里谈到的是多重回归分析模型 我们首先回顾一下上一章里学习的模型,也就是学到的 关于简单线性回归的概念:只是根据数据拟合一条曲线 我们只用了一个特征输入到模型里 在我们的例子里,我们用到的是面积以及 我们想要建立房屋面积和输出相关的模型 这里的输出是房屋的价格。 但是就跟名字一样,简单线性回归真的特别简单。 在大部分情况下, 我们更想要一些对于输入参数的复杂变化 举个例子:多项式回归 其实我们在这个专项课程的第一节课中就提到过了。 这个投票机制下 我们用了一个简单的回归模型然后看看结果有没有很好的拟合。 当然在之前我们看到这个问题的时候 我们没有像现在这样清楚, 但是我们现在知道这就是一个简单线性回归模型。 所以我们用了这个简单的模拟,然后跟别人说: 这个太酷了。 我得到了一条线,它很好的拟合了我的数据 现在我就能预测我房子的价格了! 然后你朋友觉得这个模型不太可信,说,大哥, 房子的面积和价格之间不是线性关系! 他看了下数据,觉得他没法相信这个是线性关系 相反,他觉得这个应该是二次回归拟合。 所以你朋友就是不相信你用的模型 他不相信这个是线性关系,加上误差 他觉得应该是二次项,像图中的公式 表现了房子的面积和价格之间的关系。 然后以及 我们的回归模型包含了一些噪声。 当然 我们也可以考虑更加高次的多项式模型 例如现在显示了P次多项式,可以作为 你们的房屋面积和价格之间的模型。 这个就是一般的多项式回归模型 yi是我们的观测值,用多项式模拟 例如把房屋面积作为输入x 我们假设有些误差,用epsilon i来表示 就是第i 个观测值的误差。 我们现在看到在这个模型里,跟简单线性回归不一样的是 我们有这些x的次方在这个模型里 我们现在就可以把这些不同的x的次方当成新的特征 好,我们现在介绍一个新的名词: 特征 特征就是你输入的变量的一些函数(变换) 这种情况下,特征,准确的说, 我们模型里的第一个特征就是常数1 被叫做常数项 第二个特征是x 就是线性项,跟我们在简单线性回归里一样。 第三个特征是x的平方 然后一直到第p+1次特征,就是x的p次方 跟这些特征联系在一起的就是我们模型的参数 所以我们有p+1个参数,w0 是交叉项 然后一步一步的,参数一直乘到了输入的p次方 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community