[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 到目前为此,我们只用了 一条直线来拟合数据 那么问题来了 这个模型够不够好呢? 其实 我感觉我的分析 已经相当到位了 我拟合了这条直线 我将残差平方和 降到最低 同时我还 对房价做出了预测 这样我已经观察并记录了 近期所有的房屋销售记录 并且加以利用 然后我去找Carlos 给他说 嘿 看看我的分析 这是我对我们房价的估计 然后他说 嗯?好像有点问题 因为 其实 我觉得 我不确定这是线性趋势 事实上他说的是 这不是线性的 他说这不是线性的 或者正如这个小人说的 伙计!这不是线性关系啊! Carlos: 哥! 不 我觉得Carlos不会说伙计 不过 好吧 他会说兄弟 他说兄弟 好 兄弟 他总是这么叫我 好 但 无论如何 问题是 Carlos认为这不是一个线性关系 他认为 这可能是一个二次的 他问 你有没有尝试过二次的拟合? 嗯 现在我看着他刚刚放在这的图 我说 它看起来还不错哟 那么 我需要做些什么? 我必须搞清楚 哪个二次模型是这组数据的最佳拟合 我该怎样做呢? 我准备重复之前步骤 并使残差平方和最小化 于是我准备将我的 残差平方和最小化 那么我们来看看 这样做的话会发生什么 看这个二次函数 它有三个参数 那么这里仍然还有截距 也就是这条曲线 在y轴上的位置 之后是x的一次项 然后还有一项 就是现在圈出的x的平方 这就是二次项 但在这里我想快速地解释一下 插一句 实际上 这仍然叫做线性回归 原因是 我们把x的平方 认为是另一个回归量 但是呢w始终是w 而不是w的平方或是其他w的表达式 我们会在回归的专题课里 详细讨论这个问题 但记住 尽管我们现在在 讨论用一个二次函数来 拟合数据 但实际上 这仍叫做线性回归 但我想强调的是 在这里我们有三个参数 当我想最小化我的残差平方和时 现在我需要寻求三个不同的参数 我需要找到一组特定的 w0,w1和w2的值 来组成这样一个二次拟合 使得残差平方和最小 好了 我现在准备 把这些值算出来。实际上它也是 表现得很高效 我们会在回归课程里再讨论这种方法的普适性 然而Carlos有了一个绝佳的主意 他急忙说道 别慌 等下 我向你提到二次方程式 那你尝试13次多项式了吗? 我接道 不 我没试 那个会更有意义 确实 那的确很有意义 看这条曲线 它相当不错 这是Carlos用他的13次多项式得到的曲线 他说:我只是将残差平方和最小化 相当不错 不是吗? 此时得到的残差平方和几乎为0 但我个人感觉它不是特别好 因为我看了这条曲线之后惊呼 我的房子不可能就值这么点钱 我知道 我确实清楚 是 我们讨论过用残差平方和来表示曲线的拟合程度 是的 Carlos确实也真的真的 将残差平方和最小化了 但在我看来 还是有点不对劲 这个函数看起来太怪了 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community