[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 下一步就是来评估 我们建立的情感分析模型 在之前的章节提到过的分类误差 准确率 噢不对应该是假阳性和假阴性 我们要在这个Notebook里研究 这个概念 情感分析模型有着一个叫做Evalute(评估)的函数 这个Evaluate 函数能够让你去评估你测试数据的结果 质量 我们会提供一个特定的计量标准 并且把这个计量标准叫做ROC曲线(受试者工作特征曲线) 我们接下来的内容就是和这个ROC曲线相关 但是ROC曲线只是用来研究 在混淆矩阵中假阳性和假阴性的 我们之前也说过这点 这边它给你显示了评估结果 用文本格式看起来比较费力 让我们做一点可视化 我们还是会用到Canvas 我们可以输入sentiment_model.show(这个代码) 然后就能看到我们将要用到的东西了(这一步是在可视化) 这就是我们评估结果的图 我们去到这里 看起来真的很酷 我们建立了一些内容 这是精确率 召回率 噢不对 应该是ROC 曲线 这个曲线是关于假阳性和真阳性的取舍 让我稍稍解释一下 让我们看一些这边的数字 这是混淆矩阵 真阳性的数量 就是事实上是正的样本 而我们预测的也是正的样本,它的数量是26455 在这里 真阴性的数目只有不到4000 3965个 是一个非常不平衡的例子 假阳性的数目 和假阴性的数目大致相等 所以说总体的准确率是在91.1% 也就是0.911 我们讨论过一些计量标准 像精确召回 还有错误计数 我们要在以后的课程中学到这些 现在的问题是 关于假阳性和假阴性 如果我们改变了我们之前认为的临界值 那么从阴性转变到阳性就会是一个很自然的转变 所以我们右边显示的临界值 让我把它放到我们的ROC曲线上 你可以看到 对我来说 很可能会得到 一个很高的真阳性率 应该是0.4 噢不对应该是一个很低的真阳性率 0.4 在我不让自己得到任何一个假阳性的情况下 也就是说我是很担心假阳性 所以我就比较保守 这样就不会得到假阳性 但是再一次地 没有捕捉到很多真阳性 并犯了别的错误 你可以看到 这个曲线有一个拐点 这个点就是当你并没有很多假阳性但是 有很多真阳性的点 在右边的端点 你每一个点都是真阳性 但是你也会得到很多假阳性 所以说你要怎么样 才能得到很多的真阳性 但是又要保证比较低的假阳性呢 你可以预测每个数据都是阳性 然后你会得到很多的真阳性 但是你犯了了很多错误 我们会在精确召回曲线中讨论更多关于这个 不过在这里 我们能通过改变临界值 来做到 你看举个例子 在很右边很远的端点 真阳性的值很高 但是没有假阴性 也没有真阴性 但是没有假阴性 也没有真阴性 你预测的都是阳性 你可以滑动这个断点 这样你就能来改变一些东西 也能够理解这条roc曲线真正意味着什么 这就是我们所做的评估 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community