到目前为止 我们讨论分类器的时候 只讨论了 预测一个句子情绪是正面还是负面 一封电邮是不是垃圾邮件 这类问题 但一般来说 你会想做的更多一点 比如说 这封邮件是垃圾的概率有多大 我对自己的预测的信心到底有多强 比如说我仅仅看看结果是正还是负 那我还想知道对这个预测我到底有多肯定 举例来说 如果你拿这么一个句子来分类: "寿司和其它所有东西都特别棒" 这肯定是正面情绪 绝对的 "正"评价 但是 "寿司不错 服务凑合" 这句话很可能是正面情绪 但我不能肯定 这没有前一个句子那么肯定 所以一个分类器常常不光是给出 结果是正还是负 还要给出 对这个结果 它的信心有多大 解答这个问题的方式之一 是讨论 概率 所以当你输入一个句子x的时候 你要输出一个这句子情绪为正或负的概率 因此输出的标签 就成了 给定这个句子的情况下 输出某个标签的概率是多大 举个例子 对最开始那个句子来说 结果就不光光是个 "+" 号 我们会说 给定那个句子x的情况下 标签为"+" 的概率是0.99 而在第二个句子里 这个概率只有0.55 因为我不是很确定 预测 概率/信心水平 非常非常重要 我们在分类器那门课里 会看到它让你能做很多很多事 比如说 你知道概率之后 你就可以做类似这样的决定: 当你知道假阳性和假阴性的不同代价 和它们之间的平衡之后 什么决定边界才是最佳的 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community