[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 最常见的一种分类器是线性分类器那么让我们来多了解一点这里的问题是怎么来表示分类器呢我们从一些句子入手比如我们情感分类那个例子中这个分类器你预测这个语句是积极的还是消极的这个分类器是怎么工作的呢？在这个情感分析的例子中你可以想象一个简单的阈值分类器假设我们输入一条语句有人告诉我这个句子里都是积极的单词比如说极好的非常棒的令人惊喜的等等同样这里有一堆消极单词的集合比如坏的极差的令人作呕的食物等等我现在可以做的就是输入这条语句计数这个句子中有多少个积极的单词有多少个消极的单词如果积极单词的数目比消极单词的数目多这个就是一个积极的语句如果消极的单词比积极的多这就是一个消极的语句举个例子，如果输入语句是这里有最棒的寿司（一个积极单词“great”）这里的食物非常棒（第二个积极单词“awesome”）但是这里的服务很糟糕（一个消极单词“terrible”）有两个积极的单词和一个消极的单词消极的单词数目多因此给出一个积极的预测阈值分类器有一些局限这些积极和消极的单词实际上是从哪获得的？他们从某个地方就这么神奇的出现了不仅如此这些单词代表的积极和消极的程度也不同 “great”比“good”的词性更积极你想要知道“great”，“good”，“amazing”哪个词性更强 “amazing”的词性要比“great”强吗？谁知道呢? 我们怎么来考虑不同单词的权重呢单个的单词无法用来做好分类就拿“good"来说食物是好的是积极的语句食物是不好（”not good“）的就是消极的语句了这些问题都是需要考虑进去的积极和消极的单词表从哪获得我们怎么对他们进行权值分配是学习分类器的首要两个任务我们后面会进行讨论解决像“good”和“not good”这样的问题需要考虑更复杂的特征而不是基于单个单词我们在章节的最后会进行讨论线性分类器不是简单地获取一个积极和消极单词的列表而是对他们加入权值例如，“good”也许会有一个1的权值而“great”也许会有一个1.5的权值 “awesome”也许会有一个更大的权值2.7 而“bad”也许会有一个-1的权值 “terrible”也许会有一个-2.1的权值 “awful”也许会有一个-3.3的权值 “awful”确实很糟糕用这种方式 “really”与情感无关同样的 “the”，“we”，“where”，“restaurant”这些单词既出现在积极语句也出现在消极的语句中因此他们的权值为0 假设有人告诉你所有单词的权值我们来讨论一下怎么利用这些单词和权值训练分类器给定这些单词的权值我们要确定一个句子是积极的还是消极的我们这里用的是评分的思想拿这个句子为例寿司很好食物非常棒但是服务比较糟糕我们来对这个句子进行评分我们来计算一下输入语句x的评分在这个例子中 “great”的权值是+1.2 “awesome”的权值是1.7 “terrible”的权值是-2.1 因此最后的评分是 2.9 - 2.1 结果是0.8 这个句子的评分比0大我们将预测这个句子为积极的语句如果评分是负的输入x的评分小于0 我们就预测这个句子是消极的语句分类器就是这样工作的如果你知道每一个单词的权值这个分类器就叫做线性分类器因为输出是输入的权值的简单求和仅仅是权值而已不管出现什么样的特征不管出现什么样的单词我们从这个简单的线性分类器开始讨论总之给定一句话和单词的权值我们可以计算这句话的评分评分由出现在句子中的权值之和计算而来然后我们看一下这个评分是否大于0 如果大于0我们就预测输出是正类如果评分小于0 我们就预测为负类这就是线性分类器 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community