[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 现在让我们来训练这个顾客情感分类器 我们将会分两步来实现这个分类器 第一步,我们将原始数据划分为训练集和测试集 我现在要编程获取训练集数据 我们把数据划分为训练集数据和测试集数据 就像我们之前在回归的课上做的那样 划分的方法也与之前在回归模型中用到的指令相似 我们需要使用之前导入的商品信息表 输入“Products” 我们进行的是随机划分 因此 输入“Products” 输入“random split”指令进行随机划分 80%的数据作为训练集,而20%的数据作为测试集 你可以在家完成这个重新划分数据的操作,设置“seed = 0” 就像我们之前在回归课上讨论的那样 通常你可以不必进行这样的操作,你可以选择其他随机种子 但是我想要获得相同的随机种子 如果你输入这样的指令,就可以获得和我一样的结果 这就是我们的第一步,从数据中划分出训练集,现在我们已经完成了 然后我们建立那个著名的顾客情感分类模型 这里用到了“graphlab”库 然后用到了一个特定的分类器——逻辑回归分类器 这门课所涉及到分类的内容 我们会学到很多像逻辑回归一样的不同分类算法 比如支持向量机,决策树等 但是,我们首先还是从逻辑回归分类器开始 你可以在名字后面键入“.create” 就可以创建这样的分类器 然后需要几个输入参数 训练集数据是第一个参数 第二个参数是“target” 我们要分类的东西是数据表中的情感列 我们需要指定使用什么样的特征 我们用的特征就是“word count"列 这一个新数据列是我们上面为“word count”所创建的 然后我们还需要设置验证集validation set 验证集就是我们的测试数据 因此我们让 “validation_set = test_data” 好 现在我们开始计算这个单元 来建立一个情感分类器模型 我们只需要等待几秒钟,模型就训练好了 完成! 从数据中你可以发现 精确度是逐渐变好的 然后让我们来做一下互评吧 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community