[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 所以下一步 我们要来审视我们数据的每一列 让我们先简单看一下 数据中有哪些列 让我们看看 如果我输入了sf['Country']这行代码 这行代码代表着选择Country这一列数据 因为我没做别的 我没给它赋值 所以这行代码仅仅是打印了这一列数据 现在它显示了 美国 加拿大 英国 美国 波兰 美国 瑞士 所以这整一列 被水平的打印出来了 让我们看另外一列 打个比方 让我们看年龄这一列 所以说代码是sf['age'] 让我们观察一下 这一列的数据是[24, 23, 22, 23, 23, 22, 25] 然后做一些数据可视化吧 我们可以用年龄这一列 然后做一些简单的运算 如果你输入sf['age'].mean这行代码 他不会显示是平均列 而是在计算这一列的数字的平均值 年龄这一列数据的平均值是23.142857 等等 我们还可以 计算年龄的最大值 恩 让我们来看一下最大值 你会发现最大值是25 这都是一些很基础的 我们会更深入的研究 我们建立新的几列 在我们的SFrame中 当你在机器学习的时候 经常会把一些列 进行转换 然后成为新的一列 这种叫特征工程 我们会做很多类似的事 我现在就要创造新的一列了 让我们返回并且打印SFrame 你可以看到名这一列 和 姓这一列 但是没有完整的姓名这一列 假设你想创造出新的一列 是关于完整姓名 这很简单 我想先给这一列起个标题SFrame的完整姓名 所以代码就是sf['Full Name'] 那这一列应该赋什么值呢? 应该是姓和名字的结合 在Python里 把两串字符联系在一起很简单 你只要用一个加号就行了 所以我们的代码就是sf['Full Name']= 名这一列 所以就是sf['First Name'] 我想在姓和名中间留个空格 所以是+‘ ’(空格)+名这一列 也就是sf['Last Name'] 是不是酷酷哒 所以我刚才创建了一个新的特征 一个新的一列 叫做姓名 也就是你的名加上空格 再加上你的姓 (外国人先写名再写姓) 在Python里面做这个很简单 特别是当你没有笔误的时候 你看我就输错 我把把First Name (名字) 输成 Fist Name 现在就对了 现在重新看一下SFrame 你可以看到有新的一列叫做姓名 (Full Name) 在表格的最后一列 Bob Smith就是姓名的第一行 然后你就能做一些有趣的事 比如说排序 你可以把年龄这一列进行排序 我就不做很多额外的事了 就做一些简单的例子 还能够比如在年龄这一列全体加上2 这样你就会看到对于年龄这一列中的每个元素 我们都加上了2 你还能做很多类似的运算 打个比方 你可以把年龄 乘以年龄这一列 这样子你会得到什么? 年龄乘以年龄? 你就会得到年龄的平方了 比如说556 529等等 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community