[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 那么 我们已经大致了解了数据集 让我给你们看一些很酷的东西 我们今天介绍一下 GraphLab 画布 (Canvas) 这种数据类型 或者叫图表数据类型 可以处理我们的图像数据 有很多可视化的方法 GraphLab Create用的是 一个数据可视化助手 它可以用很多方法呈现数据 所以如果你拿任何一个 我们正在处理的数据结构 任何一个GraphLabCreate数据结构 那么 拿任何一个数据结构 放在GraphLab Create中 然后你在后面输入.show 如果你输入了sf.show 你就可以打开GraphLab画布 然后 就能看到可视化的数据 在这个例子中 我们有一个非常简单的数据集 当我回车 它显示了一个链接 链接指向一个新的网页 网页上展示了这个数据集 我把字体缩小一些 然后你会看到这个数据集有四列 名字 Alex Malcolm Felix 等等 还有姓 这个人所在的国家 和他们的年龄 你还能看到最大年龄是25 最小年龄是22 年龄中位数是23 平均值时24.143 等等 如果你点击表格显示 你可以看到所有的数据 这个特别帅 如果你有上万行数据 你很难一次看到所有的 但这个工具允许你 滚动浏览这上万行 几亿行数据你也可以用 这个表格模式来滚动浏览 现在我点击任何一列 比如 年龄这一列 它就会给我显示... 抱歉 我选中了一些奇怪的东西 让我重新加载这个页面 因为刚才发生了些奇怪的事情 这是一个直方图 如果我点击分类 它将会按照最常出现 的数值进行分类排序 你看最常出现的数值是23 一共有三个23 也就是42%的数据中 年龄是23 所以我们就可以用画布工具 对数据进行各种可视化处理 我们刚刚展示的这种 打开画布的命令会 在一个新的窗口中打开画布 窗口间跳来跳去 对我们录像来说有点麻烦 所以 我们现在看看怎样 在IPython Notebook中打开 画布 或别的可视化工具 我要调用一个命令叫做 graphlab.canvas.set_target 命令的目标设置为IPython Notebook 简写ipynb 我们接下来还会一遍 又一遍地使用这个命令 于是现在我们做的所有 可视化操作都将 发生在这个notebook上 那么 让我们再次把年龄这一列可视化 不过这次在notebook中 我们接下来会这么做 这个特别帅 我们要拿这个sframe sf 然后我要选择 这个方括号是用来选择 某一列或者某几列的 那么我要选择年龄这一列 然后我在后面输入.show 接下来我告诉它 我想要的图像是 就像我们刚才看到 的分类排序图 那么我们开始吧 我们刚才也看到了 23岁是最常见的年龄 23岁的人占了数据的42% 那么我们现在学会了怎样用 GraphLab Create做简单的可视化 我们还会学习一些GraphLab的 其他可视化操作 以及其它的图像化工具 这些都在后面的课程中 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community