[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 在这个课程里我们将 使用许多有用的Python工具 来帮助我们了解 机器学习 同时 搭建一些可以 处理大量数据的应用程序 其中一个就叫SFrames 它是一个可扩展的 能处理非常大量的数据的结构 它不需要存在内存里 它存在电脑硬盘里 所以 它能够扩展处理上百万行数据 即使你的机器里没有那么多内存 我们将看到许多这样的例子 SFrame中的数据搜索定义在 一个叫GraphLab Create的包中 我们在这个课程中也将用到它 那么让我们用一个例子 来看IPython notebook中如何使用SFrame 好 这是一个IPython notebook 就像我们之前的例子中一样 然后我要给它起名叫 开始学习SFrames 然后为了让我的 屏幕上的空间多一点 我要把这个页眉和 工具栏隐藏起来 那么现在屏幕上 就有更多空间了 为了使用那些数据框 你得 先启动GraphLab Create 而且 启动这个非常简单 我现在敲击ask+M来打开 一个像wiki页面一样的输入框 然后 我要启动它了 啊呀 我敲回车太快了 那我得 让我再次编辑这个 它好像不让我编辑 好了 启动GraphLab Create 那么每次我们想要使用GraphLab Create 我们要做的就是 首先 输入import graphlab 然后我们就可以使用所有 GraphLab Create提供的工具了 包括SFrame 和所有 我们课程中将使用的算法 那么我要做的第一件事 是从硬盘里载入一些数据 所以我要#载入一个表格数据集 用SFrame来读取一个表格数据集非常简单 一个数据集可以 存在许多不同格式里 这个例子我们要用的是 一个叫CSV的格式 就是一个逗号分割文件 这个文件在我的当前文件夹里 接下来我要在SFrame里 新建一个变量 然后 这个例子里我叫它sf 我要输入的就是graphlab.SFrame 然后 给它一个目标文件夹 或者文件 然后它就会读入文件 这个例子中 我的文件叫做 people-exmaple.csv 我们去到这里 于是它输出了一些东西 说文件已被成功解析 现在文件读好了 让我们来做一些SFrame的基本操作 我们开始#SFrame基本操作 这是一些基本操作 如果你直接输入sf 回车 这里你要打shift+回车 因为这是IPython notebook 它会给你显示这个 表格开头的几行 这里我要放一句注释 #我们可以看到表格的开头几行 那么我们开始吧 这是个非常简单的表格 其实我们已经看到所有行了 它说有个人名字叫Bob 姓Smith 住在美国 今年24岁 我们还有一些其他人的这些信息 我们有两种方法来 读取文件的前几行 你可以输入sf 你也可以输入sf.head 来显示开头几行 不过 我们现在处理的这个 是一个非常小的数据集 还有一个命令 叫sf.tail可以用来 显示数据集的最后几行 然而还是 我们这个数据集很小 那么我们讲完了怎么显示 开头几行 末尾几行 和所有行 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community