[음악] 이 특화과정에서는 기계학습 시작에 도움이 되는 파이썬 도구 몇 개를 써서 엄청난 데이터를 처리하도록 확장하는 애플리케이션을 개발하게 됩니다 그 중 하나는 SFrame이란 건데 많은 양의 데이터에 대응하는 확장가능한 자료구조지요 메모리에 다 들어갈 필요도 없이 디스크에 곧장 넣어도 되기 때문에 메모리 용량이 부족해도 수백만 행의 데이터를 처리할 수 있습니다 그런 많은 예를 보게 됩니다 SFrame의 데이터 검색은 이 특화과정에서 사용할 GraphLab Create라는 패키지의 일부입니다 이제 IPython 노트북을 통해 SFrame 사용법을 알아봅시다 이전 예제에서 본 IPython 노트북입니다 SFrame 시작하기라고 적겠습니다 화면 공간 확보를 위해 헤더와 툴바를 감추도록 하죠 이제 공간이 좀 남는군요 SFrame을 실행하기 위해서는 GraphLab Create를 먼저 실행해야 하는데 무척 쉽습니다 Esc+m 다시 눌러서 위키 페이지 같은 텍스트 상자를 열고 실행시키기, 아 너무 빨리 엔터를 눌렀네요 다시 수정하죠 잘 안 되네요 GraphLab Create 실행시키기라고 씁니다 GraphLab Create을 시작하려면 import graphlab이라고 입력하면 됩니다 SFrame과 사용할 알고리즘을 포함한 GraphLab Create가 제공하는 모든 도구를 쓸 수 있게 되었습니다 먼저 디스크에서 데이터를 읽어오도록 하죠 표 형태의 데이터 세트라고 씁니다 표 형태의 데이터 세트을 SFrame 형식으로 읽어들이는 건 아주 간단합니다 데이터 세트에는 아주 많은 형식이 있죠 우리가 사용할 건 CSV 형식입니다 쉼표로 구분된 파일이죠 파일이 현재 디렉토리에 있습니다 SFrame에서 변수를 생성해서 sf라고 부릅니다 graphlab.SFrame라고 하고 대상 디렉토리와 읽어들일 파일명을 입력하면 됩니다 people-example.csv란 파일입니다 됐지요 파싱했더니 올바로 됐다고 나오네요 이제 됐습니다 SFrame 기본을 좀 해보죠 #SFrame 기본부터 시작하죠 SFrame에서는 기본적으로 여기서 sf와 엔터를 입력하면 이 경우는 IPython 노트북 환경이기 때문에 쉬프트+엔터인데 표의 처음 몇 줄을 보여주죠 여기 처음 몇 줄을 볼 수 있다는 주석을 답니다 만들어볼까요 아주 간단한 표입니다 사실 이게 전부지요 이름이 밥이고 성이 스미스이란 사람이 미국에 살고 24살이라고 합니다 같은 형식으로 몇 명 더 있죠 처음 몇 줄을 보는 방법은 두 가지가 있습니다 sf.head를 입력하면 처음 몇 줄이 나오죠 우리가 가진 건 작은 데이터 세트이지요 sf.tail란 명령어도 있는데 데이터 세트의 마지막 몇 줄을 보여줍니다 아까 말했듯 작은 데이터 세트이죠 처음 몇 줄이나 마지막 몇 줄이나 모든 줄이나 똑같죠 [음악]