[음악] 에밀리가 설명했듯이 여러 분야에 걸친 다양한 사례 연구를 통해 기계학습의 개념을 확립하게 됩니다 다시 말하자면 다른 기계학습 수업은 배워야 하는 알고리즘과 방법론으로 가득 찬 목록에 불과하죠 서포트 벡터 머신, 커널, 로지스틱 회귀, 신경망 같은 것 말입니다 따분하도록 긴 목록이죠 이런 접근법의 문제점은 알고리즘부터 시작하기 때문에 최종적으론 매우 간단한 애플리케이션만 만들고 끝나는데 현실과 동떨어져 있다는 점입니다 그래서 이 특화과정에서는 아주 다르게 하고 있는데 이렇게 한지가 벌써 꽤 됩니다 에밀리와 제가 워싱턴 대학에서 빅데이터를 위한 기계학습 강의를 개설했죠 기계학습 교육에 있어서 이런 활용 사례 중심 접근을 도입했죠 그 강의에서는 개념 확립과 이해에 도움을 받았다는 긍정적인 피드백을 많이 받았습니다 그래서 저희는 활용 사례부터 시작하게 될 겁니다 활용 사례부터 시작함으로써 지능형 애플리케이션을 만들고 품질을 평가하며 제대로 작동하는지 이해하는데 필요한 주요 개념과 기법을 파악하게 됩니다 끝에 가서는 이런 지능형 애플리케이션을 다수 만들게 됩니다 그런 지능형 애플리케이션을 만들기 위해선 일반적으로 어떤 작업을 할지 미리 생각해야 하죠 감성 분석 문제를 푼다고 하면 어떤 모델, 어떤 기계학습 모델을 사용할지, 서포트 벡터 머신인지 회귀 같은 건지. 그 모델 파라미터를 최적화하기 위해서 어떤 방법을 썼는지 그리고 나서 이런 질문을 하는거죠 이게 정말 내가 원하는 지능을 제공하는건가? 시스템의 품질은 어떻게 평가하죠? 이 특화과정에서 모델 설명과 최적화의 핵심적인 부분은 다음 강의로 미뤄놓을 겁니다 처음 강의에서는 어떤 과제를 수행할 건지 어떤 기계학습법이 적절한지 어떻게 평가할 건지를 봅니다 알고리즘을 블랙박스로 처리함으로써 다방면의 멋진 지능형 애플리케이션을 만들 수 있게 되는 것이죠 직접 코딩하고 제작해서 다양한 방법으로 보여주게 될 겁니다 강의를 따라가면 4개의 강의와 캡스톤으로 이루어져 있습니다 서로 다른 분야에서 깊이 있게 들어가죠 이 특화과정에서 얼마나 깊이 들어가는지 몇 가지 예를 들어 보여드리죠 회귀 강의는 실제 수치를 예측하는 다양한 모델에 대해 논하게 되는데, 예를 들자면 주택의 특징을 가지고 가격을 예측하는 일이죠 선형회귀법을 짚어보고 능선회귀와 LASSO와 같은 고급 기법으로 문제에 가장 적절한 특징을 어떻게 고르는지 이야기합니다 경사 하강법, 좌표 강하와 같은 최적화 기법으로 모델 파라미터를 어떻게 최적화하는지 살펴봅니다 손실 함수, 편향-분산 트레이드오프, 교차검증과 같은 주요 기계학습 개념을 함께 알아봅니다 방법론을 가지고 개선, 개발, 애플리케이션 제작을 위해 알아야 하는 것입니다 두 번째 강의는 분류인데 여기선 에밀리가 말했듯 감성분석을 활용한 걸 만들고 이런 분류에 대해 좀 더 논합니다 선형 분류기에서 시작해 좀 더 발전된 형태인 로지스틱 회귀, 서포트 벡터 머신 등이죠 그런 다음 커널과 결정 트리와 같이 복잡한 특징을 처리할 수 있는 기법에 대해서도 다룹니다 이런 기법을 확장할 때도 가능하게 하고 부스팅이란 걸 써서 이들을 혼합하는(앙상블) 최적화 방법들을 논합니다 분류기를 이해하고 확장하며 다른 방법들에 적용하는데 도움을 주는 근본 개념도 짚고 넘어갑니다 다음 강의에서는 클러스터링과 검색, 그 중에서도 문서를 다룰 때에 초점을 맞춥니다 최근접 이웃과 같은 기본적인 기법과 고급 클러스터링, 가우시안 혼합, 더 나아가 텍스트 분석 클러스터링 기법을 발전시킨 잠재 디리클레 할당에 대해서도 논합니다 이를 뒷받침하는 알고리즘과 KD 트리로 확장시키는 법, 샘플링과 기대값 최대화에 대해서 논합니다 이제 핵심 개념은 어떻게 확장시키고 품질을 평가하며 MapReduce와 같은 기법과 들어보셨을지도 모르는 구현 시스템인 Hadoop으로 분산 알고리즘을 작성하는지입니다 네 번째 강의에서 직접 분산 기계학습을 위한 MapReduce 코드를 작성하게 됩니다 마지막 수업에선 널리 쓰이는 행렬 분해와 차원 축소, 그 중에서도 상품 추천을 위한 추천 시스템에 중점을 두고 진행합니다 협업 필터링, 행렬 분해, PCA, 이를 최적화 하기 위한 좌표 강하, 고유 분해, SVD와 같은 기법들이죠 그런 다음 매우 다양하고 유용한 기계학습 개념들도요. 특히 추천 영역에서 말입니다 여러 종류의 추천을 뽑고 이 작업을 큰 문제로 확장하는 방법을 다룹니다 캡스톤은 아주 흥미진진한데 이 모듈 끝에 가서 조금 더 이야기할 겁니다 힌트를 좀 드리자면 친구와 면접관한테 보여줘도 될만큼 멋진 작품을 만들 겁니다 텍스트 데이터, 영상 데이터, 감성 분석, 딥러닝 등을 모두 갖춘 추천이 가능한 똑똑한 지능형 애플리케이션을 만듭니다 아주 멋지겠네요 [음악]