[음악] 분류기로 아주 새로운 레스토랑 리뷰 경험을 제공했습니다 깊이 들어가서 분류기가 뭔지와 분류의 다른 응용 분야에 대해서 알아봅시다 분류기는 입력 x를 받는데 예를 들어 리뷰 등의 문장입니다 모델에 입력을 밀어넣어 y를 출력하게 하는데 우리가 예측하고자 하는 결과값이죠 여기선 클래스죠 긍정적인지 부정적인지 감성 분석에서 긍정적이면 강추가 되겠고 부정적이면 비추가 되겠죠 이는 분류의 한 예에 불과합니다 텍스트를 보고, 웹페이지라고 하죠, 어떤 웹페이지가 관심사에 속하는지 카테고리별로 정리하고 싶습니다 주제가 교육인지 금융인지 기술인지 등입니다 두 카테고리만 있는 게 아니죠 셋, 넷, 다섯, 심지어 천 개의 카테고리에서 예측해야 할지도 모릅니다 분류의 또 다른 예는 우리의 삶에 지대한 영향을 끼친 것인데 스팸 필터링입니다 몇몇 분들은 2000년대 초반에 스팸 필터가 어땠는지 기억하실지도 모르겠네요 성능이 좋지 않았죠 직접 사람 손으로 조정해서 이런 말을 했으면 스팸일거라고 걸러냈습니다 하지만 스패머들은 단어를 계속해서 조금씩 바꾸고 글자 대신에 숫자를 넣거나 해서 스팸 필터를 무력화시켰습니다 지금의 스팸 필터링은 그때와는 완전히 다르지요 얼마나 좋아졌는지 이젠 스팸 폴더에 들어가보지도 않습니다 스팸 폴더에 들어갔다면 안 열어봅니다 기계학습 알고리즘이 알아서 했을 테니까요 분류기가요 이메일 입력 x를 받아다 분류기에 집어넣으면 스팸인지 아닌지 예측합니다 상당히 정확하죠 이메일의 텍스트만 아니라 다른 특성도 살펴봅니다 예를 들어 누가 보냈는지 가까운 친구나 같이 휴가 가는 사이라면 스팸이 아닐 확률이 높겠죠 평소 자주 보내는 사람 컴퓨터의 IP 주소인지도 봅니다 많은 정보가 있죠 아주 흥미로운 실용적 응용이죠 컴퓨터 비전에도 분류 작업이 많습니다 이미지를 가져다 그 안 내용물을 알아냅니다 예를 들어 입력 x는 이미지 픽셀입니다 분류기에 집어넣어 개인지 예측합니다 개라도 래브라도 리트리버, 골든 리트리버, 아니면 다른 종류일 수도 있습니다 이건 래브라도 리트리버인 제 개입니다 나중에 딥러닝 모듈에서 보게 될텐데 아주 높은 정확도를 가진 방법이 새로 나왔습니다 의사가 하는 의료진단 시스템에도 활용할 수 있습니다 온도, x-ray, 임상 검사 등을 통해 병의 원인을 예측합니다 별 게 아니라 건강할 수도 있지만 감기, 독감, 심지어 폐렴일지도 모릅니다 변수 y이 진행 중인 병에 대한 예측입니다 최근 들어 맞춤약을 둘러싸고 여러 흥미로운 연구들이 진행되고 있는데 예측이 표준적인 측정에만 의지하지 않고 나라는 개인에게 맞춰서 나오기 때문입니다 특정 DNA 염기 서열이나 왼쪽 밑 그림 같은 생활 습관이나 좀 더 현실적으론 이런 게 있을 수 있죠 이런 측정치를 통해 병의 원인에 대해 더 정확한 예측을 할 수 있습니다 기계학습에서 분류란 개념은 더욱 발전해서 마음까지 읽어낼 정도가 되었습니다 카네기 멜론에 있을 때 제 친구이자 옆 사무실 동료인 톰 밋첼이 어느 날 저에게 와서 대단한 걸 했다고 말했습니다 FMRI이란 기술로 뇌 영상을 찍는 뇌 촬영을 통해 특정 텍스트를 읽으면 망치를 읽었는지 집을 읽었는지 알아낸다고 합니다 정말로 마음을 읽는 거죠 그 외에 흥미로운 작업을 많이 했습니다 예를 들어 망치나 집의 그림을 보았을 때 분류기는 망치와 집이란 단어만 가지고 훈련시켰는데도 마음을 읽어서 어떤 그림을 보는지 알아냅니다 앞으로 뇌를 이해하기 위한 분류의 차기 첨단분야가 될 겁니다 [음악]