[음악] 신경망이 처음으로 많은 변화를 가져온 분야는 이미지와 동영상을 분석하는 컴퓨터 비전이었습니다 딥러닝, 커다란 신경망이 컴퓨터 비전에 적용되는 예를 보도록 하죠 이를 위해 이미지 특징을 이해하고 넘어가는 게 중요합니다 컴퓨터 비전에서 이미지 특징이란 지역 탐지기를 합쳐서 예측하는 것과 비슷합니다 이 이미지를 예로 들어보죠 얼굴 이미지인지 아닌지 예측한다고 합시다 코 탐지기, 눈 탐지기, 눈 탐지기 다시 한번, 입 탐지기를 돌려서 모두 통과하면 얼굴이라고 예측합니다 이미지 분류기의 간단한 예지만 실제로 코 탐지기나 눈 탐지기가 있는 건 아닙니다 이미지 특징, 관심 지점 등 여러 이름이 있는데 뚜렷이 구별되는 지역 이미지 영역을 찾아내는 것입니다 눈 구석이나 코 구석 등 구석을 탐지할 수 있죠 얼굴은 구석으로 이루어져 있으니까요 구석 탐지기는 눈, 입, 양쪽 눈 등에서 켜질텐데 특정 패턴이 여러 번 탐지되면 얼굴을 발견했다고 할 수 있습니다 컴퓨터 비전에서는 일반적으로 이런 과정을 거칩니다 분류도 비슷하고요 물론 일반적 모델과 복잡한 모델이 있지만 기본적인 아이디어는 같습니다 오랫동안 이런 지역 특징 탐지기는 사람이 만들어 왔습니다 아주 인기 있는 게 SIFT 특징입니다 SIFT는 컴퓨터 비전을 한 단계 발전시켰는데 꽤나 쓸모가 있기 때문입니다 정확도 향상을 위한 다른 여러 방법들도 있습니다 다른 특징들을 사용하고요 SIFT와 같이 사람이 만든 이미지 특징을 알아봤는데 분류에 어떻게 쓰일 수 있는지 논해보죠 SIFT가 적용된 텍스처를 이미지에 돌려보면 여러 군데에서 탐지됩니다 예를 들어 눈과 입 구석 탐지된 위치를 바탕으로 벡터를 생성합니다 특정 위치엔 탐지가 되고 다른 위치엔 안 될 수 있죠 문서의 단어와 유사하게 볼 수 있습니다 메시란 단어가 등장하는지 축구란 단어가 등장하는지 마찬가지로 구석이 이미지의 특정 지점에서 나타나는지 봅니다 이미지 묘사를 나오면 분류기에 넣습니다 예를 들어 readLines 함수는 파일을 학기 초에 말씀드렸던 선형 분류기 온라인이니 학기가 아니죠 이 모듈 초반입니다 [웃음] 모듈 초반에 말씀드렸는데 선형 분류기, 로지스틱 회귀, 서포트 벡터 머신 등에 집어넣습니다 그러면 이미지가 얼굴인지 아닌지 탐지됩니다 아주 흥분되는 결과이며 컴퓨터 비전에 많은 영향을 끼쳤습니다 관건은 이미지 특징 만드는 과정이 아주 복잡했고 제대로 만드려면 PhD 논문이 여럿 필요했다는 것이었습니다 신경망은 이런 특징을 자동으로 찾아서 학습합니다 예를 하나 보여드리죠 이 이미지가 입력으로 주어지고 3층 신경망을 거쳐 예측이 나온다고 합시다 일반적으로 SIFT와 같은 지역 특징 탐지기는 학습을 여러 레벨과 층에서 합니다 학습한 탐지기가 서로 다른 걸 탐지하는데 이미지의 여러 레벨에서의 특성입니다 첫 번째 층에서 탐지기가 이런 대각선으로 보이는 부분을 학습합니다 첫 탐지기는 대각선만 잡아냅니다 중간 건 반대 방향 대각선을 잡아냅니다 마지막은 어두운 색에서 초록색으로의 변화를 잡아냅니다 다음 층에서는 선, 대각선 탐지기가 좀더 복잡한 탐지기로 진화합니다 예를 들어 2층에는 구불구불한 선과 패턴 탐지기가 있습니다 이미지에서 구석만을 찾아내는 탐지기도 있고요 마지막 층에는 훨씬 복잡한 탐지기가 있습니다 다양한 이미지에서 몸통이나 얼굴에 대응하는 탐지기가 있을 수 있겠죠 데이터 세트가 엄청나다면 이런 이미지까지 탐지할 수 있을 겁니다 산호 이미지죠 신경망은 여러 종류의 이미지 특징을 여러 층에서 잡아내는데 학습이 자동으로 이루어집니다 [음악]