[음악] 이 모듈에서 회귀분석이 주택 가격 예측을 포함한 다양한 분야에서 사용될 수 있음을
보았습니다 이 강의 도입부에서 카를로스가
기계학습 파이프라인을 소개했는데 데이터를 기계학습 알고리즘에 집어넣어서 지능을 끌어내는 방법이었습니다 기계학습 도구를 공부했으니 이제 블록 다이어그램을 펼쳐서 자세히 살펴봅시다 훈련 데이터 세트에 맞추려면
뭘 써야 하는지 이제 압니다 데이터지요 주택 예제에서 특정 주택 가격을 예측하는데 수집한 데이터는 주택 ID, 주택 특성, 주택 판매 가격이 담겨있는 표였습니다 근처 주택에서 이런 정보를 수집해 표 형태로 변환합니다 이게 훈련 데이터 세트가 됩니다 데이터를 가지고 특징 추출기에 집어넣는데 이 경우에는 아주 간단한 추출기를 써서 주택 특성의 일부만을 선택합니다 예제에서 특징 세트 x는 주택 평수, 화장실 개수 등을 나타냅니다 추가할만한 다른 특징에 대해서도
알아봤습니다 회귀 강의에서 더 깊이 다루겠지만 이 모듈에서 검토한 둘은 이렇습니다 그럼 이 특징들로 뭘 하나요? 목표는 이 특징을 가지고 주택 가격 예측에 도움이 되는 모델을
세우는 것입니다 결과물인 지능은 예측 주택 가격입니다 훈련 데이터 세트의 모든 주택에
이 과정을 반복합니다 연관 특징을 가져다 기계학습 모델에 집어넣어서
주택 가격을 예측합니다 어떤 기계학습 모델을 알아봤죠? 이 경우 회귀분석입니다 우리가 살펴본 기계학습 모델입니다 기계학습 모델에는 파라미터 세트가 있다는
사실을 상기해 봅시다 파라미터를 w라고 부르죠 각 특징에 대한 가중치입니다 평수나 화장실 개수 등에 대한 가중치지요 전문용어로는 회귀계수라고 합니다 데이터를 통한 파라미터 예측을 알아봤고 w 모자가 예측 파라미터임을 밝혔습니다 어떻게 한다고 했지요? 예측 결과물을 가지고 이 경우엔 예측 주택 가격인데,
진짜 주택 가격과 비교합니다 훈련 데이터 표에 기록된 실제 판매 가격이지요 여기 y가 훈련 데이터에 있는 주택의 실제 판매 가격이 됩니다 이걸 예측 주택 가격과 비교합니다 품질 척도 w 모자가 파라미터인 모델을 통한 예측이 얼마나 정확한지 측정합니다 얼마나 정확한가요? 어떤 오류 척도를 알아봤죠? 오류 척도는 잔차제곱합이었죠 실제 주택 판매 가격과 예측 주택 판매 가격
간의 차이를 제곱한 값을 더합니다 훈련 데이터 세트에 있는 모든 주택에 대해
이를 행합니다 품질 척도는 예측과 실제 주택
판매 가격 결과를 놓고 오류를 계산한 다음 기계학습 알고리즘에 집어넣어 모델의 파라미터인 가중치를 갱신합니다 기계학습 알고리즘과 그 변형을
알아보게 될텐데 회귀 강의에서 더 깊이 들어갈 예정입니다 이게 주택 가격 예측 문제에 대한 기계학습 방법론의 전체 플로 차트입니다 여기 루프에서 예측을 놓고
실제 판매 가격에 대한 오류를 계산하여 가중치, 모델 파라미터를 갱신하게 되는데 이 과정은 순환되는 경향이 있어 값을 계속해서 갱신하게 됩니다 이렇게 추상화를 하면 훈련 데이터 세트, 특징 추출 과정, 기계학습 모델이 남게 됩니다 지능을 만들어 내게 되는데 이 경우는 예측입니다 지능을 품질 기준으로 평가합니다 그렇게 구한 오류나 정확도를 특정 알고리즘을 거치게 한 다음
모델 파라미터를 조정합니다 기계학습에서 이런 형식의 흐름을
계속 보게 될 것입니다 이 모듈에서는 데이터를 가지고 특징과 결과를 연관짓는 모델을 만드는
회귀분석이란 도구를 이용해 지능을 이끌어내는 법을 배웠습니다 주택 가치 예측에 연관해 알아봤고 무척 재밌는 IPython 노트북을 통해
작업했습니다 이를 통해 아주 흥미로운 회귀분석 모델을 실무에서 세울 수 있을 것입니다 [음악]