[음악] 전용면적과 주택 가격의 관계를 나타내는 간단한 모델을 세워봤고 우편번호, 우편번호가 크게 좌지우지하는 건 확실하죠, 침실, 이것도 크죠, 과 같은 특징을 살펴보았습니다 중요한 점은 특징을 더 추가함으로써 모델을 향상시킬 수 있냐는 것입니다 한번 살펴보죠 이제부터 할 건 회귀 모델 특징 추가하기입니다 방금 설명드린 것보다 더 큰 특징 세트를 활용합니다 첫 번째는 sqft_model이라 했습니다 이걸 my_features_model이라 명명합니다 my_features_model은 다시 graphlab.linear_regression.create에 훈련 데이터를 입력 받습니다 전에 했던 것처럼요 대상은 전과 같이 가격이 될 겁니다 하지만 특징은 방금 생성한 my_features를 쓸 겁니다 실행해보죠 더 많은 특징들을 사용했고 죽죽 나오네요 다 된 것 같습니다 8개의 특징을 사용했습니다 뭘 썼는지 my_features를 출력해봅시다 침실, 화장실, 전용면적, 대지면적, 층수, 우편번호네요 이제 모델이 두 갭니다 sqft_model과 my_features_model이지요 성능으로 비교하면 어떨까요? 이렇게 하죠 sqft_model.evaluate이 모든 테스트 데이터를 평가하죠 그 다음 my_features_model.evaluate을 똑같은 테스트 데이터에 실행합니다 어떻게 되는지 보죠 살펴보면 간단한 평수 모델의 가장 큰 오류는 400만입니다 밑에 건 340만이네요, 49니까 350만이라고 하죠 약간 내려갔습니다 RMSE, 평균 오류는 25.5만에서 17.9만으로 내려갔습니다 특징을 추가하면 할수록 오류가 줄어들 확률이 높은데 데이터가 일단 많고 아직 학습할 거리가 많기 때문이죠 다시 말하지만 몇몇 특징을 추가한 것만으로도 성능이 올라갔습니다 [음악]