[음악] 함게 데이터를 통한 두 회귀 모델을 배워봤습니다 전용면적에 기반한 모델과 다른 고급 특징들에 기반한 모델이었죠 이 모델을 적용해 봅시다 실제로 주택 가격 예측에 사용했을 때
어떻게 되는지 한번 봅시다 학습된 모델로 데이터 세트의 집 세 채의 가격을 예측합니다 여러 크기와 특성을 지닌 세 채는 생김새도 다르고 지역도 다른데 그 중 첫 번째 집을 살펴봅시다 한번 보죠 데이터의 첫번째 집인데 같은 판매 데이터에 있는 것이죠 판매 데이터에서 특정 id의 집을 고를 겁니다 카운티 기록은 각 주택에 문자열 id를
부여하는데 숫자 형식이죠 여기 이건 5309101200이죠 특정 id를 지닌 주택을 찾아서 house1에 저장한 뒤 출력해 봅니다 특정 id를 가진 주택입니다 이 날 62만 달러에 팔렸네요 침실 네 개에 화장실 2.25개, 2400평방피트의 전용면적입니다 IPython 노트북에는 마크업, 텍스트, 파이썬 코드뿐만 아니라 HTML과 이미지도 삽입할 수 있습니다 바로 보여드리죠 Esc+m을 누른 다음 노트북에 이미지를
추가할건데 이 이미지는 카운티 기록에서 다운 받은 겁니다 이미지는 디렉토리에 house란 이름으로
올라가 있습니다 house-5309101200이 이름입니다 꽤 멋질 겁니다 대상 주택의 사진을 보면 아차, 타이핑을 잘못했군요 .jpg를 잊었습니다 우리가 가격을 메길 주택의 사진입니다 2014년에 62만 달러에 팔렸군요 침실 4개 화장실 2.25개입니다 1929년에 건축되었군요 모델이 얼마로 예측할지 봅시다 모델이 두 개 있었죠 처음은 주택의 실제 가격입니다 기록을 위해 출력해두죠
house1의 price 열입니다 print로 출력해보죠 62만 달러가 주택 가격입니다 첫 번째 모델이 얼마로 예측하나보죠 간단한 평수 모델이었죠 .predict 함수에 house1을 인자로 주면 62.8만 달러로 예측된다고 나옵니다
상당히 가깝네요 아주 정확하군요 특징을 추가했을 때 어떻게 되나 보죠 my_features_model.predict에 house1을
인자로 주면 평균적으로 특징을 추가할수록 성능이 좋아집니다 예측을 보면 72만 달러니까 평수 모델이 특징을 추가한 모델보다
나은 결과를 내놓았죠 여기서 배울 점은 평균적으로는 특징을 추가할수록 예측이 정확해지지만 이 특정 주택을 대상으로는 간단한 모델이 복잡한 모델보다
나은 결과를 내놓았다는 점입니다 예상 가능한 일이죠 항상은 아니지만 어쩔 땐 낫고 어쩔 땐 못하겠지만
평균적으로 복잡한 모델이 나을 겁니다 [음악]