[음악] 간단한 산점도를 그려서 데이터의 생김새를 보았습니다 그런데 산점도를 이용해 전용면적으로 가격을 예측할 수 있을까요? 간단한 회귀 모델을 해볼 겁니다 Esc+m을 누르고 #전용면적과 가격 간의 간단한 회귀 모델 만들기 라고 씁니다. 됐지요 강의에서 우선 데이터를 훈련 세트와 테스트 세트로 나눠야 한다고 배웠지요 그렇게 랜덤 스플릿 함수를 써서 train_data와 test_data로 나누면 됩니다 sales.random_split 방금은 탭 자동완성을 사용했죠 잠시 요령을 보여드리죠 sales.r까지만 치고 탭을 누르면 선택지가 몇 개 나타나죠 random_split, read_csv, remove_columns, rename_columns 등입니다 random_split을 쓰죠 .8 스플릿을 할 겁니다 .8란 80%가 훈련 세트, 20%가 테스트 세트가 되는 것을 뜻합니다 숙제와 그 외 작업을 하기 유용한 걸 한 가지 더 말씀드리자면 언제나 스플릿 하기 전 시드를 설정해야 한다는 점입니다 랜덤 스플릿은 그저 의사 난수 생성기이기 때문이죠 아무 숫자든 시드를 설정하면, 예를 들어 2015이 될 수도 있죠 다른 숫자도 될 수 있지만 0으로 설정하겠습니다 이러면 랜덤 스플릿 할 때 데이터가 언제나 똑같이 나뉘게 됩니다 [음악]