[음악] 지금까지 우리는 회귀직선을 찾기에만 몰두했죠 하지만 그게 좋은 선택이었을까요? 제 분석의 정확성은 확신합니다 회귀직선을 그리고 잔차제곱합을 최소화해서 제 집의 가치를 예측했습니다 그 과정에 모든 관찰 결과를 반영했고 최근 주택 판매 가격을 기록했습니다 카를로스한테 가서 내 분석을 봐 이게 우리집 가치에 대한 예측이야 그러면 그가 말하죠 음 잘 모르겠는데 사실 나한테 이게 선형추세인지 잘 모르겠어 실제로는 >> 그거 선형 아니야 >> 선형이 아니라고 말합니다 만화를 보면 임마 그건 선형 관계 아니야 임마 카를로스가 임마라고 할 거 같진 않군요 어쨌든 >> 친구여 라고 할 걸 >> 친구여 라고 할 걸 좋아요. 친구여 언제나 저를 친구라고 호칭하죠 당연히 좋아요. 요점은 카를로스는 이 추세가 선형관계가 아니라고 생각한다는 점이죠 이차곡선일지도 모릅니다 이차곡선 그려봤어? 하고 물어봅니다 으음 그려준 그래프를 보고 있자니 꽤 그럴듯해 보입니다 이제 뭘 하죠? 이 데이터에 가장 맞는 회귀곡선이 뭔지 알아내야 하죠 어떻게 할까요? 다시 한번 잔차제곱합을 최소화합니다 잔차제곱합을 최소화할 겁니다 그러기 위해서 어떻게 해야 하는지 알아봐야 하는데 이차 함수라 파라미터가 3개 있기 때문입니다 절편이죠 이건 y축상에 곡선이 어디 있는지를 나타냅니다 선형항 x가 있고 여기 항 하나가 더 있는데 x의 제곱입니다 이차 함수가 되는 이유죠 잠시 설명을 하자면 지금 하는 것도 선형회귀입니다 x제곱을 또다른 특징으로 인식하기 때문이죠 w항들은 다 그대로고요 w제곱이나 다른 함수로 되지 않습니다 회귀 강의에서 더 자세히 다룹니다 데이터에 대한 이차곡선함수라고 해도 선형회귀라는 사실을 기억하시기 바랍니다 중요한 건 잔차제곱항을 최소화해야 하는데 파라미터가 3개라는 점입니다 공간에서 서로 다른 3개를 찾아야 하죠 잔차제곱합을 최소화하는 최선의 w0, w1, w2 조합을 찾아야 합니다 이제 계산을 하려고 합니다. 사실 꽤 효율적이라 관계된 이론에 대해 회귀 강의에서 다룹니다 카를로스가 아주 좋은 생각이 있다네요 잠깐만! 곡선에 대해선 말해줬는데 13차 다항식은 시도해봤어? 전 안해봤는데 하고 대답하죠 >> 그게 낫네요 >> 훨씬 낫지요 여길 보세요. 딱 맞죠 카를로스가 제시한 13차 다항식으로 얻어지는 선입니다 잔차제곱합을 최소화시켰다고 하죠 꽤 괜찮아보이죠? 잔차제곱합이 기본적으로 제로가 되었죠 하지만 전 개인적으로 이게 마음에 들지 않는군요 제 집의 가치가 이렇게 낮을리가 없기 때문이죠 적어도 그건 압니다 잔차제곱합이 선에 대한 오차라고 했습니다 카를로스가 잔차제곱합을 최소화한 것도 맞고요 하지만 뭔가 석연치 않습니다 이 함수는 뭔가 이상합니다 [음악]