Bien, entonces, vamos a hablar de este problema de predecir el valor de una casa. Este es un problema muy importante, al menos en los Estados Unidos. Se estima que la riqueza del hogar es casi el 50% invertido en bienes raíces. Por lo tanto, esto es muy importante Tanto para los consumidores, los individuos, así como los responsables políticos. Bueno, por lo que estoy aquí y Quiero vender mi casa. Tengo esta grande y bonita, verde lima casa, pero no sé cuánto a la lista para. Así que no estoy seguro del que valor de mi casa tiene, ¿cómo pienso en estimar el valor de la casa? Bueno, lo que podria hacer es mirar en otras ventas recientes que han ocurrido en mi barrio. Así que miro a nivel local, en la región alrededor de mí, y Yo digo ¿cuánto están las otras casas vendidas y lo hago miro esas casas como? Así que lo que voy a hacer es registrar a cada uno de estas ventas recientes ¿Cuál fue el precio de venta? Y también, ¿cuál fue el tamaño de la casa que se vendió? Voy a decir que eso significa que si esa casa es similar a la mía o no Bueno, por lo que como estadístico, voy a tomar todas estas observaciones que tenía y Voy a hacer una representación de ellos. Así que en los EE.UU., al menos, el tamaño de la casa se mide por pies cuadrados. Eso va a ser mi eje x. Y entonces mi eje y va a ser el precio de venta de la casa. Okay, esa es mi variable Y y cada uno de estos puntos representa alguna venta de casa Así que, está representa una casa vendida anteriormente en mi barrio. y, solo para introduccir un poco de terminología, cuando hablamos de regresión las personas a menudo se refieren a X, esta variable X, como la caracteristica, ese es el termino que vamos a estar utilizando Las personas tambien la llaman la covarianza o el predictivo y en algunos casos, es nombrada la variable independiente y entonces nuestra observación Y, es como ya mencione, yo tiendo a referirme a esta como la observación. Las personas también la llaman una variable de respuesta o dependiente. Está bien, entonces la pregunta es ¿Cómo vamos a usar estas observaciones para estimar el valor de mi casa? Bueno, puedo mirar que tan grande es mi casa y buscar por otras casas vendidas de ese tamaño. Bueno, muy probablemente hay exactamente cero casas vendidas con exatamente el mismo tamaño, en pies cuadrados, al de mi casa. Okay, entonces no puedo usar este enfoque. Voy a ser un poco más flexible y Voy a buscar en algun vecindario, no uno geografico, algun pequeño rango de pies cuadrados cercano al de mis pies cuadrados aquí. Así que voy a decir, okay, vamos a ver todas las ventas de casas dentro de este rango de pies cuadrados. Pero incluso con este enfoque, en algunos casos por ejemplo, sólo tengo 2 ventas en las cuales voy a basar mi estimación. Así que, no me siento muy comoda con eso. Y lo que realmente estoy haciendo aquí es desechando todas estas otras observaciones como si no tuvieran nada que ver con el valor de mi casa. y la pregunta es ¿Es esto razonable? ¿Realmente creemos que no hay información en estas otras observaciones? Bien, cuando veo y pienso acerca de estos datos, me gustaría aprovechar toda la información que pueda para obtener buenas predicciones.