[MÚSICA] Vamos a empezar por revisar la intuición detrás de los clasificadores lineales. Cubrimos la misma intuición en el primer curso. Un clasificador lineal tomará como entrada alguna cantidad x, la cual en nuestro caso son las oraciones de los comentarios. Pasará a través del modelo de un clasificador y realizará una predicción Y que dice, si es un comentario positivo, en cuyo caso ŷ será +1, o si es un comentario negativo, ŷ será -1. Eso es lo que estamos intentando averiguar. Un clasificador lineal hace un poco más, asocia cada palabra con un peso o coeficiente, el cual dice cuán positiva es esta palabra, o cuán negativa. Así, "bueno" podría tener un coeficiente de 1.0, "genial" podría tener un coeficiente de 1.5, "increíble" es increíble y tiene un coeficiente de 2.7. En el lado negativo, "malo" podría tener un coeficiente de -1, "pésimo" -2.1. Pero "horrible" es simplemente horrible, entonces -3.3. Y luego otras palabras que no son tan importantes para el análisis de sentimiento podrían tener coeficiente 0. Ahora veamos cómo usamos estos coeficientes predecir si una oración es positiva o negativa. Por ejemplo tomemos esta oración que dice "el sushi estuvo genial". ¿Cómo calificamos esta oración? Calculemos la calificación de esta oración xi. La oración dice, "el sushi estuvo genial", por lo que miramos el coeficiente de "genial" y vemos que vale 1.2. Ahora dice, "la comida estuvo increíble", entonces el coeficiente de esa es 1.7. Luego dice, "pero el servicio fue pésimo". Por Dios, el servicio estuvo pésimo. Entonces restamos 2.1. Ahora pregunto, ¿Cuál es el valor total para esta oración? Entonces, algunas cosas son positivas y otras son negativas. El resultado final es 0.8 que es mayor que 0. Por lo tanto vamos a predecir que ŷ, el sentimiento de la oración, es +1. Es una crítica positiva. Y esto se llama clasificador lineal porque la salida es la suma ponderada de las entradas. Esa es una clase de clasificador lineal. Veremos en un poco más de detalle lo que realmente significa. De forma más general un clasificador lineal simple toma como entrada un coeficiente asociado con cada palabra. Y calcula un valor para esa entrada. Si el valor es mayor que cero decimos que la predicción de salida ŷ es +1. Y si el valor es menor que cero decimos que la predicción es -1. Ahora, lo que necesitamos hacer es entrenar los pesos de estos clasificadores lineales a partir de los datos. Así que dada alguna entrada de datos que incluya oraciones de comentarios etiquetados con, ya sea, +1 o -1 positivo o negativo. Vamos a dividirla en un conjunto de entrenamiento y un conjunto de validación. Luego pasaremos ese conjunto de entrenamiento por algún algoritmo de aprendizaje que aprenderá los pesos asociados a cada palabra, como 1.0 para bueno, 1.7 para increíble, etcétera. Y después de aprender este clasificador vamos a retroceder y evaluar su exactitud en el conjunto de validación. Nuestro objetivo para hoy es explorar esa caja de aprendizaje. Cómo aprendemos este clasificador a partir de los datos y entender un poco más sobre qué es realmente un clasificador lineal. En particular, en el contexto de regresión logística. [MÚSICA]