Introducción: el problema de clasificación
Queremos, basándonose en el valor de sus características, clasificar cada individuo en una determinada categoría. Observamos por lo tanto, para el conjunto de aprendizaje, las "etiquetas" asociadas a cada individuo, es decir el valor de la variable $y$. Estas etiquetas pueden ser 0 ó 1, (clasificación binaria) o pueden tomar más valores (multiclases)
Planteamiento de la regresión logística
Decisión y coste
Para la implementación en scikit-learn, usaremos la clase LogisticRegression del súbmodulo linear_model.