Clasificación

Introducción: el problema de clasificación

Queremos, basándonose en el valor de sus características, clasificar cada individuo en una determinada categoría. Observamos por lo tanto, para el conjunto de aprendizaje, las "etiquetas" asociadas a cada individuo, es decir el valor de la variable $y$. Estas etiquetas pueden ser 0 ó 1, (clasificación binaria) o pueden tomar más valores (multiclases)

Planteamiento de la regresión logística

Decisión y coste

  Fronteras de decisión y función de coste

Fronteras de decisión

La función de coste para la regresión logística

Para la implementación en scikit-learn, usaremos la clase LogisticRegression del súbmodulo linear_model.

Aplicar regresión logística usando Scikit-learn

Si tenemos más de dos categorías

Qué hacer si tenemos más de dos categorías para la clasificación

Calidad de la clasificación

Cómo vamos a evaluar la calidad de nuestro algoritmo de clasificación binaria