Aprendizaje máquina con Scikit-learn

Introducción, conceptos básicos de Scikit-learn

Scikit-learn es la librería de machine learning por excelencia en Python. Dispone de una API muy elegante, con una lógica consistente que hace muy sencillo aplicar distintos tipos de algoritmos para la predicción, la clasificación, la reducción de dimensión, el preprocesamiento de los datos así como la búsqueda de grupos (clustering).

Transparencias asociadas a esta unidad

  Principios básicos, estimadores y transformadores

Principios básicos de scikit-learn

Declarar, ajustar, transformar, predecir

Atributos útiles

Flujos "pipelines"

El uso de flujos o pipelines (tuberías) permite combinar distintos pasos de procesamiento de los datos para su análisis.

Uso de flujos

Evaluación del resultado del estimador

Debemos evaluar la calidad del ajuste de nuestro modelo, resultado del procesamiento y de la estimación.

  Para evaluar el resultado:

Conjunto de aprendizaje y conjunto de test

Para realizar validación cruzada:

Cómo ajustar los hiperparámetros de los algoritmos

Resumen

En resumen, estos son los pasos que vamos a seguir