Scikit-learn es una biblioteca de Python para aprendizaje automático (machine learning) que ofrece herramientas simples y eficientes para tareas como clasificación, regresión, clustering y preprocesamiento de datos. Se usa a la par de otras librerías como SciPy , Numpy y Matplotlib.
Scikit-learn provee de varios algoritmos de clasificación, regresión y análisis de grupos entre los cuales están máquinas de vectores de soporte, bosques aleatorios, Gradient boosting, K-means y DBSCAN.
Sirve para:
- Clasificación: Identificar a qué categoría pertenece un dato (ej. spam/no spam).
- Regresión: Predecir valores numéricos (ej. precios de casas).
- Clustering: Agrupar datos similares sin etiquetas previas.
- Preprocesamiento: Escalar, normalizar o codificar datos.
- Evaluación de modelos: Métricas como precisión, recall, etc.
Si no tenemos instalada la librería, la podemos instalar de esta forma:
$ pip install scikit-learn
Nota: Si no tenemos Scipy, Numpy y Matploylib debemos instalarlas.
$ pip install scipy $ pip install numpy $ pip install matplotlib
Verificamos que tenemos instaladas las librerías:
$ pip show scikit-learn $ pip show scipy $ pip show numpy $ pip show matplotlib
Ejemplo. Clasificar tipos de flores según medidas de pétalos y sépalos. Esto usando un conjunto de datos de iris.
ejemplo.py
from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score # Cargar datos iris = load_iris() X, y = iris.data, iris.target # Dividir datos en entrenamiento y prueba X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # Crear y entrenar modelo model = LogisticRegression(max_iter=200) model.fit(X_train, y_train) # Predecir y evaluar y_pred = model.predict(X_test) accuracy = accuracy_score(y_test, y_pred) print(f"Precisión del modelo: {accuracy:.2f}")
Ejecutamos:
$ python ejemplo.py
Salida:
Precisión del modelo: 1.00
En conclusión, Scikit-learn es ideal para implementar modelos de ML de forma rápida y con buen rendimiento.
Enlaces:
https://scikit-learn.org/stable/https://www.master-data-scientist.com/scikit-learn-data-science/
https://alquimistadecodigo.blogspot.com/2025/08/scipy-una-libreria-python-para.html
https://alquimistadecodigo.blogspot.com/2025/08/numpy-una-libreria-para-calculo.html
http://luispedro.org/software/milk
http://deeplearning.net/software/theano/
http://pybrain.org/
https://emanuelpeg.blogspot.com/2018/08/java-o-python-para-procesamiento-de.html
https://jmlr.org/papers/v12/pedregosa11a.html
Comentarios
Publicar un comentario