Una vez que contamos con las fuentes de datos necesarias y los datos se encuentran limpios, ya es momento de empezar a planificar la construcción del modelo predictivo que mejor represente nuestros datos.
Fuente: Microsoft |
Existen muchos algoritmos para la construcción de modelos predictivos en el ecosistema del aprendizaje automático y antes de elegir uno hay que tener bien en claro que tipo de problema de aprendizaje automático necesitamos resolver.
Aprendizaje supervisado
En el aprendizaje supervisado, cada dato de interés se encuentra etiquetado y dependiendo al tipo de variable que deseemos predecir, nos encontraremos con problemas de regresión (cuando el dato de interés tiene un valor continuo) o clasificación (cuando el dato de interés tiene un valor discreto). El objetivo del aprendizaje supervisado es estudiar muchos ejemplos etiquetados y, luego, poder realizar predicciones sobre datos de interés futuros.
Clasificación
Identificar si un cáncer es benigno o maligno en base a una fotografía es un ejemplo de clasificación binaria, y un sistema de reconocimiento de letras es un ejemplo de clasificación multiclase. Vale mencionar que también podemos usar algoritmos de clasificación multiclase como si fueran de clasificación binaria.
- Multiclass Decision Forest
- Multiclass Decision Jungle
- Multiclass Logistic Regression
- Multiclass Neural Network
- One-vs-All Multiclass
- Two-Class Averaged Perceptron
- Two-Class Bayes Point Machine
- Two-Class Boosted Decision Tree
- Two-Class Decision Forest
- Two-Class Decision Jungle
- Two-Class Locally Deep Support Vector Machine
- Two-Class Logistic Regression
- Two-Class Neural Network
- Two-Class Support Vector Machine
Los algoritmos de detección de anomalías son un caso especial de clasificación. Debido a que los casos anómalos suelen representar menos de un 1% de la muestra total, no podemos entrenar un clasificador binario para identificar qué es una anomalía. Entonces, un detector de anomalías se entrena para identificar características comunes de los datos para que luego básicamente se comporte como un clasificador binario entre dos clases: muestras anómalas y muestras no anómalas (los datos que comparten características comunes).
Regresión
La predicción de precios de venta de departamentos o el stock son ejemplos de regresión.
- Bayesian Linear Regression
- Boosted Decision Tree Regression
- Decision Forest Regression
- Fast Forest Quantile Regression
- Linear Regression
- Neural Network Regression
- Ordinal Regression
- Poisson Regression
Aprendizaje no supervisado
Los puntos de datos no tienen etiquetas asociadas a ellos. En cambio, el objetivo de un algoritmo de aprendizaje no supervisado es organizar los datos de alguna manera o de describir su estructura. Esto puede significar agruparlos o encontrar diferentes formas de ver datos complejos para que parezcan más simples.
Agrupación
Resumen
Usamos métodos de aprendizaje supervisado cuando tenemos información sobre el valor que deseamos predecir y métodos de aprendizaje no supervisado cuando no.
La mayoría de los fundamentos teóricos de los algoritmos de aprendizaje automático disponibles en el ecosistema son públicos y se encuentran bien documentados. Microsoft Azure Machine Learning Studio nos ofrece algunas implementaciones de los principales algoritmos de aprendizaje automático existentes, pero vale mencionar que no son todos los que existen.
Fuente: https://machinelearningmastery.com |
Nota: Actualmente no tengo ni idea de cuantos algoritmos de aprendizaje puedan existir 😂!
No hay comentarios.:
Publicar un comentario