Tipos de aprendizaje que usan los algoritmos de Machine Learning

Los modelos de Machine Learning o aprendizaje automático son aquellos capaces de aprender a realizar una tarea sin haber sido programados específicamente para ello. Estos algoritmos son capaces de encontrar patrones entre grandes volúmenes de datos y realizar predicciones que se utilizan por ejemplo en motores de búsqueda inteligente, sistemas de diagnóstico, reconocimiento de imágenes, del habla y del lenguaje, etc.

Pero, ¿cómo es eso de que aprenden solos? Decimos que un algoritmo aprende cuando su desempeño mejora con la experiencia y mediante el uso de datos. Pues bien, los algoritmos de Machine Learning pueden aprender de 4 formas distintas: mediante aprendizaje supervisado, aprendizaje no supervisado, aprendizaje semi-supervisado o aprendizaje por refuerzo. En este artículo hablaremos de los diferentes tipos de aprendizaje de estos modelos.

Aprendizaje supervisado

Se puede utilizar el aprendizaje supervisado cuando existen conjuntos de datos etiquetados, es decir, se parte de un conocimiento a priori. Por ejemplo, una tienda de ropa cuenta con registros diarios de datos sobre los productos vendidos en los últimos años, y también con datos climatológicos diarios durante ese periodo. En este caso, seguramente nos interesa entrenar un modelo que, a partir de los datos climatológicos de un día concreto, nos diga cuántas prendas se van a vender ese día. Es decir, que, a través de este histórico de datos (datos de entrenamiento), saque una función de mapeo entre las entradas y la salida.

Dentro del aprendizaje supervisado, dependiendo de si la variable a predecir es cuantitativa o cualitativa, existen dos tipos de modelos: de regresión o de clasificación, respectivamente.

Los modelos de clasificación como salida generan una etiqueta discreta (etiqueta dentro de un conjunto finito de etiquetas), por ejemplo, la clasificación de imágenes de ropa (hay un conjunto de etiquetas de prendas que pueden ser) o análisis de sentimientos (existe un conjunto finito de etiquetas de sentimientos posibles), etc.

Sin embargo, las salidas generadas por los modelos de regresión son valores reales. Por ejemplo, el número de prendas que se venderán un determinado día, tal y como veíamos en el ejemplo del principio.

Aprendizaje no supervisado

Al contrario que en el aprendizaje supervisado, en el aprendizaje no supervisado tenemos datos que no han sido etiquetados, es decir, no existe conocimiento a priori, ni una etiqueta a predecir. Este tipo de modelos parten de grandes cantidades de datos, analizando la estructura y distribución de los mismos para extraer nuevo conocimiento y agrupar entidades por afinidad (detectar patrones). También se pueden utilizarse para reducir la dimensionalidad y simplificar conjuntos de datos.

Los algoritmos de agrupamiento o clustering definen una métrica de similitud o distancia que les sirve para comparar datos. Se utilizan por ejemplo para encontrar clientes con comportamientos similares a los que vender determinados productos o servicios, o identificar acciones sospechosas de fraude.

En el caso de la reducción de dimensionalidad, se utiliza para reducir el tiempo de entrenamiento de los modelos, mejorar su rendimiento o agilizar la representación visual de los datos. Utilizan técnicas matemáticas y estadísticas para reducir la dimensión del conjunto total de datos a cambio de perder una pequeña cantidad de información.

Aprendizaje semi-supervisado

El aprendizaje semi-supervisado es una mezcla entre el aprendizaje supervisado y el no supervisado. Como normalmente no es fácil contar con un conjunto de datos totalmente etiquetado, este tipo de aprendizaje combina datos etiquetados y no etiquetados para construir un modelo supervisado mejorado.

Por ejemplo, imagina que quisiéramos analizar los mensajes de Twitter que hablan sobre una empresa, y determinar si son publicaciones positivas o negativas. Lo primero seria recopilar las publicaciones que nombren a la marca. Pero ahora llegaría el problema de que, al no ser datos etiquetados, no sabemos cuál es el sentimiento de cada tweet. En este caso se utilizaría el aprendizaje semi-supervisado. ¿Y cómo funcionaría? En un primer lugar se etiquetarían manualmente algunos comentarios. Con esa muestra de etiquetas se entrenaría un algoritmo de aprendizaje supervisado. Una vez entrenado el algoritmo, se utilizaría para etiquetar el conjunto restante de datos no etiquetados. Una vez tenemos la totalidad de los comentarios etiquetados (positivos o negativos) podemos entrenar un nuevo modelo de aprendizaje supervisado.

Aprendizaje por refuerzo

En último lugar tenemos el aprendizaje por refuerzo. Este tipo de aprendizaje no se diferencia del resto por el tipo de datos con los que contamos, sino por la manera de aprender en sí. Aquí nos encontramos con problemas no supervisados que reciben re-alimentaciones o refuerzos (gana o pierde), y se basa en eso, recompensar los comportamientos deseados y penalizar los no deseados. De esta manera un agente es capaz de aprender a través de prueba y error en un ambiente dinámico e incierto, y mapear situaciones de acciones para maximizar una cierta función de recompensa.

Un ejemplo de este tipo de aprendizaje son los modelos de juegos como el ajedrez o AlphaGo. En ellos el agente tiene la información sobre las reglas del juego (cómo se mueve cada pieza, turnos, etc.) y aprende a jugar por sí mismo. En un primer momento de una manera más aleatoria y finalmente respondiendo a jugadas y movimientos más sofisticados.

Sin duda, el aprendizaje automático o Machine Learning es una tecnología sumamente poderosa que transforma datos en conocimiento y valor, mejorando la toma de decisiones. En decide4AI son expertos en el desarrollo e implementación de este tipo de modelos, con proyectos de éxito realizados en diferentes sectores empresariales. La clave del éxito en este tipo de proyectos es definir de manera clara desde un inicio el tipo de aprendizaje que se utilizará dependiendo de las características del conjunto de datos.

Si habías pensado en aplicar Machine Learning a tu negocio, no dudes en contactar con nosotros para realizar una consultoría y análisis previo para descubrir el verdadero potencial que tendría su aplicación en tus resultados.

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

TE PUEDE GUSTAR

El data scientist de PiperLab, Javier Fernández, nos cuenta en este artículo cuáles son los cambios que ha sufrido la industria del fútbol a

EVENTOS

RECIBE LA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Ir arriba