La IA aprende a predecir el comportamiento humano a partir de vídeos

Share on facebook
Share on twitter
Share on linkedin
Share on pinterest
Share on whatsapp
Share on telegram
Share on email

Investigadores de Columbia Engineering descubren una técnica de visión por ordenador que permite a las máquinas intuir lo que va a ocurrir a continuación.

Predecir lo que alguien va a hacer a continuación basándose en su lenguaje corporal es algo natural para los humanos, pero no para los ordenadores. Cuando conocemos a otra persona, puede saludarnos con un hola, un apretón de manos o incluso un choque de puños. Puede que no sepamos qué gesto se va a utilizar, pero podemos leer la situación y responder adecuadamente.

En un nuevo estudio, los investigadores de Columbia Engineering desvelan una técnica de visión por ordenador que permite a las máquinas intuir lo que va a ocurrir a continuación aprovechando las asociaciones de alto nivel entre personas, animales y objetos.


Colaboración humanos y robots

«Nuestro algoritmo es un paso para que las máquinas puedan hacer mejores predicciones sobre el comportamiento humano y, por tanto, coordinar mejor sus acciones con las nuestras», afirma Carl Vondrick, profesor adjunto de informática en Columbia, que dirigió el estudio, presentado en la Conferencia Internacional de Visión por Computador y Reconocimiento de Patrones. «Nuestros resultados abren una serie de posibilidades para la colaboración entre humanos y robots, los vehículos autónomos y la tecnología de asistencia».

Es el método más preciso hasta la fecha para predecir eventos de acción en vídeo hasta varios minutos en el futuro, dicen los investigadores. Tras analizar miles de horas de películas, juegos deportivos y programas como «The Office», el sistema aprende a predecir cientos de actividades, desde el apretón de manos hasta el choque de puños. Cuando no puede predecir la acción concreta, encuentra el concepto de nivel superior que las relaciona, en este caso, la palabra «saludo».

Clasificación de acciones

Los intentos anteriores de aprendizaje automático predictivo, incluidos los del equipo, se han centrado en predecir una sola acción a la vez. Los algoritmos deciden si clasifican la acción como un abrazo, un choque de manos, un apretón de manos o incluso una no acción como «ignorar». Pero cuando la incertidumbre es alta, la mayoría de los modelos de aprendizaje automático son incapaces de encontrar puntos comunes entre las posibles opciones.

Los estudiantes de doctorado de Ingeniería de Columbia Didac Suris y Ruoshi Liu decidieron examinar el problema de la predicción a largo plazo desde un ángulo diferente. «No todo en el futuro es predecible», afirma Suris, coautor del artículo. «Cuando una persona no puede prever con exactitud lo que va a ocurrir, va a lo seguro y predice a un nivel superior de abstracción. Nuestro algoritmo es el primero que aprende esta capacidad de razonamiento abstracto sobre los acontecimientos futuros».

Suris y Liu tuvieron que volver a plantear cuestiones matemáticas que se remontan a los antiguos griegos. En el instituto, los estudiantes aprenden las reglas familiares e intuitivas de la geometría: que las líneas rectas van rectas, que las líneas paralelas nunca se cruzan. La mayoría de los sistemas de aprendizaje automático también obedecen estas reglas. Sin embargo, otras geometrías tienen propiedades extrañas y contraintuitivas: las líneas rectas se doblan y los triángulos se abomban. Suris y Liu utilizaron estas geometrías inusuales para construir modelos de IA que organizan conceptos de alto nivel y predicen el comportamiento humano en el futuro.

Share on facebook
Share on twitter
Share on linkedin
Share on pinterest
Share on whatsapp
Share on telegram
Share on email

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

TE PUEDE GUSTAR

EVENTOS

RECIBE LA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Ir arriba