Actualidad, AI, Data, Inteligencia Artificial

Un sistema de inteligencia artificial aprende conceptos compartidos en vídeo, audio y texto

Un modelo de aprendizaje automático puede identificar la acción en un clip de vídeo y etiquetarla, sin ayuda de los humanos.

Los humanos observan el mundo mediante una combinación de diferentes modalidades, como la visión, el oído y nuestra comprensión del lenguaje. Las máquinas, en cambio, interpretan el mundo a través de datos que los algoritmos pueden procesar.

Así, cuando una máquina «ve» una foto, debe codificarla en datos que pueda utilizar para realizar una tarea como la clasificación de imágenes. Este proceso se complica cuando las entradas vienen en múltiples formatos, como vídeos, clips de audio e imágenes.

«El principal reto es cómo puede una máquina alinear esas diferentes modalidades. Como humanos, esto es fácil para nosotros. Vemos un coche y oímos el sonido de un coche pasando, y sabemos que son la misma cosa. Pero para el aprendizaje de las máquinas no es tan sencillo», dice Alexander Liu, estudiante de posgrado del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) y primer autor de un artículo que aborda este problema.

Liu y sus colaboradores desarrollaron una técnica de inteligencia artificial que aprende a representar los datos de forma que capte los conceptos que comparten las modalidades visual y auditiva. Por ejemplo, su método puede aprender que la acción de un bebé llorando en un vídeo está relacionada con la palabra hablada «llorando» en un clip de audio.

A partir de este conocimiento, su modelo de aprendizaje automático puede identificar dónde tiene lugar una determinada acción en un vídeo y etiquetarla.

Su rendimiento es mejor que el de otros métodos de aprendizaje automático en las tareas de recuperación multimodal, que consisten en encontrar un dato, como un vídeo, que coincida con la consulta de un usuario en otra forma, como el lenguaje hablado. Su modelo también facilita que los usuarios vean por qué la máquina cree que el vídeo recuperado coincide con su consulta.

Esta técnica podría utilizarse algún día para ayudar a los robots a aprender conceptos del mundo a través de la percepción, de forma más parecida a como lo hacen los humanos.

Junto a Liu, participan en el artículo el postdoctoral del CSAIL SouYoung Jin; los estudiantes de posgrado Cheng-I Jeff Lai y Andrew Rouditchenko; Aude Oliva, investigadora científica senior del CSAIL y directora del MIT-IBM Watson AI Lab; y el autor principal James Glass, investigador científico senior y director del Grupo de Sistemas de Lenguaje Hablado del CSAIL. La investigación se presentará en la reunión anual de la Association for Computational Linguistics.

Aprendizaje de representaciones

Los investigadores centran su trabajo en el aprendizaje de representaciones, que es una forma de aprendizaje automático que busca transformar los datos de entrada para facilitar la realización de una tarea como la clasificación o la predicción.

El modelo de aprendizaje de representaciones toma los datos en bruto, como los vídeos y sus correspondientes subtítulos, y los codifica extrayendo características, u observaciones sobre los objetos y las acciones en el vídeo. A continuación, mapea esos puntos de datos en una cuadrícula, conocida como espacio de incrustación. El modelo agrupa datos similares como puntos individuales en la cuadrícula. Cada uno de estos puntos de datos, o vectores, está representado por una palabra individual.

Samuel Rodríguez

Periodista a cargo de Ecommerce News desde 2012. Inquieto. En el camino, creé otros medios, como @BigDataMagazine y @CybersecurityNews. Organizador de cientos de eventos profesionales. Ahora con un pie en Portugal y otro en México... Muy del @GetafeCF

TE PUEDE GUSTAR

Aumento del cibercrimen impulsado por inteligencia artificial

Aldana Balmaceda
06/05/2025

A medida que la inteligencia artificial se integra en las operaciones empresariales, redefine la forma en que evolucionan las ciberamenazas. Check Point® Software Technologies

Más allá de la eficiencia: el impacto real de la inteligencia artificial en el negocio asegurador

Aldana Balmaceda
06/05/2025

La inteligencia artificial (IA) está provocando una transformación radical en el sector asegurador, un mercado tradicionalmente conservador que hoy se sitúa en la vanguardia

La IA está reinventando la Búsqueda y el comportamiento de los consumidores

Aldana Balmaceda
04/05/2025

Debbie Weinstein, presidenta de Google para Europa, Oriente Medio y África (EMEA), lidera la colaboración con empresas y gobiernos para promover el crecimiento mediante

La IA generará más de 3M de empleos y automatizará hasta 60% de tareas en España

Aldana Balmaceda
04/05/2025

El 1 de mayo, se celebró el Día del Trabajador, una fecha clave para reflexionar sobre los derechos y necesidades de los empleados. Este

Samsung amplía el acceso directo al asistente de IA con el botón lateral en la serie Galaxy A

Aldana Balmaceda
29/04/2025

Samsung Electronics Co., Ltd. ha anunciado esta semana que una selección de dispositivos de la serie Galaxy A pronto serán compatibles con la activación

El 76% de las pymes españolas urge implantar IA para no quedarse atrás

Aldana Balmaceda
27/04/2025

En los últimos meses están surgiendo numerosas soluciones innovadoras que han sorprendido a los expertos del sector industrial por la aplicación avanzada de la

EVENTOS

El auge de la inteligencia artificial y la aplicabilidad de las tecnologías, claves del Mobile World Congress 2025

Eventos, Inteligencia Artificial

Combinando el BIG DATA y la IA para impulsar el futuro

AI, Data, Eventos

Las empresas aumentarán sus presupuestos destinados a IA un 23% en 2025

Eventos

El 58% de los CIOs señala la IA generativa como una de sus principales prioridades

Eventos

La inteligencia artificial cuántica, entre las tendencias que transformarán las tecnologías de IA

Eventos

Aplicaciones de identidad digital, economía circular, logística, tokenización e inversión en activos digitales, entre los proyectos finalistas de los ‘Blockchain Awards’

Eventos

RECIBE NUESTRA NEWSLETTER

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things