Actualidad, AI, Data, Inteligencia Artificial

Un sistema de inteligencia artificial aprende conceptos compartidos en vídeo, audio y texto

Un modelo de aprendizaje automático puede identificar la acción en un clip de vídeo y etiquetarla, sin ayuda de los humanos.

Los humanos observan el mundo mediante una combinación de diferentes modalidades, como la visión, el oído y nuestra comprensión del lenguaje. Las máquinas, en cambio, interpretan el mundo a través de datos que los algoritmos pueden procesar.

Así, cuando una máquina «ve» una foto, debe codificarla en datos que pueda utilizar para realizar una tarea como la clasificación de imágenes. Este proceso se complica cuando las entradas vienen en múltiples formatos, como vídeos, clips de audio e imágenes.

«El principal reto es cómo puede una máquina alinear esas diferentes modalidades. Como humanos, esto es fácil para nosotros. Vemos un coche y oímos el sonido de un coche pasando, y sabemos que son la misma cosa. Pero para el aprendizaje de las máquinas no es tan sencillo», dice Alexander Liu, estudiante de posgrado del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) y primer autor de un artículo que aborda este problema.

Liu y sus colaboradores desarrollaron una técnica de inteligencia artificial que aprende a representar los datos de forma que capte los conceptos que comparten las modalidades visual y auditiva. Por ejemplo, su método puede aprender que la acción de un bebé llorando en un vídeo está relacionada con la palabra hablada «llorando» en un clip de audio.

A partir de este conocimiento, su modelo de aprendizaje automático puede identificar dónde tiene lugar una determinada acción en un vídeo y etiquetarla.

Su rendimiento es mejor que el de otros métodos de aprendizaje automático en las tareas de recuperación multimodal, que consisten en encontrar un dato, como un vídeo, que coincida con la consulta de un usuario en otra forma, como el lenguaje hablado. Su modelo también facilita que los usuarios vean por qué la máquina cree que el vídeo recuperado coincide con su consulta.

Esta técnica podría utilizarse algún día para ayudar a los robots a aprender conceptos del mundo a través de la percepción, de forma más parecida a como lo hacen los humanos.

Junto a Liu, participan en el artículo el postdoctoral del CSAIL SouYoung Jin; los estudiantes de posgrado Cheng-I Jeff Lai y Andrew Rouditchenko; Aude Oliva, investigadora científica senior del CSAIL y directora del MIT-IBM Watson AI Lab; y el autor principal James Glass, investigador científico senior y director del Grupo de Sistemas de Lenguaje Hablado del CSAIL. La investigación se presentará en la reunión anual de la Association for Computational Linguistics.

Aprendizaje de representaciones

Los investigadores centran su trabajo en el aprendizaje de representaciones, que es una forma de aprendizaje automático que busca transformar los datos de entrada para facilitar la realización de una tarea como la clasificación o la predicción.

El modelo de aprendizaje de representaciones toma los datos en bruto, como los vídeos y sus correspondientes subtítulos, y los codifica extrayendo características, u observaciones sobre los objetos y las acciones en el vídeo. A continuación, mapea esos puntos de datos en una cuadrícula, conocida como espacio de incrustación. El modelo agrupa datos similares como puntos individuales en la cuadrícula. Cada uno de estos puntos de datos, o vectores, está representado por una palabra individual.

Samuel Rodríguez

Periodista a cargo de Ecommerce News desde 2012. Inquieto. En el camino, creé otros medios, como @BigDataMagazine y @CybersecurityNews. Organizador de cientos de eventos profesionales. Ahora con un pie en Portugal y otro en México... Muy del @GetafeCF

TE PUEDE GUSTAR

El 67% de las empresas aumenta su inversión en IA en 2025

Aldana Balmaceda
17/07/2025

La inteligencia artificial (IA) ya está reconfigurando sectores, revolucionando el funcionamiento de las organizaciones e impulsando la innovación y la eficiencia. Desde la IA

La cara B de la IA en materia de ciberseguridad: de aliada a amenaza para las empresas

Aldana Balmaceda
17/07/2025

De sobra sabemos que la inteligencia artificial se ha convertido, tanto para empresas como para particulares, en una herramienta necesaria. Para agilizar tareas automáticas

La IA revoluciona la publicidad digital: estrategias automatizadas para SEO y anuncios pagados

Aldana Balmaceda
16/07/2025

Durante años, el posicionamiento en buscadores fue el termómetro del éxito digital, ya que parecer en el top 3 de Google equivalía a asegurar

Solo el 11% de las empresas usa IA con éxito para conversar de forma humana con sus clientes

Aldana Balmaceda
16/07/2025

Aunque el 93% de los líderes empresariales reconoce la importancia de ofrecer experiencias conversacionales positivas, solo el 36% considera que su organización lo está

La inteligencia artificial: el nuevo escudo digital frente a las ciberamenazas más sofisticadas

Aldana Balmaceda
15/07/2025

Check Point® Software Technologies Ltd., empresa global en soluciones de ciberseguridad, destaca la importancia de la inteligencia artificial en la protección del entorno digital

Big Data y business intelligence, la fórmula para desbloquear el potencial empresarial

Aldana Balmaceda
14/07/2025

Nuno Queirós, responsable de Producto Mid-Market de Cegid en Iberia, Latam y África Vivimos en una era en la que los datos ya no

EVENTOS

Transparencia y ética en la Inteligencia Artificial: un imperativo urgente

Eventos, Inteligencia Artificial

Bosch apuesta fuertemente por la IA como motor de crecimiento

Eventos, Inteligencia Artificial

Málaga se proyecta con la IA y computación cuántica a nivel mundial con DES2025

AI, Eventos

Sin inversión en tecnología, Europa será una esclava digital de otras potencias

Eventos, Machine Learning

El turismo se reinventa con IA, realidad aumentada e influencers virtuales

AI, Eventos

El ministro destaca el liderazgo tecnológico de España y pide más inversión y una IA con valores

AI, Eventos

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
Acepto recibir la newsletter y comunicaciones de BigData Magazine conforme a la Política de Privacidad

Acepto recibir comunicaciones comerciales de terceros relacionados con el sector del BigData e IA

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

SÍGUENOS EN FACEBOOK

SÍGUENOS EN TWITTER

SÍGUENOS EN LINKEDIN

SÍGUENOS EN YOUTUBE

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things