Translated, empresa de soluciones lingüísticas impulsadas por inteligencia artificial, anuncia el lanzamiento de DVPS, uno de los mayores proyectos financiados por el programa Horizonte Europa hasta la fecha. La iniciativa cuenta con una inversión inicial de 29 millones de euros y reúne a veinte socios de referencia de nueve países para dar forma a la próxima frontera de la IA.
Basándose en el éxito de los grandes modelos de lenguaje, DVPS explora el futuro de la inteligencia artificial mediante modelos fundacionales multimodales. A diferencia de los sistemas actuales, que aprenden a partir de representaciones del mundo a través de texto, imágenes y vídeos, estos modelos de nueva generación están diseñados para desarrollar una comprensión más profunda mediante la interacción directa con el mundo físico. Al integrar lenguaje, visión y datos sensoriales, adquieren una conciencia contextual más profunda, ampliando las capacidades humanas en áreas donde la confianza, la precisión y la adaptabilidad son esenciales.
Marco Trombetti, director ejecutivo de Translated, comenta: “Los grandes modelos lingüísticos han supuesto una revolución, pero ya estamos viendo sus límites, tanto en su arquitectura como en la forma en que aprenden a partir de contenidos estáticos creados por humanos y disponibles solo en el mundo digital. Para avanzar, la IA debe interactuar con el mundo real en tiempo real. Con DVPS, permitimos que las máquinas evolucionen interactuando con la realidad y compartiendo instantáneamente sus aprendizajes entre sí.”
Aunque los sistemas de IA actuales destacan en muchas tareas, todavía tienen dificultades en aquellas que requieren un entendimiento más profundo del contexto físico. Por ejemplo, en el ámbito del lenguaje, estos modelos permiten la traducción en vivo en entornos complejos, como espacios concurridos y ruidosos con múltiples interlocutores. Los sistemas tradicionales tienen dificultades para identificar quién está hablando, mientras que los humanos enfocan su atención con facilidad utilizando señales visuales y acústicas, como la dirección de la mirada, la orientación del rostro, la intensidad de la voz y la distancia. Los sistemas de traducción basados únicamente en audio tienen un rendimiento deficiente en estos escenarios debido a su falta de conciencia contextual. En cambio, DVPS combina la entrada visual, el sonido espacial y la dirección del habla para identificar al interlocutor correcto y ofrecer traducciones más precisas.
Las potenciales aplicaciones de este sistema abarcan múltiples ámbitos. En el ámbito del lenguaje, permite la traducción en tiempo real en una amplia gama de idiomas, con comprensión de texto, voz, gestos y contexto físico. En el ámbito de la salud, posibilita la detección temprana de riesgos cardiovasculares mediante la creación de un gemelo digital 3D del corazón generado a partir de imágenes médicas. En el ámbito medioambiental, mejora la respuesta ante desastres mediante la predicción de inundaciones basada en datos satélite, drones y señales de observación en tiempo real.
La iniciativa está liderada por Translated, que se encarga de supervisar la visión general y su ejecución.
El equipo fundador de DVPS está compuesto por 70 científicos europeos destacados especialistas en inteligencia artificial, procedentes de los siguientes centros:
- Investigación: Universidad de Oxford, Instituto Alan Turing, Escuela Politécnica Federal de Lausana, ETH Zurich, Imperial College London, Fondazione Bruno Kessler, Instituto de Tecnología de Karlsruhe, Universidad de Barcelona y Vlaamse Instelling voor Technologisch Onderzoek.
- Los socios especializados por sector son: Hospital Universitario de Heidelberg, Vall d’Hebron Institut de Recerca, Centros Médicos Universitarios de Ámsterdam, Deepset, Sistema, MEEO, Lynkeus, Data Valley y Pi School of AI.
- Computación de alto rendimiento (entrenamiento de modelos): Cyfronet, el centro nacional de computación de alto rendimiento de Polonia.