Actualidad, Machine Learning

Las lenguas muertas ‘reviven’ con el machine learning

Un sistema desarrollado en el MIT pretende ayudar a los lingüistas a descifrar lenguas que se han perdido en la historia.

Investigaciones recientes sugieren que la mayoría de las lenguas que han existido ya no se hablan. Docenas de estas lenguas muertas también se consideran perdidas o «no descifradas», es decir, no sabemos lo suficiente sobre su gramática, vocabulario o sintaxis como para poder entender sus textos.

Las lenguas perdidas son algo más que una mera curiosidad académica; sin ellas, perdemos todo un conjunto de conocimientos sobre los pueblos que las hablaban. Por desgracia, la mayoría de ellas tienen registros tan mínimos que los científicos no pueden descifrarlas utilizando algoritmos de traducción automática como Google Translate. Algunos no tienen una lengua «relativa» bien investigada con la que compararse, y a menudo carecen de separadores tradicionales como espacios en blanco y signos de puntuación. (Para ilustrarlo, imagínate descifrando un idioma extranjero escrito así).

Descifrar lenguas perdidas

Sin embargo, investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT han realizado recientemente un importante avance en este campo: un nuevo sistema que ha demostrado ser capaz de descifrar automáticamente una lengua perdida, sin necesidad de tener conocimientos avanzados sobre su relación con otras lenguas. También han demostrado que su sistema puede determinar por sí mismo las relaciones entre las lenguas, y lo han utilizado para corroborar estudios recientes que sugieren que la lengua ibérica no está realmente relacionada con el euskera.

El objetivo final del equipo es que el sistema sea capaz de descifrar lenguas perdidas que han eludido los lingüistas durante décadas, utilizando sólo unos pocos miles de palabras.

Dirigido por la profesora del MIT Regina Barzilay, el sistema se basa en varios principios fundamentados en conocimientos de lingüística histórica, como el hecho de que las lenguas suelen evolucionar sólo de ciertas maneras predecibles. Por ejemplo, aunque una lengua determinada rara vez añade o elimina un sonido completo, es probable que se produzcan ciertas sustituciones de sonido. Una palabra con «p» en la lengua madre puede convertirse en «b» en la lengua descendiente, pero el cambio a «k» es menos probable debido a la importante diferencia de pronunciación.

Al incorporar estas y otras limitaciones lingüísticas, Barzilay y la estudiante de doctorado del MIT Jiaming Luo desarrollaron un algoritmo de descifrado que puede manejar el vasto espacio de transformaciones posibles y la escasez de una señal de guía en la entrada. El algoritmo aprende a incrustar los sonidos del lenguaje en un espacio multidimensional en el que las diferencias de pronunciación se reflejan en la distancia entre los vectores correspondientes. Este diseño permite captar los patrones pertinentes de cambio de la lengua y expresarlos como restricciones computacionales. El modelo resultante puede segmentar palabras en una lengua antigua y asignarlas a sus homólogas en una lengua afín.

El proyecto se basa en un artículo que Barzilay y Luo escribieron el año pasado en el que descifraban las lenguas muertas del ugarítico y el lineal B, que el ser humano había tardado décadas en descifrar. Sin embargo, una diferencia clave con ese proyecto era que el equipo sabía que estas lenguas estaban relacionadas con las primeras formas del hebreo y el griego, respectivamente.

Samuel Rodríguez

Periodista a cargo de Ecommerce News desde 2012. Inquieto. En el camino, creé otros medios, como @BigDataMagazine y @CybersecurityNews. Organizador de cientos de eventos profesionales. Ahora con un pie en Portugal y otro en México... Muy del @GetafeCF

TE PUEDE GUSTAR

El miedo a quedarse obsoleto impulsa la formación en IA

Aldana Balmaceda
07/04/2026

El aumento de la demanda de empleos relacionados con la Inteligencia Artificial y el temor a quedarse atrás en el mundo laboral son los

El IBEX 35 aún no está preparado para los agentes de inteligencia artificial

Aldana Balmaceda
07/04/2026

Incógnito, la agencia independiente de comunicación, publicó ayer su primer informe de análisis de posicionamiento digital ante la inteligencia artificial: «Las mayores empresas de

La IA se consolida como clave contra el fraude para 1 de cada 5 directivos en España

Aldana Balmaceda
06/04/2026

La inteligencia artificial se posiciona como protagonista indiscutible en el futuro de la tesorería de grandes y medianas empresas. Según un estudio realizado por Embat, fintech

España avanza en madurez en IA, pese a que el cambio cultural limita aún a 6 de cada 10 organizaciones

Aldana Balmaceda
06/04/2026

Las empresas españolas han avanzado de forma significativa en la adopción de herramientas de IA, pero todavía existe una brecha entre su despliegue tecnológico

Solo cuatro de cada diez empresas creen que sus empleados están preparados para identificar amenazas de IA

Aldana Balmaceda
05/04/2026

La formación sobre seguridad se está consolidando como una herramienta clave para reducir el riesgo cibernético en las organizaciones. Sin embargo, pese a los

Zara, la marca de moda femenina con mayor relevancia en la IA en España

Aldana Balmaceda
05/04/2026

La marca Zara es la firma de moda femenina con mayor relevancia en las respuestas generadas por inteligencia artificial en España. Así lo concluye

EVENTOS

La IA inunda la construcción: desde la inversión hasta la planificación pasando por la digitalización de licencias

AI, Eventos

La IA amplifica los sesgos de género para las jóvenes: más frágiles, dependientes y con vocación a la salud

IA en femenino, Inteligencia Artificial

Convertir datos en impacto real

Eventos

Samsung impulsa la IA doméstica con ecosistemas abiertos en CES 2026

Actualidad, Eventos

Samsung presenta su Filosofía AI en el CES 2026

AI, Eventos

El CAIO Day reúne en Madrid a 330 líderes de IA y confirma el auge del nuevo rol estratégico en las empresas

Eventos, Inteligencia Artificial

RECIBE NUESTRA NEWSLETTER

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things