AI, Inteligencia Artificial

El modelo IA de Alibaba supera a los humanos en comprensión lectora

Triunfo para las máquinas en la batalla del hombre frente a la máquina.

El modelo de aprendizaje profundo de Alibaba este mes ha superando a los humanos por primera vez en una de las pruebas de comprensión lectora más exigentes del mundo.

El Instituto de Ciencia de Datos y Tecnologías (iDST) de Alibaba ha asegurado que su modelo de red neuronal profunda obtuvo 82.44 puntos en el conjunto de datos de respuesta de Stanford (SQuAD) el 11 de enero. Supera así la puntuación humana de 82.304 para Exact Match, es decir, proporcionando respuestas exactas a las preguntas. El SQuAD es un conjunto de datos de comprensión de lectura a gran escala compuesto por más de 100.000 pares de preguntas y respuestas en base a más de 500 artículos de Wikipedia.

«Es un gran honor para nosotros presenciar el hito en el que las máquinas superan a los humanos en comprensión lectora», dijo Luo Si, científico jefe de iDST para procesamiento de lenguaje natural. «Estamos encantados de ver que la investigación de NLP ha logrado un progreso significativo durante el año. Esperamos poder compartir nuestra metodología de construcción de modelos con la comunidad en general y exportar la tecnología a nuestros clientes en el futuro cercano«.

Modelo único

Los equipos que compiten en el desafío necesitan construir modelos de aprendizaje automático que puedan proporcionar respuestas a las preguntas en el conjunto de datos, como «¿qué causa la lluvia?». La precisión del modelo Alibaba estaba ligada a su capacidad de leer párrafos u oraciones por palabras, localizando frases precisas que contienen respuestas potenciales. Ese modelo, que aprovecha la red de atención jerárquica, se considera que tiene un fuerte valor comercial. Alibaba ha utilizado la tecnología subyacente en su 11.11 Global Shopping Festival durante varios años, con máquinas que responden a grandes cantidades de consultas de clientes entrantes.

Otros usos potenciales del servicio al cliente incluyen tutoriales para visitantes de museos y respuestas en línea a consultas de algunos pacientes médicos.

Una prueba de prestigio

La SQUAD es percibida como la mejor prueba de comprensión de lectura de máquinas del mundo y atrae universidades e institutos que van desde Google, Facebook, IBM, Microsoft hasta la Universidad Carnegie Mellon, la Universidad de Stanford y el Instituto de Investigación Allen.

Si bien su rendimiento SQuAD es un hito, es solo uno de los puntos de prueba realizados por el equipo de procesamiento de lenguaje natural de iDST recientemente. Otros éxitos incluyen los mejores puntajes y premios en la ACM CIKM Cup, que se enfoca en búsquedas personalizadas de comercio electrónico, diagnóstico de gramática china y tareas de clasificación de entidades con nombre inglés en la Text Analysis Conference, una serie de talleres organizados por el Instituto Nacional de EE. UU. de Estándares y Tecnología.

El iDST es el principal brazo de investigación de Alibaba centrado en la inteligencia artificial . Está muy relacionado con el procesamiento del lenguaje natural y la solución de problemas que conducen a aplicaciones del mundo real.

José Luis Arcángel

Licenciado en Periodismo por la Universidad Francisco de Vitoria. Redactor jefe de Big Data Magazine desde sus inicios en enero de 2018 y creador del espacio de podcasts Territorio Big Data y del Data&cIA Congress.

TE PUEDE GUSTAR

Soberanía cloud e innovación en IA, listas para escalar en la empresa europea

Aldana Balmaceda
12/02/2026

Capgemini ha anunciado que sus soluciones Cloud e inteligencia artificial preparadas para la soberanía ya están disponibles en AWS European Sovereign Cloud, una nube

Los equipos de ventas en España apuestan por la IA y los agentes como su gran motor de crecimiento en 2026

Aldana Balmaceda
11/02/2026

Salesforce, empresa mundial en CRM basado en IA, ha publicado la séptima edición del State of Sales, en el que refleja que la inteligencia

De la IA copiloto a la IA agéntica: las empresas cambiarán su forma de trabajar en 2026

Aldana Balmaceda
11/02/2026

La inteligencia artificial está a punto de dejar de “ayudar” para empezar a “hacer”. Softtek, empresa de soluciones tecnológicas globales, ha presentado este punto

Las empresas evolucionan la IA genérica: los copilotos se entrenan con el conocimiento interno

Aldana Balmaceda
10/02/2026

Las compañías están entrando en una nueva fase de madurez en el uso de la inteligencia artificial generativa. Según el informe “Uso de IA Generativa

Cloud e IA ganan protagonismo en la digitalización de la industria española de tamaño medio

Aldana Balmaceda
10/02/2026

Las empresas industriales españolas de tamaño medio muestran una actitud más avanzada hacia la transformación digital que la media europea, aunque el avance sigue

El desarrollo de la IA desata la guerra por los Project Manager de élite

Aldana Balmaceda
09/02/2026

Cuando el banco de inversión estadounidense JP MorganChase desplegó una suite interna tipo chatbot para decenas de miles de empleados en el verano de

EVENTOS

Convertir datos en impacto real

Eventos

Samsung impulsa la IA doméstica con ecosistemas abiertos en CES 2026

Actualidad, Eventos

Samsung presenta su Filosofía AI en el CES 2026

AI, Eventos

El CAIO Day reúne en Madrid a 330 líderes de IA y confirma el auge del nuevo rol estratégico en las empresas

Eventos, Inteligencia Artificial

22 medidas para que la IA fortalezca la democracia

Eventos, Inteligencia Artificial

Solo el 25% de mujeres desarrolla inteligencia artificial a nivel nacional

AI, Eventos

RECIBE NUESTRA NEWSLETTER

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things