El modelo IA de Alibaba supera a los humanos en comprensión lectora

Triunfo para las máquinas en la batalla del hombre frente a la máquina.

El modelo de aprendizaje profundo de Alibaba este mes ha superando a los humanos por primera vez en una de las pruebas de comprensión lectora más exigentes del mundo.

El Instituto de Ciencia de Datos y Tecnologías (iDST) de Alibaba ha asegurado que su modelo de red neuronal profunda obtuvo 82.44 puntos en el conjunto de datos de respuesta de Stanford (SQuAD) el 11 de enero. Supera así la puntuación humana de 82.304 para Exact Match, es decir, proporcionando respuestas exactas a las preguntas. El SQuAD es un conjunto de datos de comprensión de lectura a gran escala compuesto por más de 100.000 pares de preguntas y respuestas en base a más de 500 artículos de Wikipedia.

«Es un gran honor para nosotros presenciar el hito en el que las máquinas superan a los humanos en comprensión lectora», dijo Luo Si, científico jefe de iDST para procesamiento de lenguaje natural. «Estamos encantados de ver que la investigación de NLP ha logrado un progreso significativo durante el año. Esperamos poder compartir nuestra metodología de construcción de modelos con la comunidad en general y exportar la tecnología a nuestros clientes en el futuro cercano«.

Modelo único

Los equipos que compiten en el desafío necesitan construir modelos de aprendizaje automático que puedan proporcionar respuestas a las preguntas en el conjunto de datos, como «¿qué causa la lluvia?». La precisión del modelo Alibaba estaba ligada a su capacidad de leer párrafos u oraciones por palabras, localizando frases precisas que contienen respuestas potenciales. Ese modelo, que aprovecha la red de atención jerárquica, se considera que tiene un fuerte valor comercial. Alibaba ha utilizado la tecnología subyacente en su 11.11 Global Shopping Festival durante varios años, con máquinas que responden a grandes cantidades de consultas de clientes entrantes.

Otros usos potenciales del servicio al cliente incluyen tutoriales para visitantes de museos y respuestas en línea a consultas de algunos pacientes médicos.

Una prueba de prestigio

La SQUAD es percibida como la mejor prueba de comprensión de lectura de máquinas del mundo y atrae universidades e institutos que van desde Google, Facebook, IBM, Microsoft hasta la Universidad Carnegie Mellon, la Universidad de Stanford y el Instituto de Investigación Allen.

Si bien su rendimiento SQuAD es un hito, es solo uno de los puntos de prueba realizados por el equipo de procesamiento de lenguaje natural de iDST recientemente. Otros éxitos incluyen los mejores puntajes y premios en la ACM CIKM Cup, que se enfoca en búsquedas personalizadas de comercio electrónico, diagnóstico de gramática china y tareas de clasificación de entidades con nombre inglés en la Text Analysis Conference, una serie de talleres organizados por el Instituto Nacional de EE. UU. de Estándares y Tecnología.

El iDST es el principal brazo de investigación de Alibaba centrado en la inteligencia artificial . Está muy relacionado con el procesamiento del lenguaje natural y la solución de problemas que conducen a aplicaciones del mundo real.

TE PUEDE GUSTAR

EVENTOS

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Scroll al inicio