El modelo IA de Alibaba supera a los humanos en comprensión lectora

23 enero, 2018
472 Visualizaciones

Triunfo para las máquinas en la batalla del hombre frente a la máquina.

El modelo de aprendizaje profundo de Alibaba este mes ha superando a los humanos por primera vez en una de las pruebas de comprensión lectora más exigentes del mundo.

El Instituto de Ciencia de Datos y Tecnologías (iDST) de Alibaba ha asegurado que su modelo de red neuronal profunda obtuvo 82.44 puntos en el conjunto de datos de respuesta de Stanford (SQuAD) el 11 de enero. Supera así la puntuación humana de 82.304 para Exact Match, es decir, proporcionando respuestas exactas a las preguntas. El SQuAD es un conjunto de datos de comprensión de lectura a gran escala compuesto por más de 100.000 pares de preguntas y respuestas en base a más de 500 artículos de Wikipedia.

«Es un gran honor para nosotros presenciar el hito en el que las máquinas superan a los humanos en comprensión lectora», dijo Luo Si, científico jefe de iDST para procesamiento de lenguaje natural. «Estamos encantados de ver que la investigación de NLP ha logrado un progreso significativo durante el año. Esperamos poder compartir nuestra metodología de construcción de modelos con la comunidad en general y exportar la tecnología a nuestros clientes en el futuro cercano«.

Modelo único

Los equipos que compiten en el desafío necesitan construir modelos de aprendizaje automático que puedan proporcionar respuestas a las preguntas en el conjunto de datos, como «¿qué causa la lluvia?». La precisión del modelo Alibaba estaba ligada a su capacidad de leer párrafos u oraciones por palabras, localizando frases precisas que contienen respuestas potenciales. Ese modelo, que aprovecha la red de atención jerárquica, se considera que tiene un fuerte valor comercial. Alibaba ha utilizado la tecnología subyacente en su 11.11 Global Shopping Festival durante varios años, con máquinas que responden a grandes cantidades de consultas de clientes entrantes.

Otros usos potenciales del servicio al cliente incluyen tutoriales para visitantes de museos y respuestas en línea a consultas de algunos pacientes médicos.

Una prueba de prestigio

La SQUAD es percibida como la mejor prueba de comprensión de lectura de máquinas del mundo y atrae universidades e institutos que van desde Google, Facebook, IBM, Microsoft hasta la Universidad Carnegie Mellon, la Universidad de Stanford y el Instituto de Investigación Allen.

Si bien su rendimiento SQuAD es un hito, es solo uno de los puntos de prueba realizados por el equipo de procesamiento de lenguaje natural de iDST recientemente. Otros éxitos incluyen los mejores puntajes y premios en la ACM CIKM Cup, que se enfoca en búsquedas personalizadas de comercio electrónico, diagnóstico de gramática china y tareas de clasificación de entidades con nombre inglés en la Text Analysis Conference, una serie de talleres organizados por el Instituto Nacional de EE. UU. de Estándares y Tecnología.

El iDST es el principal brazo de investigación de Alibaba centrado en la inteligencia artificial . Está muy relacionado con el procesamiento del lenguaje natural y la solución de problemas que conducen a aplicaciones del mundo real.

Te podría interesar

El crecimiento diario de información requiere tecnologías específicas para asegurar la Calidad del Dato
Actualidad
24 compartido1,314 visualizaciones
Actualidad
24 compartido1,314 visualizaciones

El crecimiento diario de información requiere tecnologías específicas para asegurar la Calidad del Dato

Vicente Ramírez - 15 octubre, 2018

DEYDE recomienda una serie de tecnologías, roles y enfoques que facilitarán la gestión de la información y ayudan a las empresas a conseguir sus objetivos de inteligencia…

La conversión del sector metalúrgico español a Industria 4.0 permitiría incrementar su ratio de eficiencia un 16%
Smart City
14 compartido1,463 visualizaciones
Smart City
14 compartido1,463 visualizaciones

La conversión del sector metalúrgico español a Industria 4.0 permitiría incrementar su ratio de eficiencia un 16%

Mónica Gallego - 14 diciembre, 2018

La conversión del sector metalúrgico español en industria 4.0 permitiría incrementar, al menos, en un 16% la ratio de eficiencia de este sector, según un análisis desarrollado…

Arranca el desafío analítico para las científicas de datos con el Datathon WiDS 2019
BD Network
18 compartido2,334 visualizaciones
BD Network
18 compartido2,334 visualizaciones

Arranca el desafío analítico para las científicas de datos con el Datathon WiDS 2019

Mónica Gallego - 5 febrero, 2019

Woman in Data Science es el Datathon que tendrá lugar el próximo 27 de febrero y consiste en crear un modelo que pueda detectar plantaciones de aceite de…

Dejar comentario

Su email no será publicado

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.