Actualidad, AI, Inteligencia Artificial

La IA logra una precisión del 97%

La inteligencia artificial consigue una precisión casi total al procesar datos, según un estudio.

La comprensión del lenguaje natural ha sido durante mucho tiempo uno de los principales objetivos de la investigación en IA. Al principio, los investigadores intentaron programar manualmente todo lo que una máquina necesitaría para dar sentido a las noticias, la ficción o cualquier otra cosa que los humanos pudieran escribir. Este enfoque, como demostró Watson, fue inútil: es imposible escribir todos los hechos, reglas y suposiciones no escritas que se necesitan para comprender un texto.

Más recientemente, se ha establecido un nuevo paradigma: En lugar de incorporar conocimientos explícitos, dejamos que las máquinas aprendan a entender el lenguaje por sí mismas, simplemente ingiriendo grandes cantidades de texto escrito y aprendiendo a predecir palabras. El resultado es lo que los investigadores llaman un modelo lingüístico. Cuando se basan en grandes redes neuronales, como la GPT-3 de OpenAI, estos modelos pueden generar una prosa increíblemente humana (¡y poesía!) y aparentemente realizar sofisticados razonamientos lingüísticos.

Tratamiento lingüístico

Pero, ¿ha trascendido el GPT-3, entrenado con textos de miles de páginas web, libros y enciclopedias, el barniz de Watson? ¿Entiende realmente el lenguaje que genera y sobre el que aparentemente razona? Este es un tema de gran desacuerdo en la comunidad de investigadores de IA. Estas discusiones solían ser competencia de los filósofos, pero en la última década la IA ha salido de su burbuja académica para entrar en el mundo real, y su falta de comprensión de ese mundo puede tener consecuencias reales y a veces devastadoras. En un estudio, se descubrió que Watson de IBM proponía «múltiples ejemplos de recomendaciones de tratamiento inseguras e incorrectas». Otro estudio demostró que el sistema de traducción automática de Google cometía errores significativos cuando se utilizaba para traducir instrucciones médicas para pacientes que no hablaban inglés.

¿Cómo podemos determinar en la práctica si una máquina puede entender? En 1950, el pionero de la informática Alan Turing trató de responder a esta pregunta con su famoso «juego de imitación», ahora llamado test de Turing. Una máquina y un humano, ambos ocultos a la vista, competirían para convencer a un juez humano de su humanidad utilizando únicamente la conversación. Si el juez no podía distinguir cuál era el humano, entonces, afirmaba Turing, deberíamos considerar que la máquina pensaba y, en efecto, entendía.

Por desgracia, Turing subestimó la propensión de los humanos a dejarse engañar por las máquinas. Incluso los chatbots más sencillos, como Eliza, la psicoterapeuta falsa de Joseph Weizenbaum de los años 60, han engañado a la gente haciéndoles creer que estaban conversando con un ser comprensivo, incluso cuando sabían que su interlocutor era una máquina.

En un artículo de 2012, los informáticos Hector Levesque, Ernest Davis y Leora Morgenstern propusieron una prueba más objetiva, a la que llamaron el desafío del esquema de Winograd. Desde entonces, esta prueba se ha adoptado en la comunidad lingüística de la IA como una forma, y quizá la mejor, de evaluar la comprensión de las máquinas, aunque, como veremos, no es perfecta. Un esquema Winograd, llamado así por el investigador del lenguaje Terry Winograd, consiste en un par de frases, que difieren exactamente en una palabra, cada una de ellas seguida de una pregunta.

Sin embargo, la capacidad de los programas de IA para resolver los esquemas de Winograd aumentó rápidamente debido a la aparición de grandes modelos lingüísticos de redes neuronales. Un documento de 2020 de OpenAI informó de que GPT-3 acertó en casi el 90% de las frases de un conjunto de referencia de esquemas de Winograd. Otros modelos lingüísticos han obtenido resultados aún mejores tras un entrenamiento específico en estas tareas. En el momento de escribir este artículo, los modelos lingüísticos de redes neuronales han logrado una precisión de alrededor del 97% en un conjunto concreto de esquemas de Winograd que forman parte de una competición de comprensión lingüística de la IA conocida como SuperGLUE. Esta precisión es prácticamente igual a la del rendimiento humano.

Samuel Rodríguez

Periodista a cargo de Ecommerce News desde 2012. Inquieto. En el camino, creé otros medios, como @BigDataMagazine y @CybersecurityNews. Organizador de cientos de eventos profesionales. Ahora con un pie en Portugal y otro en México... Muy del @GetafeCF

TE PUEDE GUSTAR

La IA está reinventando la Búsqueda y el comportamiento de los consumidores

Aldana Balmaceda
04/05/2025

Debbie Weinstein, presidenta de Google para Europa, Oriente Medio y África (EMEA), lidera la colaboración con empresas y gobiernos para promover el crecimiento mediante

La IA generará más de 3M de empleos y automatizará hasta 60% de tareas en España

Aldana Balmaceda
04/05/2025

El 1 de mayo, se celebró el Día del Trabajador, una fecha clave para reflexionar sobre los derechos y necesidades de los empleados. Este

Samsung amplía el acceso directo al asistente de IA con el botón lateral en la serie Galaxy A

Aldana Balmaceda
29/04/2025

Samsung Electronics Co., Ltd. ha anunciado esta semana que una selección de dispositivos de la serie Galaxy A pronto serán compatibles con la activación

El 76% de las pymes españolas urge implantar IA para no quedarse atrás

Aldana Balmaceda
27/04/2025

En los últimos meses están surgiendo numerosas soluciones innovadoras que han sorprendido a los expertos del sector industrial por la aplicación avanzada de la

Adobe presenta nuevas herramientas de vídeo basadas en IA en Adobe Express y más

Aldana Balmaceda
24/04/2025

Ayer, en la conferencia creativa MAX de Londres, Adobe ha anunciado todas las nuevas funciones de Adobe Express para editar y generar secuencias de

Ayuso en #AIAMSummit25: “La IA debe centrarse en la libertad y la vida”

Aldana Balmaceda
24/04/2025

La aplicación de la inteligencia artificial de forma efectiva y sostenible en las instituciones ha sido el tema central de la clausura de la

EVENTOS

El auge de la inteligencia artificial y la aplicabilidad de las tecnologías, claves del Mobile World Congress 2025

Eventos, Inteligencia Artificial

Combinando el BIG DATA y la IA para impulsar el futuro

AI, Data, Eventos

Las empresas aumentarán sus presupuestos destinados a IA un 23% en 2025

Eventos

El 58% de los CIOs señala la IA generativa como una de sus principales prioridades

Eventos

La inteligencia artificial cuántica, entre las tendencias que transformarán las tecnologías de IA

Eventos

Aplicaciones de identidad digital, economía circular, logística, tokenización e inversión en activos digitales, entre los proyectos finalistas de los ‘Blockchain Awards’

Eventos

RECIBE NUESTRA NEWSLETTER

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things