Con los continuos avances en el aprendizaje automático, cada vez tiene menos sentido comparar la IA con la mente humana.
El habla y el lenguaje son fundamentales para la inteligencia humana, la comunicación y los procesos cognitivos. La comprensión del lenguaje natural se considera a menudo como el mayor desafío de la IA, uno que, si se resuelve, podría llevar a las máquinas mucho más cerca de la inteligencia humana.
En 2019, Microsoft y Alibaba anunciaron que habían construido mejoras para una tecnología de Google que superó a los humanos en una tarea de procesamiento de lenguaje natural (PNL) llamada comprensión de lectura. Esta noticia era algo oscura, pero yo la consideré un gran avance porque recordé lo que había ocurrido cuatro años antes.
En 2015, investigadores de Microsoft y Google desarrollaron sistemas basados en los inventos de Geoff Hinton y Yann Lecun que superaron a los humanos en el reconocimiento de imágenes. En aquel momento predije que las aplicaciones de visión por ordenador florecerían, y mi empresa realizó inversiones en una docena de empresas que creaban aplicaciones o productos de visión por ordenador. Hoy en día, estos productos se utilizan en el comercio minorista, la fabricación, la logística, la atención sanitaria y el transporte. Esas inversiones tienen ahora un valor de más de 20.000 millones de dólares.
Aprendizaje supervisado
Los algoritmos de PNL han dado lugar a un reconocimiento del habla y una traducción automática increíblemente precisos, que un día impulsarán un «traductor universal» como el descrito en Star Trek. La PNL también permite nuevas aplicaciones, como un motor de búsqueda preciso para responder a preguntas (la gran visión de Larry Page para Google) y la síntesis de contenidos específicos (lo que convertirá la actual publicidad específica en un juego de niños). Esto podría utilizarse en aplicaciones financieras, sanitarias, de marketing y de consumo. Desde entonces, nos hemos dedicado a invertir en empresas de PNL. Creo que podemos ver un mayor impacto de la PNL que de la visión por ordenador.
¿Cuál es la naturaleza de este avance de la PNL? Se trata de una tecnología llamada aprendizaje autosupervisado. Los algoritmos de PNL anteriores requerían la recopilación de datos y una minuciosa puesta a punto para cada dominio (como Amazon Alexa, o un chatbot de atención al cliente para un banco), lo cual es costoso y propenso a errores. Pero el entrenamiento autosupervisado funciona esencialmente con todos los datos del mundo, creando un modelo gigante que puede tener hasta varios billones de parámetros.
Este modelo gigante se entrena sin supervisión humana: una IA se «autoentrena» averiguando la estructura del lenguaje por sí misma. Luego, cuando se dispone de datos sobre un ámbito concreto, se puede ajustar el modelo gigante a ese ámbito y utilizarlo para cosas como la traducción automática, la respuesta a preguntas y el diálogo natural. El ajuste fino tomará partes del modelo gigante de forma selectiva, y requiere muy pocos ajustes. Es algo parecido a cómo los humanos aprenden primero un idioma y luego, sobre esa base, aprenden conocimientos o cursos específicos.
Desde el avance de 2019, hemos visto cómo los modelos de PNL gigantes aumentan rápidamente de tamaño (unas 10 veces al año), con las correspondientes mejoras de rendimiento. También hemos visto demostraciones asombrosas, como GPT-3, que podría escribir en el estilo de cualquier persona (como el estilo del Dr. Seuss), o Google Lambda, que conversa de forma natural con el habla humana, o una startup china llamada Langboat que genera material de marketing de forma diferente para cada persona.
¿Estamos a punto de resolver el problema del lenguaje natural? Los escépticos afirman que estos algoritmos se limitan a memorizar todos los datos del mundo y recuerdan subconjuntos de forma inteligente, pero no comprenden y no son verdaderamente inteligentes. La inteligencia humana se basa en la capacidad de razonar, planificar y ser creativo.
Pronto, el aprendizaje profundo y sus extensiones superarán a los humanos en un número cada vez mayor de tareas, pero seguirá habiendo muchas tareas que los humanos pueden manejar mucho mejor que el aprendizaje profundo.