La IA es una poderosa herramienta para la ciencia y la medicina.
Ahora que todo el mundo, desde Geoffrey Hinton a Elon Musk, pasando por Yuval Noah Harari, se ha pronunciado en contra del ChatGPT, parece un buen momento para recordarnos el enorme potencial de la inteligencia artificial para hacer avanzar el conocimiento y aliviar el sufrimiento humano. Si la inteligencia artificial va a ser el malo de la película, debemos caracterizarla con sus matices y contradicciones, sus objetivos previsibles y sus habilidades relevantes, sus lados oscuros políticos y, sí, sus luces científicas.
La mayor aportación de la inteligencia artificial a la ciencia ha sido AlphaFold, un algoritmo de la firma londinense DeepMind adquirido por Google hace años. Para entenderlo, repasemos biología básica. Hay 20 aminoácidos diferentes, y todas las proteínas están formadas por una cadena de ellos, en cualquier orden. El orden, o secuencia, determina la forma final de la proteína: algunos aminoácidos tienen cargas eléctricas positivas y otros negativas; a algunos les gusta el agua y a otros no; algunos son grandes y otros pequeños. Todos esos atributos se unen para formar una forma tridimensional definida, que es extremadamente difícil de predecir. AlphaFold ha deducido 200 millones de formas de proteínas utilizando secuencias de aminoácidos.
Los algoritmos ayudan al mundo de la ciencia
Veamos ahora el diseño de las proteínas. Hay 20 aminoácidos. Las posibles secuencias de dos aminoácidos son 20 al cuadrado, y para tres aminoácidos, hay 20 posibilidades al cubo. Las posibilidades de una secuencia de 300 aminoácidos -una proteína típica- son 20 a la potencia 300, un número que ni siquiera podemos imaginar. A pesar de que la evolución lleva trabajando en este planeta casi cuatro mil millones de años, la fracción de secuencias que se han intentado es minúscula. Si la política es el arte de lo posible, la biología es el arte de lo pasable: cuando algo resuelve el problema inmediato que tenemos entre manos, la evolución no mira más allá. Pero en los vastos territorios inexplorados por la Madre Naturaleza yacen tesoros que la inteligencia artificial pone ahora a nuestro alcance.
Las proteínas, como los genes que las codifican, son textos, por lo que pueden manejarse con los mismos grandes modelos lingüísticos que utiliza ChatGPT. El informático Ali Madani y sus compañeros han demostrado cómo utilizar estos modelos de lenguaje para generar proteínas con nuevas secuencias. Llevados al mundo real, pueden utilizarse para distintos fines, como catalizar reacciones químicas o bloquear proteínas naturales. Un nuevo algoritmo llamado Chroma, de la empresa Generate, mejora las predicciones de interacciones a larga distancia dentro de una misma proteína. Hay otra media docena de empresas que trabajan en la misma línea.