Se ha desarrollado una nueva técnica de inteligencia artificial que sólo propone moléculas candidatas que pueden producirse realmente en un laboratorio.
Las empresas farmacéuticas están utilizando la inteligencia artificial para agilizar el proceso de descubrimiento de nuevos medicamentos. Los modelos de aprendizaje automático pueden proponer nuevas moléculas con propiedades específicas que podrían combatir determinadas enfermedades, logrando en minutos lo que a los humanos les llevaría meses conseguir manualmente.
Pero hay un obstáculo importante que frena estos sistemas: Los modelos suelen sugerir nuevas estructuras moleculares que son difíciles o imposibles de producir en un laboratorio. Si un químico no puede fabricar la molécula, no se pueden probar sus propiedades para combatir enfermedades.
Un nuevo enfoque de los investigadores del MIT restringe un modelo de aprendizaje automático para que sólo sugiera estructuras moleculares que puedan sintetizarse. El método garantiza que las moléculas están compuestas por materiales que pueden comprarse y que las reacciones químicas que se producen entre esos materiales siguen las leyes de la química.
En comparación con otros métodos, su modelo propuso estructuras moleculares que obtuvieron una puntuación tan alta, si no más, en las evaluaciones populares, al tiempo que se garantizaba que eran sintetizables. Además, su sistema tarda menos de un segundo en proponer una vía de síntesis, mientras que otros métodos que proponen moléculas por separado y luego evalúan su capacidad de síntesis pueden tardar varios minutos. Este ahorro de tiempo se suma a un espacio de búsqueda con miles de millones de moléculas potenciales.
«Este proceso reformula la forma en que pedimos a estos modelos que generen nuevas estructuras moleculares. Muchos de estos modelos piensan en construir nuevas estructuras moleculares átomo a átomo o enlace a enlace. En cambio, nosotros estamos construyendo nuevas moléculas bloque a bloque y reacción a reacción», afirma Connor Coley, profesor asistente de desarrollo profesional Henri Slezynger en los departamentos de Ingeniería Química e Ingeniería Eléctrica e Informática del MIT, y autor principal del artículo.
Junto a Coley participan en el trabajo el primer autor, Wenhao Gao, estudiante de posgrado, y Rocío Mercado, posdoctoral. La investigación se presentó recientemente en la Conferencia Internacional sobre el Aprendizaje de Representaciones.
Construyendo bloques
Para crear una estructura molecular, el modelo simula el proceso de síntesis de una molécula para asegurarse de que puede producirse.
El modelo recibe un conjunto de bloques de construcción viables, que son productos químicos que pueden comprarse, y una lista de reacciones químicas válidas con las que trabajar. Estas plantillas de reacciones químicas están hechas a mano por expertos. El control de estas entradas, permitiendo sólo determinadas sustancias químicas o reacciones específicas, permite a los investigadores limitar el espacio de búsqueda de una nueva molécula.
El modelo utiliza estas entradas para construir un árbol seleccionando bloques de construcción y enlazándolos a través de reacciones químicas, de uno en uno, para construir la molécula final. En cada paso, la molécula se vuelve más compleja a medida que se añaden más sustancias químicas y reacciones.
Se obtiene tanto la estructura molecular final como el árbol de sustancias químicas y reacciones que la sintetizan.
«En lugar de diseñar directamente la molécula del producto en sí, diseñamos una secuencia de acción para obtener esa molécula. Esto nos permite garantizar la calidad de la estructura», afirma Gao.
Para entrenar su modelo, los investigadores introducen una estructura molecular completa y un conjunto de bloques de construcción y reacciones químicas, y el modelo aprende a crear un árbol que sintetiza la molécula. Tras ver cientos de miles de ejemplos, el modelo aprende a crear estas vías de síntesis por sí mismo.
Optimización de la molécula
El modelo entrenado puede utilizarse para la optimización. Los investigadores definen ciertas propiedades que quieren conseguir en una molécula final, dados ciertos bloques de construcción y plantillas de reacción química, y el modelo propone una estructura molecular sintetizable.
«Lo sorprendente es la gran cantidad de moléculas que se pueden reproducir con un conjunto de plantillas tan pequeño. No se necesitan tantos bloques de construcción para generar una gran cantidad de espacio químico disponible para que el modelo busque», dice Mercado.
Probaron el modelo evaluando su capacidad para reconstruir moléculas sintetizables. Fue capaz de reproducir el 51 por ciento de estas moléculas, y tardó menos de un segundo en recrear cada una. Su técnica es más rápida que otros métodos porque el modelo no busca entre todas las opciones de cada paso del árbol. Tiene un conjunto definido de sustancias químicas y reacciones con las que trabajar, explica Gao.