El mapa más completo de las proteínas humanas ‘made in’ IA

Investigadores consiguen descifrar la estructura de más de 20.000 proteínas humanas, más del doble de las disponibles hasta ahora.

El mapa más completo de las proteínas humanas se ha conseguido gracias a la Inteligencia Artificial. Este mapa servirá para secuenciar el genoma humano y se podría utilizar para descubrir nuevas enfermedades.

La idea ha surgido del laboratorio de investigación DeepMind, en asociación con el Instituto Europeo de Bioinformática de EMBL (EMBL-EBI).

A través de la Inteligencia Artificial, los investigadores han conseguido descifrar la estructura de más de 20.000 proteínas humanas, más del doble del número disponible hasta ahora, así como de casi todas las proteínas producidas por 20 organismos de referencia.

Método computacional

Los resultados de la investigación se han publicado en un artículo de la revista Nature. En él se habla del primer método computacional que puede predecir regularmente estructuras de proteínas con precisión atómica, incluso cuando no se conoce una estructura similar.

Actualmente, hay alrededor de 180.000 estructuras de proteínas disponibles que son dominio público, cada una producida mediante métodos experimentales y accesibles a través del Protein Data Bank.

Herramienta de aprendizaje automático

La clave para alcanzar dichos resultados ha sido una herramienta de aprendizaje automático llamada AlphaFold, basada en redes neuronales.

Hace un año, AlphaFold ya había resuelto uno de los mayores desafíos de los últimos 50 años: cómo las proteínas se pliegan en formas 3D. Este programa de IA fue capaz de predecir estas estructuras a partir de sus secuencias de aminoácidos.

Para el nuevo desarrollo, AlphaFold fue instruido en secuencias de ADN y en las formas ya conocidas de decenas de miles de proteínas, contenidas en una base de datos de proteínas de acceso público alojada por los investigadores de EBI-EMBL.

En el artículo se detalla que la última versión de AlphaFold se sustenta en un nuevo enfoque de aprendizaje automático que incorpora conocimientos físicos y biológicos sobre la estructura de las proteínas, aprovechando las alineaciones de múltiples secuencias.

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

TE PUEDE GUSTAR

EVENTOS

RECIBE LA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Ir arriba