Una plataforma del Big Data permite acelerar el análisis del ADN

La plataforma de Big Data se conoce como ElPrep5 y está dirigida a usuarios de la industria farmacéutica, de la investigación científica y laboratorios médicos, entre otros.

Una plataforma del Big Data permite acelerar el análisis del ADN. Denominada ElPrep5, la plataforma está dirigida a usuarios de la industria farmacéutica, investigación científica, laboratorios médicos, proveedores de servicios de secuenciación, proveedores de secuenciación y hospitales.

ElPrep5 puede realizar análisis de ADN de ocho a 16 veces más rápido que el conjunto de herramientas de análisis del genoma (GATK) ampliamente utilizado, desde la preparación de datos hasta la llamada de variantes en una infraestructura de hardware similar.

Reescritura de la secuenciación

El científico principal de Imec, Roel Wuyts, asegura  que la ventaja de rendimiento de ElPrep5 proviene de una reescritura del proceso de secuenciación. La arquitectura de software de ElPrep fusiona internamente la ejecución de los pasos seleccionados por el usuario, paraleliza en gran medida los algoritmos y las implementaciones de estos pasos y aprovecha al máximo las grandes capacidades de memoria cuando están disponibles. Es especialmente la integración de estas tres técnicas lo que da como resultado esta rápida velocidad de ejecución.

“Esta integración también implica que el usuario final formula toda una línea de secuenciación como una única invocación de línea de comandos. Esto hace que ElPrep5 sea significativamente más fácil de usar que el enfoque más común de tener que escribir múltiples herramientas diferentes para implementar los distintos pasos de una canalización ”, agregó.

Con código abierto

ElPrep5 está escrito en Go, un lenguaje de programación de código abierto desarrollado por Google, y puede ejecutarse en servidores estándar que la mayoría de los hospitales tienen localmente o en la nube. La elección de Go surgió de un estudio que descubrió que tiene el mejor equilibrio entre el rendimiento en tiempo de ejecución y el uso de memoria en comparación con C ++ y Java.

“Este es el gran avance que hemos estado anticipando durante años. Por último, podemos ejecutar todo el proceso de análisis de ADN con una única solución de plataforma de software y más rápido que nunca ”, dijo Charlotte Herzeel, investigadora de Imec.

Debido a que la llamada de variantes es el paso más complejo, la recopilación de resultados hasta 16 veces más rápido que el método anterior ha dado como resultado una reducción de cuatro a nueve veces en el tiempo, todo mientras se conservan resultados idénticos a GATK.

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

TE PUEDE GUSTAR

EVENTOS

RECIBE LA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Ir arriba