La plataforma de Big Data se conoce como ElPrep5 y está dirigida a usuarios de la industria farmacéutica, de la investigación científica y laboratorios médicos, entre otros.
En el mundo de la biotecnología, un nombre destaca: ElPrep5, una potente plataforma de Big Data diseñada para revolucionar el análisis del ADN. Este innovador recurso se dirige no solo a la industria farmacéutica, sino también a la investigación científica, laboratorios médicos y proveedores de servicios de secuenciación.
Lo más destacado de ElPrep5 radica en su capacidad para acelerar el análisis genético. En comparación con las herramientas convencionales de análisis del genoma, como GATK, ElPrep5 es capaz de realizar análisis de ADN de ocho a dieciséis veces más rápido. Este sorprendente logro se extiende desde la preparación de los datos hasta la identificación de variantes, todo ello en una infraestructura de hardware similar.
Reescritura del proceso de secuenciación
Roel Wuyts, científico principal de Imec, revela que la ventaja de rendimiento de ElPrep5 proviene de una reescritura innovadora del proceso de secuenciación. La arquitectura de software fusiona internamente los pasos elegidos por el usuario, permitiendo una paralelización efectiva de algoritmos y sus implementaciones. Además, aprovecha al máximo las capacidades de memoria cuando están disponibles. La combinación de estas técnicas es la clave detrás de la notable velocidad de ejecución.
Wuyts agrega: «Esta integración también implica que el usuario formula toda una línea de secuenciación como una única invocación de línea de comandos, haciendo que ElPrep5 sea mucho más fácil de usar en comparación con los enfoques tradicionales que implican escribir múltiples herramientas para implementar diferentes pasos de una canalización». Un enfoque simplificado que impulsa la eficiencia y la accesibilidad.
Una aplicación de código abierto
ElPrep5 está desarrollado en Go, un lenguaje de programación de código abierto de Google, y puede ejecutarse en servidores estándar que la mayoría de los hospitales tienen en sus instalaciones o en la nube. La elección de Go proviene de un estudio exhaustivo que demostró su equilibrio óptimo entre rendimiento en tiempo de ejecución y uso de memoria en comparación con otros lenguajes como C++ y Java.
La investigadora de Imec, Charlotte Herzeel, señala con entusiasmo: «Este avance es lo que hemos esperado durante años. Finalmente, podemos realizar todo el proceso de análisis de ADN con una única solución de plataforma de software, ¡y de una manera más rápida que nunca!». Con la llamada de variantes, el paso más complejo, ejecutándose hasta 16 veces más rápido, se logra una reducción impresionante de cuatro a nueve veces en el tiempo total, manteniendo resultados idénticos a GATK.
En resumen, ElPrep5 representa una evolución destacada en la secuenciación de ADN, agilizando significativamente un proceso esencial para avances médicos y científicos fundamentales. Este hito promete abrir nuevas puertas en la investigación genética y el diagnóstico, allanando el camino hacia un futuro más eficiente y prometedor en la biotecnología.