Obtener la secuencia genómica del ADN de las personas, analizarla y encuadrarla en proyectos para la mejora de la salud de la población es el objetivo principal del Centro Nacional de Análisis Genómico (CNAG-CRG). Ubicado en Barcelona, los proyectos de este centro alcanzan desde horizontes sanitarios, como el estudio del cáncer o las enfermedades raras, hasta áreas como la agricultura o la conservación de especies. “El ADN es el disco duro de las células”, explica Ivo Gut, director del CNAG-CRG. “Un genoma humano contiene 3.300 millones de bases” calcula para intentar ofrecer una idea de la tarea, ingente, que se hace en este centro español. Se trata de analizarlo y hallar la variación que distingue a unos genomas de otros (contabilizada en el 0,1 % de su composición ya que el 99,9 % de los genomas humanos es idéntico). Detectar ese pírrica diferencia es la base de toda su labor ya que, una vez detectada e identificada esta características genética, es posible aplicarla al desarrollo de tratamientos específicos para determinadas enfermedades o como apoyo inestimable a los análisis clínicos.
La tecnología juega un papel esencial en esta tarea ya que con unas analíticas tan complejas, resulta esencial el uso de una plataforma informática potente. El centro, que se creó en 2009, ha alcanzado una actividad de “procesamiento” difícil de imaginar para un neófito. Su capacidad de secuenciación alcanza, cada día, más de 2 billones de bases de ADN, lo que da como resultado que diariamente “salen” del centro 20 secuencias genómicas “individuales”. “Cada día se generan 30 TB de información que hay que saber organizar y analizar”, asegura Ivo Gut. Para hacerlo posible, el centro dispone de doce secuenciadores, capaces de producir más de 2.000 GB de datos de secuenciación. Esta docena de máquinas suministran los datos genómicos a un centro de procesamiento de datos que exhibe 7,6 PT de almacenamiento y 3.500 nódulos, repartidos en diferentes tipos de servidores (unos con tareas de computación, otros para fines de almacenamiento), todos ellos con procesadores Intel Xeon E5, y que está administrado y diseñado por el Barcelona SuperComputing Center (BSC), en el que participa, entre otros proveedores, Intel. “El nivel de computación actual de nuestro centro es muy superior a nuestra actividad de secuenciación genética”, explica Gut.
La contribución de Intel, basada en la potencia de sus procesadores, ha sido clave para optimizar los procesos que conducen a esta secuenciación genómica, basada en analíticas de datos de alto rendimiento (HPDA).
Una tecnología que no sólo vale para almacenar y aumentar la capacidad de los procesos. Según explica Sergi Beltrán, director de bioinformática del CNAG-CRG, un desarrollo más eficiente y la optimización de los análisis ha permitido que de las 450 horas que se tardaba en el análisis de un genoma se ha pasado a las 4,5. “Sin perder calidad”, especifica. “Y haciendo uso de herramientas estándar”. Beltrán prevé que en un tiempo no muy largo la secuenciación del genoma estará a la orden del día y se integrará en el sistema de salud. “El gran reto no es acortar el tiempo de secuenciar un solo genoma sino ser capaces de universalizar este protocolo para desarrollar análisis de secuenciación a escala industrial, con posibilidad de repetir un análisis varias veces si así se requiere”, explica.
El tiempo medio en el que el CNAG-CRG es capaz de retornar resultados a partir de un análisis de una secuenciación genómica son 15 días (desde que se reciben las muestras a analizar hasta que se pueden emitir estos resultados). A juicio de los expertos, la tecnología, en el futuro, permitirá realizar 100 o 200 análisis genómicos cada día.
Dos proyectos de referencia
El centro colabora con importantes centros internacionales en el desarrollo de proyectos concretos. Con el Consorcio Internacional del Genoma del Cáncer (ICGC), por ejemplo, se trataba de secuenciar más de 50 cánceres diferentes en el mundo. El centro español se encargó de analizar la leucemia linfática crónica (CLL) secuenciando 500 pacientes con este cáncer, consiguiéndolos clasificar, además, en diferentes subtipos. Es un proyecto que se prevé que concluirá en un par de años, alcanzando el análisis de 25.000 genomas. “Se han logrado identificar algunas razones de por qué se produce este tipo de leucemia”, asegura Gut. “Si se identifican los enfermos con esta mutación determinada, será posible aplicarles un tratamiento concreto”.
También está trabajando con el Consorcio Internacional de Investigaciones sobre Enfermedades Raras (IRDiRC). Hay más de 6.000 de estas patologías en el mundo, que afectan a menos de una persona cada 2.000, lo que da una población enferma cercana a los 30 millones de personas en Europa. “Identificar las variaciones que pueden explicar el desarrollo de una enfermedad no es sencillo y, en el caso del cáncer, por ejemplo, se logra comparando el genoma del tumor con el normal”, explica Beltrán. “Sin embargo, en el caso de que se estudien las enfermedades raras no es posible la comparación; por tanto hay que encontrar la mutación que la causa”. Se requieren, por tanto, buenos datos, buenas analíticas y buenas herramientas. “Para llegar a encontrar la mutación que provoca la enfermedad es fundamental agrupar diferentes tipos de datos procedentes de fuentes distintas: clínicos codificados, genómicos, muestras, etc.”.
A juicio de Beltrán todo esto conducirá a la medicina personalizada y a que, cada paciente, pueda recibir un tratamiento a su medida gracias a este análisis genómico. “Ya está empezando y el sistema de salud está desarrollando proyectos piloto de investigación en estos apartados”, asegura. “En los próximos 5 o 10 años el desarrollo va a ser brutal”.
La tarea del CNAG-CRG es llevar a cabo un perfecto protocolo de la secuenciación del genoma y, con el análisis posterior del mismo comparándolo con otras muestras, mejorar el servicio a los enfermos. Ahora bien, el último paso, que sería la aplicación del tratamiento y el análisis clínico requiere el concurso, imprescindible, de un médico. “Con toda la información recogida y analizada convenientemente, es posible proponer comportamientos y por tanto tratamientos”, explica Gut.
El CNAG-CRG ofrece apoyo a unos 120 investigadores que realizan cerca de 300 proyectos cada año. Se reciben peticiones de secuenciación de genomas tanto por parte de hospitales privados como públicos españoles para diferentes propósitos clínicos.
Intel y la sanidad
La vinculación de Intel con el entorno de la salud alcanza tres ámbitos. El más tradicional hace referencia a la infraestructura tecnológica de los centros sanitarios y los hospitales. “El objetivo es la mejora en la atención del paciente”, recuerda Carlos Clerencia, director general de Intel en España y Portugal. “Los centros españoles están a la cabeza de los países europeos en este apartado”, asegura, basándose en un estudio externo realizado en Europa para medir este parámetro.
La gestión fuera del hospital es el segundo entorno en el que opera la multinacional. “Está relacionada con los sistemas de monitorización de los pacientes en los domicilios o la adopción de dispositivos que controlan la salud, por ejemplo”. Un entorno en el que España aún está atrasada. “El paciente sigue prefiriendo acudir a los hospitales”, apunta como posible explicación.
El último campo en el que se trabaja es el de los análisis clínicos a través del desarrollo de herramientas capaces de optimizar estos procesos. “El objetivo fundamental es lograr tratamientos personalizados para cada paciente a través de estos procesos de secuenciación del genoma que rebajen su coste actual, que puede rondar los 1.000 euros; para alcanzar los 100 euros”. Para ello, se debe trabajar en la optimización de los procesos analíticos y de algoritmos. “Y no solo en el hardware sino también en el software”.