HACIA UN PANGENOMA DIVERSO Y REPRESENTATIVO

J. Alberto Castro
Columnas
PANGENOMA

El 10 de mayo en la revista Nature se publicaron una serie de artículos de investigación que reportan el primer borrador del pangenoma humano de referencia. De acuerdo con el grupo internacional de investigación, a la última versión del genoma se le ha dado el nombre de pangenoma porque contiene información genética de 47 individuos –junto con los de sus padres–, provenientes de África, Asia, las Américas y Europa. Igualmente, sus creadores aseguran que cada uno de los individuos tiene ancestros diferentes.

Se espera que este mapa actualizado de todo el humano lleve al desarrollo de nuevos medicamentos y tratamientos para un rango mucho más amplio de personas. Sin duda, estos 47 mapas de ADN son significativos y constituyen un paso importante hacia un modelo más completo que represente a la especie humana. Como cada persona tiene dos copias de su genoma, el pangenoma recoge la información de 94 genomas. En futuras versiones, los investigadores planean capturar la diversidad humana ampliando el número de genomas: 700 de ellos derivados de 350 personas.

“Con este aporte se busca enriquecer la distribución en el mundo de las variantes genéticas, por lo que más que tener la secuenciación completa del genoma se contaría con las variantes genéticas de diversos genomas humanos que son producto de la evolución, las migraciones, las poblaciones aisladas y no aisladas”, sostiene el doctor Félix Recillas Targa, del Instituto de Fisiología Celular de la UNAM.

Contactado por Vértigo, este biólogo formado en la universidad nacional recuerda que el genoma original (conocido como GRCh38) se publicó hace 20 años, pero se recreó a partir de la información genética de una sola persona, un hombre de Búfalo, Nueva York, algo que no representa la totalidad de la diversidad humana. “Debido a que las poblaciones con diferente ascendencia pueden tener variaciones específicas y ausentes en otras poblaciones, un único genoma no puede representar a la especie. En este escenario, comparar cualquier secuencia humana frente a un único genoma de referencia lleva a sesgos en los resultados”.

“Una característica de este primer esfuerzo es que 73% de dicha secuencia era de una sola persona y fue conocida como genoma de referencia, la cual durante años se tomó como base para múltiples investigaciones en todo el mundo. Sin embargo, investigadores de todo el mundo se dieron cuenta que los genomas de poblaciones como la asiática o la latina no estaban completamente representadas en esa primera secuencia, ya que quienes participaron eran de origen estadunidense”, advierte.

Dice el experto que los genetistas de México y de otras partes del planeta consideran que un porcentaje muy alto de los genomas que están en las grandes bases de datos es de norteamericanos y europeos. Ahora por fin se cuenta con la representación de poblaciones de todos los continentes en este mapa molecular que es el pangenoma humano. Porque eso es lo que se busca: diversidad. Conocer a fondo a toda la especie humana. El prefijo pan proviene de la palabra griega παν, que significa todo o completo.

castro-2.jpg

Además, el doctor en bioquímica por la Universidad de París indica que esa primera secuencia del genoma humano quedó concluida en 2022, es decir, después de dos décadas pudimos conocer cada uno de los rincones que forman parte de él y que está integrado por seis mil millones de pares de bases, es decir, esas letras que forman parte de nuestro ADN (adenina, guanina, citosina y timina) y que son el manual de instrucciones del ser humano.

“Pese a esta limitante los investigadores lo usamos para identificar genes involucrados en enfermedades para buscar mejores tratamientos. Ha llevado al desarrollo de terapias contra el cáncer y el desarrollo de exámenes para predecir la llegada de condiciones hereditarias, tales como la enfermedad de Huntington. Pero aún falta muchísimo por hacer”, sentencia.

Como científico celebra la decisión del Consorcio de Referencia del Pangenoma Humano por superar las carencias y conjuntar varios esfuerzos y trabajar en la realización de este primer borrador, que también representa un enorme trabajo a nivel bioinformático y en cuanto al almacenaje de grandes cantidades de información.

Para él la conformación de este pangenoma ha generado gran expectativa ya que muchas de las variantes genéticas encontradas pueden dar indicios de padecimientos o de posibles tratamientos para ellos, por ejemplo, las llamadas enfermedades raras las cuales muchas veces no se sabe qué las genera y mucho menos hay una forma de tratarlas.

Reconoce que esto es solo el comienzo de un ambicioso programa para representar mejor la diversidad de la población mundial. En ese sentido afirma que “visto desde la salud es capital hacer correlaciones entre variantes genéticas, saber por qué somos un poco más propensos a una enfermedad y empezar a entender esto. Por ejemplo, la población iberoamericana tiene una combinación de variantes genéticas que la hacen propensa a cierto tipo de enfermedades, como cáncer, cuestiones cognitivas, de comportamiento neuronal, etcétera”.

Igualmente será una herramienta para el análisis de aspectos relacionados con la evolución y las propias migraciones que ha tenido el ser humano desde tiempos remotos.

“Yo creo que algo que va a ocurrir cuando se tenga un volumen de información suficiente es que van a decir: dentro del genoma humano mundial el porcentaje de genomas que tenemos de Latinoamérica es tal, el asiático es tal, el nórdico es tal, y de esos hay bases de datos de variantes genéticas que son distintas entre poblaciones; creo que vamos a llegar a eso”, abunda.

Uno de los aspectos que impulsó la secuenciación del genoma humano fue el desarrollo tecnológico en las últimas décadas, el cual permitió secuenciar tramos de genoma más grandes y ensamblarlos mejor computacionalmente. El nuevo modelo de pangenoma humano es representado de modo gráfico porque contiene más diversidad del genoma estructurado.

Con el pangenoma se agregaron 119 millones de pares de bases de secuencias o letras en el ADN y mil 115 duplicaciones de genes, es decir, mutaciones, en relación con el de referencia existente, el GRCh38, por ello hoy el pangenoma humano tiene un mapeo de secuenciación de ARN mejorado.

“Si uno tiene la secuencia completa, y con muchas secuencias independientes, se puede saber si una variante genética es específica de una población y si tiene una consecuencia genética y a nivel de la salud; a la par esas variantes genéticas poblacionales permitirán entender mejor cómo se organizan los genomas y qué tan distinto es comparado al de otras poblaciones”, destaca.

El académico revela que en Singapur han creado el ambicioso programa Nacional de Medicina de Precisión cuyo objetivo es secuenciar genomas del área asiática (incluidas China, Malasia e India) que empezó con secuenciar a diez mil personas en 2021, para a finales de 2023 alcanzar los 100 mil individuos, y de 2024 a 2027 sumar un millón de secuencias de distintos individuos de esa inmensa área geográfica.

“Estos estudios ya siguen los fines del pangenoma humano pues apuntan a subrayar lo distinto de la población asiática en el contexto del genoma y su relación con la tradición, historia, costumbres, criterios raciales, etnias y ancestros”, apunta.

Finalmente, concluye: “Las variantes genéticas vinculadas a regiones geográficas, poblaciones, ecosistemas y medio ambiente específicos nos dan luz sobre el entorno que puede influir en esos genomas. Tener esta clave permite conocerlos en profundidad para diagnosticar enfermedades y lograr una medicina de precisión”.

Más del genoma humano

Si bien para una especie con casi ocho mil millones de individuos pasar de 1 a 47 genomas no parece un gran cambio, lo cierto es que este primer borrador del pangenoma humano es un nuevo paradigma de la evolución humana y también una revolución en la investigación médica.

Los humanos compartimos un genoma que es 99.9% idéntico; también, lo cierto es que 0.1% de tres mil millones son tres millones. Así que entre cada uno de nosotros hay millones de diferencias genómicas, muchas de ellas inexploradas.

Hans Winkler, botánico alemán, acuñó la palabra genoma en 1920, combinando la palabra gen con el sufijo ome (en inglés es genome), que significa “conjunto completo”, para describir la secuencia completa de ADN que contiene cada célula. Los investigadores siguen utilizando esta palabra un siglo después para referirse al material genético que compone un organismo.

El genoma humano contiene aproximadamente tres mil millones de nucleótidos y algo menos de 20 mil genes que codifican proteínas, lo que representa 1% de la longitud total del genoma. 99% restante son secuencias de ADN no codificantes que no producen proteínas.