¿Cuánto nos queda aún por conocer del Genoma Humano?
Hace poco celebrábamos el vigésimo aniversario de la publicación del primer borrador del mapa del genoma humano, un hito sin precedentes para la historia de la ciencia. Durante estos últimos 20 años, los científicos han llevado a cabo proyectos en los que se identificaban y catalogaban diferencias genéticas entre individuos y el genoma de referencia, diferencias que solían centrarse en un simple cambio en un par de bases, dejando a un lado alteraciones genéticas de mayor tamaño. Con las nuevas tecnologías, hemos sido capaces de caracterizar alteraciones genéticas más extensas, llamadas, variantes estructurales que son más comunes y además su distribución a lo largo del genoma difiere mucho entre distintas poblaciones.
Ahora, un equipo de científicos del Laboratorio Europeo de Biología Molecular (EMBL), con presencia española, ha conseguido secuenciar 64 genomas -que representan 25 poblaciones humanas diferentes- con una calidad y resolución nunca vistas anteriormente. Esto ha permitido desvelar una de las caras ocultas del ADN. Los investigadores han anunciado que este nuevo conjunto de datos representa todo el rango de tipos de variantes genéticas.
Gracias a que este laboratorio utiliza la tecnología más puntera, se identificaron 107.590 variantes estructurales, de las cuales 68% no estaban aún catalogadas y 278 nuevos puntos calientes de variantes estructurales. Este descubrimiento se generó usando una combinación de secuenciación avanzada y tecnologías de mapeo. Estos nuevos avances permiten una lectura del ADN mucho más íntegra y precisa, haciendo visibles áreas del ADN que no eran accesibles pero que se sabe que juegan un papel importante en algunas enfermedades y rasgos humanos.
El estudio se basó en un método que permite reconstruir dos de los componentes del genoma de un individuo: el heredado del padre y el heredado de la madre (haplotipos). A la hora de ensamblar el genoma de una persona, este método, elimina el posible error derivado de la comparación con un genoma de referencia “imperfecto”. Por lo tanto, el método “Phased Assembly Variant” (PAV) puede dilucidar las variantes genéticas a través de la comparación directa entre las dos secuencias ensambladas (una del padre y otra de la madre) y el genoma de referencia humano. Por lo que, de esta forma, se elaboró un método que permite descubrir todas las formas de variantes genéticas mediante comparación directa de genomas humanos ensamblados.
Los datos de referencia generados en este nuevo estudio permiten establecer una nueva base para incluir el espectro entero de variantes genéticas en estudios de asociación del genoma completo (Genome wide-association studies, GWAS). El principal objetivo del estudio es conseguir estimar el riesgo que tiene una persona de sufrir ciertas enfermedades y entender los mecanismos moleculares de las mismas.
Gracias a este estudio, la información derivada puede servir para elucidar qué poblaciones están más predispuestas a sufrir de una variante genética en cuestión, mediante la creación de estudios específicos de poblaciones, para realizar acciones preventivas sobre enfermedades específicas, terapias más dirigidas y en general, una medicina más personalizada y de precisión.
Artículo original: Ebert P, Audano PA, Zhu Q, Rodriguez-Martin B, Porubsky D, Bonder MJ, Sulovari A, Ebler J, Zhou W, Serra Mari R, Yilmaz F, Zhao X, Hsieh P, Lee J, Kumar S, Lin J, Rausch T, Chen Y, Ren J, Santamarina M, Höps W, Ashraf H, Chuang NT, Yang X, Munson KM, Lewis AP, Fairley S, Tallon LJ, Clarke WE, Basile AO, Byrska-Bishop M, Corvelo A, Evani US, Lu TY, Chaisson MJP, Chen J, Li C, Brand H, Wenger AM, Ghareghani M, Harvey WT, Raeder B, Hasenfeld P, Regier AA, Abel HJ, Hall IM, Flicek P, Stegle O, Gerstein MB, Tubio JMC, Mu Z, Li YI, Shi X, Hastie AR, Ye K, Chong Z, Sanders AD, Zody MC, Talkowski ME, Mills RE, Devine SE, Lee C, Korbel JO, Marschall T, Eichler EE. Haplotype-resolved diverse human genomes and integrated analysis of structural variation. Science. 2021 Feb 25:eabf7117. doi: 10.1126/science.abf7117. Epub ahead of print. PMID: 33632895.