Nuevos datos del Proyecto 1.000 Genomas
Estos tres proyectos piloto han servido para ensayar diversas tecnologías de secuenciación y métodos analíticos con objeto de decidir cuáles se emplearán en la totalidad del proyecto. Según los socios, el catálogo de variantes genéticas resultante de este proyecto será de enorme ayuda para la investigación de la relación entre dichas variantes y la incidencia de enfermedades. El corpus de datos preliminares se ha puesto a disposición de la comunidad científica a través de la página web del proyecto, así como de AWS (Amazon Web Services).
El primero de estos proyectos piloto ha consistido en la secuenciación con una alta cobertura (cada muestra ha sido secuenciada un promedio de 20-60 veces) de los genomas de seis personas pertenecientes a dos familias distintas. Además de permitir obtener una fotografía detallada de la variación del ADN en estos sujetos, la comparación de los resultados obtenidos mediante las distintas técnicas ha permitido también conocer las ventajas y limitaciones de cada una de ellas. El segundo proyecto piloto, en cambio, consistió en secuenciar los genomas de un número mucho más elevado de personas (179), pero con baja cobertura (un promedio de 3 pases por genoma). Esta estrategia alternativa también resultó ser eficaz para la identificación de variantes genéticas en los individuos estudiados, lo que permitirá un ahorro considerable, ya que los costes de secuenciar genomas completos con alta cobertura siguen siendo relativamente elevados. El tercero de estos proyectos preparatorios ha consistido en la elaboración de un catálogo completo de variantes frecuentes y raras en las regiones codificantes (exones) de 1.000 genes de 700 individuos.
Para el Dr. Richard Durbin, del Wellcome Trust Sanger Institute (Reino Unido) y que co-dirige el Proyecto 1.000 Genomas, “no cabe duda que hemos avanzado considerablemente en la optimización del uso de la nueva generación de plataformas de secuenciación para el estudio de la variación genética humana. Ahora podremos aplicar lo aprendido para secuenciar con mayor rapidez”.
Fuentes del consorcio indican que esta novedosa base de datos contendrá una cantidad ingente de información relativa a cambios de una sola base (SNPs), pequeñas inserciones y deleciones, y variantes de número de copia y grandes reordenamientos cromosómicos. “La mayor resolución del mapa elaborado en este proyecto ofrecerá datos de secuencia mucho más precisos. No se limita a variantes comunes, sino que incluirá millones de variantes inusuales y raras”, ha explicado la Dra. Elaine Mardis, del Genome Center de la Universidad Washington (Estados Unidos) y miembro del comité de dirección del proyecto.