Publicada la referencia global de las variaciones genéticas humanas

Tanques de nitrógeno líquido que albergan las muestras del Banco Nacional de ADN.

La revista científica Nature acaba de publicar los resultados globales del proyecto 1.000 Genomas, un ambicioso trabajo internacional que pretende esclarecer el componente genético de las enfermedades mediante la creación de un mapa que recoge las variantes genéticas que existen entre diferentes individuos y grupos poblacionales. La información que proporciona este trabajo es una poderosa herramienta que facilitará la investigación de muchas enfermedades.

Más de 400 profesionales procedentes de más de 150 instituciones diferentes han secuenciado el genoma de 2.504 individuos de 26 poblaciones humanas con distintos orígenes geográficos. El Banco Nacional de ADN, con sede en el edificio Multiusos de I+D+i de la Universidad de Salamanca, se ha encargado de la recolección de muestras de la población española peninsular, con el correspondiente trabajo de preparación para su posterior secuenciación en Estados Unidos.

“Nunca se había hecho un estudio de tal envergadura, que permitiera secuenciar de forma completa a tantos individuos”, destaca en declaraciones a DiCYT Andrés García Montero, coordinador técnico del Banco Nacional de ADN. Gracias a este trabajo, “ha sido posible localizar más de 80 millones de variantes genéticas, de las que 65 millones se han descrito por primera vez”.

El proyecto 1.000 Genomas proporciona a los investigadores un mapa genético con el que comparar las posibles alteraciones que observen en sus pacientes. De esta manera, podrán saber si algunas variaciones genéticas pueden asociarse a las enfermedades que estudian o si, por el contrario, se corresponden con las características propias de la población de un país. “En nuestro grupo de investigación, muchas veces nos hemos encontrado con variantes genéticas que parecían vinculadas a una enfermedad porque no estaban presentes en las secuencias genéticas publicadas hasta el momento. Sin embargo, al estudiarlas en conjunto con las muestras españolas veíamos que las personas sanas también las tenían, con lo cual eran variantes genéticas asociadas a la población española”, señala Andrés García Montero.

Anonimato

Gracias a la colaboración de 28 centros de todas las comunidades autónomas peninsulares, en España se recogieron muestras de 66 tríos (padre, madre e hijo, lo que da un total de 198), de las que finalmente se enviaron 63 tríos a Estados Unidos, donde aleatoriamente se secuenciaron un total de 107 muestras. Así, “ni siquiera las personas que han donado muestras para el proyecto 1.000 Genomas saben si su secuencia está publicada, porque mantener el anonimato es muy importante”.
En la publicación, la parte española del proyecto se denomina Iberian Population in Spain (IBS) y el Banco Nacional de ADN conserva en su sede salmantina copias de las muestras que están a disposición de los investigadores biomédicos, igual que el resto de las colecciones de este biobanco.
El proyecto 1.000 Genomas comenzó en 2008 y ya ha dado como fruto otras publicaciones científicas con datos parciales. Sin embargo, este nuevo artículo de Nature recopila los datos globales de todo el estudio y realiza un análisis comparativo de las 26 poblaciones incluidas en el proyecto, de manera que se convierte en la auténtica referencia para consultar datos de variantes genéticas de la población humana.

Gran salto para la investigación genética
En opinión de Andrés García Montero, esta iniciativa supone un gran salto para la investigación genética internacional, tal y como ocurrió hace años con el proyecto Genoma Humano. “Hemos avanzado muchísimo en las herramientas de secuenciación y las bases de datos que ahora se ponen a disposición de los investigadores son enormes”, asegura. La tecnología ha permitido que la secuenciación completa de un individuo se pueda realizar ya por unos pocos miles de euros, mientras que no hace mucho estas cifras se contaban por millones. “Sin el trabajo de los bioinformáticos no hubiera sido posible”, añade.
La importancia de estos datos es fundamental por cuanto facilitarán enormemente el desarrollo de estudios funcionales y de asociación que permitan conocer la influencia del genoma en el desarrollo de las enfermedades. El mapa detallado del genoma que resulta de este proyecto facilitará a los investigadores el estudio de la relación de la información genética que posee un individuo (genotipo) con la susceptibilidad al desarrollo de enfermedades.

El Banco Nacional de ADN
El Banco Nacional de ADN forma parte de la plataforma de servicios de apoyo a la investigación NUCLEUS de la Universidad de Salamanca y a nivel nacional está integrado en la Plataforma de Recursos Biomoleculares y Bioinformáticos y en la Plataforma de Biobancos del Instituto de Salud Carlos III, del Ministerio de Economía y Competitividad.

Acceso a los datos

En el desarrollo del trabajo se han empleado y creado métodos bioinformáticos que han permitido integrar y comparar la información obtenida por diferentes tecnologías de secuenciación masiva de nueva generación. Mediante esta metodología se ha descrito la localización, frecuencia alélica y estructura génica de 84,4 millones de SNPs (cambios de un único nucleótido -la unidad básica del ADN-), 3,4 millones de “indels” (inserciones y/o pérdidas de pequeños fragmentos génicos de más de un nucleótido) y unas 34.300 variantes estructurales de grandes regiones génicas, la mayoría de las cuales no se habían descrito previamente. Así, en el mapa genético que ahora se publica se pueden encontrar aproximadamente el 98% de las variantes génicas que con una frecuencia igual o superior al 1% pudieran estar presentes en cualquier individuo perteneciente a alguna de las poblaciones estudiadas.

Todos estos datos genéticos son de acceso gratuito para aquellos investigadores que los necesiten, a través de la Web del Proyecto (www.1000genomes.org) y en la mayoría de las bases de datos genéticos de referencia de acceso controlado (p.ej. ENSEMBLE). El acceso a las muestras originales también es posible a través del Banco Nacional de ADN ISCIII (www.bancoadn.org).

Los orígenes geográficos de las veintiséis poblaciones estudiadas proceden de América (MXL, CLM, PEL y PUR), África (ACB, ASW, ESN, GWD, LWK, MSL y YRI), Asia Oriental (JPT, KHV, CDX, CHB y CHS), Asia Occidental (BEB, GIH, ITU, PJL, STU) y Europa (TSI, CEU, IBS, FIN y GBR).

Referencia bibliográfica

An integrated map of structural variation in 2,504 human genomes

Peter H. Sudmant, Tobias Rausch, Eugene J. Gardner, Robert E. Handsaker, Alexej Abyzov, John Huddleston, Yan Zhang, Kai Ye, Goo Jun, Markus Hsi-Yang Fritz, Miriam K. Konkel, Ankit Malhotra, Adrian M. Stütz, Xinghua Shi, Francesco Paolo Casale, Jieming Chen, Fereydoun Hormozdiari, Gargi Dayama, Ken Chen, Maika Malig, Mark J. P. Chaisson, Klaudia Walter, Sascha Meiers, Seva Kashin, Erik Garrison et al.
Nature 526, 75–81 (01 October 2015) doi:10.1038/nature15394

Received 19 February 2015 Accepted 20 August 2015 Published online 30 September 2015

(JPA/DICYT)