Los genomas de una familia de cuatro generaciones revelan la tasa de nuevas mutaciones

Las mutaciones de novo (DNM), es decir, mutaciones que porta un individuo pero no sus progenitores, son la base de muchas enfermedades e impulsan la evolución. Esta noticia sobre un artículo estudia la aparición y transmisión de estas mutaciones. Además se abordan temas dados en clase (genética y métodos en genética) como métodos de secuenciación, mutaciones (variantes de un solo nucleótido, indel…), transmisión a la herencia, pedigrí genético, etc. 

Las investigaciones realizadas  previamente sobre la tasa de aparición de DNM en humanos se basaban principalmente en el mapeo de datos desde secuencias de lectura corta hasta genomas de referencia incompletos, y a menudo excluían regiones genómicas con secuencias repetitivas altamente propensas a la mutación. El trabajo para completar la secuencia del genoma humano y los avances en la secuenciación de lectura larga y los algoritmos de ensamblaje genómico han permitido la generación de genomas casi completos de extremo a extremo. Esto ha permitido entender mejor los patrones de DNM. 

En el estudio se aplicaron cinco tecnologías de secuenciación para los genomas de 28 personas de cuatro generaciones de una familia (CEPH 1463). El enfoque del estudio consistió en descubrir variantes de un solo nucleótido (SNVs), inserciones y deleciones de secuencias (indels) y alteraciones a gran escala llamadas variantes estructurales en el ADN de la sangre. Se usó secuenciación de lectura larga para la creación de ensamblajes de novo (que se reconstruyeron sin un genoma de referencia) para investigar las regiones genómicas más complejas, incluyendo estructuras involucradas en la división celular (como son los centrómeros) y el cromosoma sexual Y. Se investigo la transmisión de DNM entre generaciones (Fig. 1) y se pudo distinguir las mutaciones que surgen en las células sexuales de los padres (mutaciones de la línea germinal) de las que surgen después de la fertilización del óvulo (mutaciones poscigóticas).

Figura 1 | Se estudiaron cuatro generaciones de una familia para estimar la tasa de transmisión de nuevas mutaciones. El ADN de 28 individuos de cuatro generaciones (G1-G4) de la familia CEPH 1463 se secuenció mediante diversas técnicas, que se enumeran y codifican por colores aquí. Para G2-G4, se utilizó ADN de sangre para la secuenciación, a fin de evitar los artefactos que introducen sesgos al usar ADN de líneas celulares derivadas de individuos (como se utilizó para UL-ONT, Strand-seq y G1). Element, Element AVITI Biosciences; HiFi, secuenciación de alta fidelidad (seq); UL-ONT, secuenciación ultralarga de Oxford Nanopore Technologies. Crédito: Porubsky, D. et al. / Nature (CC BY 4.0)

Se accedió a 260 millones más de pares de bases del genoma que en los puntos de referencia anteriores, y se estimó que entre 98 y 206 DNM se transmiten de una generación a la siguiente (se adquieren entre 98 y 206 mutaciones que no estaban presentes en el genoma de los padres), valor el cual resulta más alto que en las estimaciones anteriores. Se mapearon estos DNM en un fondo genético de 1530 eventos de recombinación, 5,95 millones de variantes pequeñas (SNV e indeles) y 35 662 variantes estructurales se heredaron a través de las generaciones (se heredan, ya presentes en el genoma de los padres). Alrededor del 16 % de los DNM eran poscigóticos. Sin embargo, mientras que los DNM de la línea germinal eran de origen paterno en un 81,4 %, los DNM poscigóticos no muestran sesgo de origen parental.

También se observó que la tasa de DNM varía considerablemente según el contenido de repeticiones en una región. En general, la línea germinal parental aporta 1,17 × 10−8 SNV por par de bases por generación, tasa la cual casi se triplica en las repeticiones del centrómero y casi se duplica en las secuencias repetidas llamadas duplicaciones segmentarias. Asimismo se observaron altas tasas de mutación en las partes compactas de heterocromatina del cromosoma Y y en las regiones de repetición en tándem. Demostrando que las tasas de mutación en las regiones de repetición en tándem dependen de la longitud del motivo repetido y de la composición general de la secuencia.

Al que le interese conocer más específicamente los datos recogidos:

Entre dichas secuencias se encontraron 32 sitios que presentan mutaciones recurrentes en la familia; 16 de estas secuencias se expandieron o contrajeron tres o más veces a lo largo de las cuatro generaciones. Se reunieron 288 centrómeros completos y se validaron 18 variantes estructurales de novo a partir de 150 eventos de transmisión. De estos 18, 13 se asignan a regiones de repetición centromérica activas, y se predice que al menos 2 de estas variantes estructurales centroméricas alteran la localización de la maquinaria de división celular. En 8 individuos de la tercera generación, detectamos 41 variantes estructurales de novo y estimamos que existen entre 3 y 7 de estas variantes por transmisión, lo que resulta en un promedio de 4400 pares de bases ganados o perdidos por generación.

Artículo completo:

Porubsky, D., Dashnow, H., Sasani, T.A. et al. Human de novo mutation rates from a four-generation pedigree reference. Nature (2025). https://doi.org/10.1038/s41586-025-08922-2