Telomero
CasaCasa > Blog > Telomero

Telomero

Jun 26, 2023

Nature Genetics volume 55, pagine 1390–1399 (2023)Citare questo articolo

6669 accessi

58 Altmetrico

Dettagli sulle metriche

I pangenomi forniscono l'accesso a una rappresentazione accurata della diversità genetica delle specie, sia in termini di polimorfismi di sequenza che di varianti strutturali (SV). Qui abbiamo generato il Saccharomyces cerevisiae Reference Assembly Panel (ScRAP) comprendente genomi di qualità di riferimento per 142 ceppi che rappresentano la diversità filogenetica ed ecologica della specie. Lo ScRAP include assemblaggi di aplotipi in fasi per diversi isolati diploidi e poliploidi eterozigoti. Abbiamo identificato circa (circa) 4.800 SV non ridondanti che forniscono un'ampia visione della diversità genomica, inclusa la dinamica della lunghezza dei telomeri e degli elementi trasponibili. Abbiamo scoperto casi frequenti di aneuploidie complesse in cui grandi cromosomi subivano grandi delezioni e traslocazioni. Abbiamo scoperto che gli SV possono avere un impatto sull'espressione genica vicino ai punti di interruzione e contribuire sostanzialmente all'evoluzione del repertorio genetico. Abbiamo anche scoperto che le regioni acquisite orizzontalmente si inseriscono alle estremità dei cromosomi e possono generare nuovi telomeri. Nel complesso, lo ScRAP dimostra il vantaggio di un pangenoma nella comprensione dell'evoluzione del genoma su scala di popolazione.

Il sequenziamento a lunga lettura di una singola molecola fornisce l'accesso ad assemblaggi di genomi gapless, comprese regioni cromosomiche ripetitive che generalmente rimangono non assemblate con le tecnologie precedenti. Ciò è esemplificato al meglio nel rapido aumento della contiguità del genoma umano1, soprattutto grazie alle letture ultra lunghe della Oxford Nanopore Technology (ONT)2. Recentemente, il consorzio telomero-telomero (T2T) ha rilasciato il primo assemblaggio "T2T" completo di due cromosomi umani3,4,5, seguito dal rilascio del primo genoma umano gapless, comprendente nuove sequenze di quasi 200 Mb6. Anche i genomi vegetali complessi e gli organismi modello classici hanno visto miglioramenti nella contiguità dell'assemblaggio, grazie alle tecnologie a lunga lettura7,8,9,10,11.

Questi progressi hanno permesso a poche specie di avere più genomi contigui di riferimento, che includono organismi modello e specie di importanza antropocentrica come Escherichia coli12, Drosophila melanogaster10,13, Solanum lycopersicum14, Glycine max15, Oryza sativa8,16, Bombyx mori17 e esseri umani18,19 ,20. Il lievito di birra, Saccharomyces cerevisiae, ha in totale 68 gruppi genomici a lettura lunga di ceppi non di riferimento21,22,23,24,25,26,27,28,29,30. Questi dati sono stati utilizzati per quantificare i miglioramenti della contiguità rispetto ai dati di breve lettura25, creare mappe dell'intero genoma di elementi trasponibili (TE)22,24,25, caratterizzare regioni subtelomeriche29, aplotipi di fase e rilevare grandi varianti strutturali (SV)22,25, 26,29,30. Tuttavia, la contiguità degli insiemi di genomi disponibili varia ampiamente in S. cerevisiae e solo un piccolo sottoinsieme di essi ha raggiunto la contiguità a livello cromosomico. Inoltre, il campionamento rimane limitato con molti cladi privi di un genoma di riferimento rappresentativo e non sono stati inclusi genomi poliploidi nonostante la loro abbondanza (11,5% degli isolati)31. Infine, la messa in fase degli aplotipi dei genomi diploidi e poliploidi è impegnativa, poiché impedisce l'inferenza dell'aplotipo e le misure dell'eterozigosi.

Qui abbiamo generato il pannello di assemblaggio di riferimento di S. cerevisiae (ScRAP) comprendente assemblaggi di genomi T2T per 142 isolati che campionano lo spazio genomico della specie. La qualità di questi genomi supera il gold standard di riferimento e ci consente di caratterizzare con precisione SV e regioni complesse su una scala che non è stata ancora raggiunta in altre specie.

Lo ScRAP comprende 142 ceppi che coprono le distribuzioni geografiche ed ecologiche delle specie e i suoi livelli di ploidia ed eterozigosità (Fig. 1a, b e Tabella supplementare 1). Il pannello comprende 197 gruppi di genomi nucleari e 136 mitocondriali, inclusi 100 genomi appena sequenziati, tra i quali sono disponibili gruppi risolti con aplotipo sia per genomi diploidi che poliploidi (Tabella 1 e Tabelle supplementari 1–3). Le metriche genomiche rivelano elevati livelli di contiguità e completezza in tutti gli assemblaggi (nota integrativa 1). Lo ScRAP fornisce genomi di qualità di riferimento in tutti i principali cladi filogenetici31,32 (Fig. 1c e Nota integrativa 2). Gli assemblaggi diploidi risolti con aplotipo T2T mostrano che gli aplotipi fratelli (HP; aplotipo 1 (HP1) e aplotipo 2 (HP2)) si raggruppavano sempre nell'albero e condividevano lo stesso profilo di miscela (Fig. 1c, d). La differenza più evidente è stata osservata tra i due HP del ceppo Wine/European MC9 (AIS) per i quali la lunghezza del ramo di HP2 (AIS_HP2) è sproporzionatamente più lunga rispetto a tutti gli altri rami terminali (Fig. 1c), che è guidata dal cromosoma -introgressioni su scala dei cromosomi VI e VII da una specie altamente divergente (vedi Introgressioni di cromosomi interi).

50 bp, including deletions, insertions, duplications and contractions of repetitive sequences and copy-neutral rearrangements including inversions (>1 kb) and translocations (>10 kb). They originated from 4,809 nonredundant large-scale rearrangements that are shared at varying frequencies across the 141 nonreference strains (Table 1 and Supplementary Table 5). This nonredundant SV catalog covers ca. 80% of the estimated whole species structural diversity that we predicted to contain approximately 6,000 SVs (Fig. 2b and Table 1)./p>10 kb (Fig. 2f). This distribution shows two clear peaks around 300 bp and 6 kb for deletions, insertions and inversions corresponding to solo-long terminal repeats (LTRs) and full-length Ty elements. The mobility of Ty elements directly accounts for 59% of all insertions (1,571 events) and 16% of deletions through inter-LTR recombination (218 events). This unbalance is explained by the limited number of Ty elements in the reference genome that can be interpreted as a deletion when absent from other genomes. Interestingly, 19% and 8% of all duplications and contractions (representing 74 and seven cases, respectively), also resulted from tandem Ty movements. Altogether 39% of all SVs result from the insertion and deletion of Ty elements./p>50 bp) per genome, which represents an average density of 1 SV every 50 kb. By comparison, each human genome would contain >20,000 SVs46, which corresponds to approximately 1 SV/150 kb, that is, three times lower than in S. cerevisiae. In other eukaryotes that benefit from pangenome data, the SV density scales from 1 SV/90 kb in Drosophila47 (likely underestimated because only >100 bp euchromatic SVs were considered), 1 SV/38 kb in soybean15, 1 SV/17 kb in rice8 and up to 1 SV/4 kb in silkworm17. We also found a clear positive correlation between the numbers of SVs and SNVs/indels accumulating within genomes. It has been proposed that a genomic clock would coordinate the pace of fixation between amino acid substitutions and large-scale rearrangements in bacteria and yeast48,49. However, this clock seems to tick at a different pace depending on the ploidy and zygosity levels of the genome. SVs preferentially accumulate in heterozygous and higher ploidy genomes (Fig. 2c). One possibility would be that SVs are better tolerated in higher ploidy genomes as their deleterious effects (for example, gene deletion and dosage imbalance) are more efficiently buffered. Alternatively, the rate of SV formation might increase with ploidy, as was suggested for aneuploidies37./p>100 kb (that is, a the CR does not cover region/s summing to 100 kb or more) were labeled as complex and the rest as simple/p>100 kb that are present within a strain containing an aneuploidy detected above. Label as complex aneuploidy-related and use in the less conservative estimate of complex aneuploidy count./p>