Telomero
Nature Genetics volume 55, pagine 1390–1399 (2023)Citare questo articolo
6669 accessi
58 Altmetrico
Dettagli sulle metriche
I pangenomi forniscono l'accesso a una rappresentazione accurata della diversità genetica delle specie, sia in termini di polimorfismi di sequenza che di varianti strutturali (SV). Qui abbiamo generato il Saccharomyces cerevisiae Reference Assembly Panel (ScRAP) comprendente genomi di qualità di riferimento per 142 ceppi che rappresentano la diversità filogenetica ed ecologica della specie. Lo ScRAP include assemblaggi di aplotipi in fasi per diversi isolati diploidi e poliploidi eterozigoti. Abbiamo identificato circa (circa) 4.800 SV non ridondanti che forniscono un'ampia visione della diversità genomica, inclusa la dinamica della lunghezza dei telomeri e degli elementi trasponibili. Abbiamo scoperto casi frequenti di aneuploidie complesse in cui grandi cromosomi subivano grandi delezioni e traslocazioni. Abbiamo scoperto che gli SV possono avere un impatto sull'espressione genica vicino ai punti di interruzione e contribuire sostanzialmente all'evoluzione del repertorio genetico. Abbiamo anche scoperto che le regioni acquisite orizzontalmente si inseriscono alle estremità dei cromosomi e possono generare nuovi telomeri. Nel complesso, lo ScRAP dimostra il vantaggio di un pangenoma nella comprensione dell'evoluzione del genoma su scala di popolazione.
Il sequenziamento a lunga lettura di una singola molecola fornisce l'accesso ad assemblaggi di genomi gapless, comprese regioni cromosomiche ripetitive che generalmente rimangono non assemblate con le tecnologie precedenti. Ciò è esemplificato al meglio nel rapido aumento della contiguità del genoma umano1, soprattutto grazie alle letture ultra lunghe della Oxford Nanopore Technology (ONT)2. Recentemente, il consorzio telomero-telomero (T2T) ha rilasciato il primo assemblaggio "T2T" completo di due cromosomi umani3,4,5, seguito dal rilascio del primo genoma umano gapless, comprendente nuove sequenze di quasi 200 Mb6. Anche i genomi vegetali complessi e gli organismi modello classici hanno visto miglioramenti nella contiguità dell'assemblaggio, grazie alle tecnologie a lunga lettura7,8,9,10,11.
Questi progressi hanno permesso a poche specie di avere più genomi contigui di riferimento, che includono organismi modello e specie di importanza antropocentrica come Escherichia coli12, Drosophila melanogaster10,13, Solanum lycopersicum14, Glycine max15, Oryza sativa8,16, Bombyx mori17 e esseri umani18,19 ,20. Il lievito di birra, Saccharomyces cerevisiae, ha in totale 68 gruppi genomici a lettura lunga di ceppi non di riferimento21,22,23,24,25,26,27,28,29,30. Questi dati sono stati utilizzati per quantificare i miglioramenti della contiguità rispetto ai dati di breve lettura25, creare mappe dell'intero genoma di elementi trasponibili (TE)22,24,25, caratterizzare regioni subtelomeriche29, aplotipi di fase e rilevare grandi varianti strutturali (SV)22,25, 26,29,30. Tuttavia, la contiguità degli insiemi di genomi disponibili varia ampiamente in S. cerevisiae e solo un piccolo sottoinsieme di essi ha raggiunto la contiguità a livello cromosomico. Inoltre, il campionamento rimane limitato con molti cladi privi di un genoma di riferimento rappresentativo e non sono stati inclusi genomi poliploidi nonostante la loro abbondanza (11,5% degli isolati)31. Infine, la messa in fase degli aplotipi dei genomi diploidi e poliploidi è impegnativa, poiché impedisce l'inferenza dell'aplotipo e le misure dell'eterozigosi.
Qui abbiamo generato il pannello di assemblaggio di riferimento di S. cerevisiae (ScRAP) comprendente assemblaggi di genomi T2T per 142 isolati che campionano lo spazio genomico della specie. La qualità di questi genomi supera il gold standard di riferimento e ci consente di caratterizzare con precisione SV e regioni complesse su una scala che non è stata ancora raggiunta in altre specie.
Lo ScRAP comprende 142 ceppi che coprono le distribuzioni geografiche ed ecologiche delle specie e i suoi livelli di ploidia ed eterozigosità (Fig. 1a, b e Tabella supplementare 1). Il pannello comprende 197 gruppi di genomi nucleari e 136 mitocondriali, inclusi 100 genomi appena sequenziati, tra i quali sono disponibili gruppi risolti con aplotipo sia per genomi diploidi che poliploidi (Tabella 1 e Tabelle supplementari 1–3). Le metriche genomiche rivelano elevati livelli di contiguità e completezza in tutti gli assemblaggi (nota integrativa 1). Lo ScRAP fornisce genomi di qualità di riferimento in tutti i principali cladi filogenetici31,32 (Fig. 1c e Nota integrativa 2). Gli assemblaggi diploidi risolti con aplotipo T2T mostrano che gli aplotipi fratelli (HP; aplotipo 1 (HP1) e aplotipo 2 (HP2)) si raggruppavano sempre nell'albero e condividevano lo stesso profilo di miscela (Fig. 1c, d). La differenza più evidente è stata osservata tra i due HP del ceppo Wine/European MC9 (AIS) per i quali la lunghezza del ramo di HP2 (AIS_HP2) è sproporzionatamente più lunga rispetto a tutti gli altri rami terminali (Fig. 1c), che è guidata dal cromosoma -introgressioni su scala dei cromosomi VI e VII da una specie altamente divergente (vedi Introgressioni di cromosomi interi).