La mappa del genoma umano è completa. Come si è arrivati a questo ultimo step

Tutto cominciò con l’inizio del nuovo millennio, un studio accurato che portò l’attuale genoma di riferimento umano ad essere rilasciato dal Genome Reference Consortium (GRC) nel 2013 e più recentemente modificato nel 2019. Il progetto è andato avanti, finanziato con fondi pubblici grazie ai quali è stato continuamente migliorato. Che fa rima con completato.

Genoma umano 20220403 cell
Genoma umano – Adobe Stock

Tutto merito del consorzio T2T anglo-americano, un pool di ricercatori del National Human Genome Research Institute, parte del National Institutes of Health, la University of California e la University of Washington. Un lungo studio che ha permesso agli scienziati di scoprire due milioni di varianti che mancavano per arrivare a conoscere il 100% del genoma umano.

A differenza dello sforzo concorrente di Celera e dei più moderni progetti di sequenziamento basati sull’assemblaggio di sequenze “fucile a pompa”, l’assieme GRC è stato costruito da cromosomi artificiali batterici sequenziati che sono stati ordinati e orientati lungo il genoma umano per mezzo di ibridi di radiazioni, legame genetico e mappe di impronte digitali.

Quasi 200 milioni di coppie di basi di sequenze. Un mosaico di aplotipi

DNA 20220403 cell
DNA – Adobe Stock

Tuttavia, i limiti della clonazione BAC hanno portato a una sotto-rappresentazione delle sequenze ripetitive e dell’assemblaggio opportunistico di BAC derivati da più individui, ha portato a un mosaico di aplotipi. Di conseguenza, diverse lacune di assemblaggio del GRC sono irrisolvibili a causa di polimorfismi strutturali incompatibili sui loro fianchi e molte altre regioni ripetitive e polimorfiche sono state lasciate incompiute o assemblate in modo errato.

Dal suo rilascio iniziale nel 2000, il genoma di riferimento umano ha coperto solo la frazione eucromatica, lasciando incompiute importanti regioni eterocromatiche. Il consorzio T2T anglo-americano ha ricercato la parte mancante, affrontando lo studio del restante 8% del genoma.

Il consorzio Telomere-to-Telomere ha presentato una sequenza completa di 3,055 miliardi di coppie di basi di un genoma umano, T2T-CHM13, che include assemblaggi gapless per tutti i cromosomi tranne Y, è riuscito a correggere gli errori in riferimento ai precedenti sviluppi, grazie all’introduzione di quasi 200 milioni di coppie di basi di sequenze contenenti 1956 predizioni geniche, 99 delle quali si prevede codificano proteine.

Le regioni completate includono tutti gli array di satelliti centromerici, le recenti duplicazioni segmentali e le braccia corte di tutti e cinque i cromosomi acrocentrici, sbloccando queste complesse regioni del genoma per studi variazionali e funzionali.

Grazie all’utilizzo delle delle due nuove tecnologie di sequenziamento del DNA si è arrivati fino a un milione di basi con una sola lettura. In pratica la sequenza completa di nucleotidi che compone il patrimonio genetico dell’homo sapiens, comprendente il DNA nucleare e il DNA mitocondriale, ora è completa.