giovedì 20 febbraio 2014

COS' È UNA READ?

Reindirizzamento alla versione aggiornata in corso, attendere prego...
Se il reindirizzamento non avviene ntro 5 secondi, per favore cliccare qui.


Sequenziamento: cosa sono le reads? Solo apparentemente complesso, il concetto di read può essere spiegato facilmente.

Una read è una piccola sequenza di DNA di sintesi che si ottiene in una reazione di sequenziamento. Il sequenziamento può essere fatto essenzialmente seguendo uno dei seguenti due principi: (1) chromosome walking: la reazione procede in modo ordinato lungo il cromosoma, (2) shotgun sequencing: vengono amplificati e sequenziati pezzi a caso del genoma, che vongono poi riallineati con operazioni di alignment.

Si capisce bene cosa è una read guardando più da vicino le fasi dello shotgun sequencing. Dapprima si procede alla rottura del DNA del paziente in tanti piccoli frammenti, a ciascuno dei quali vengono aggiunte delle corte sequenze nucletodiche (dette adattori - adaptors) che servono ad ancorare i frammenti di DNA al supporto sul quale avverrà la reazione di sequenziamento. L'insieme dei frammenti di DNA preparati tramite l'aggiunta degli adattatori costituisce la sequencing library. I frammenti della sequencing library vengono amplificati e sequenziati fino a ottenere numerose copie complementari di ciascun frammento. Sono proprio queste copie complementari ad essere chiamate reads (in italiano potremmo tradurlo anche con "letture"). Il numero di reads (letture) può essere settato all'inizio. In un sequenziamento NGS di buon livello si producono circa 30 reads per ogni frammento. In altre parole è un po' come se ogni frammento della sequencing library fosse letto e riletto 30 volte. In gergo si parlerebbe di capture 30x (trenta per - thirty per). Ottenere tutte queste reads è necessario per (1) raggiungere una quantità di segnale sufficiente ad essere captato e (2) coprire il segnale delle reads che contengono errori (il sequenziamento NGS è assai più impreciso del sequenziamento Sanger, ed è perciò necessario mitigare i segnali di errore con un numero elevato di segnali corretti: ciò si ottiene producendo molte reads). Trenta reads per frammento possono sembrare tante, ma si può arrivare anche a capture 50x, 100x o 1000x!

Come si fa a ricostruire le sequenze geniche del paziente a partire dalle reads?

Molto semplice (almeno concettualmente): gli enrichment kits delle piattaforme NGS sono disegnati per produrre reads con estremità sovrapposte. Le reads possono quindi essere riassemblate sovrapponendone le estremità. Il concomitante allineamento (alignment) delle reads con le sequenze di riferimento del genoma umano consente di ricostruire interamente le sequenze geniche e intergeniche del paziente. L'intera operazione non è molto dissimile da quanto si fa con un puzzle, nel quale ogni tessera deve concatenarsi in modo univoco con le altre fino a ricostruire l'immagine originale completa.

Per saperne di più: Libri e Pubblicazioni sulla Bionformatica (in italiano), Libri e Pubblicazioni sulla Bioinformatica (in inglese), Libri e Pubblicazioni sulla Next Generation Sequencing.

Argomenti correlati:

Nessun commento: