venerdì 21 febbraio 2014

SINGLE-END READS E PAIRED-END READS

Reindirizzamento alla versione aggiornata in corso, attendere prego...


Un sequenziamento NGS può essere fatto utilizzando single-end reads o paired-end reads. Come già visto nella lezione COSA È UNA READ?, una read è una corta sequenza di DNA di sintesi che viene prodotta durante la reazione di sequenziamento.

I frammenti che si utilizzano nella costruzione della sequencing library (ottenuti tramite rottura fisica, enzimatica o chimica del DNA - physical, enzymatic or chemical DNA shearing) vengono selezionati fino ad avere una lunghezza prestabilita. Supponiamo che vengano selezionati frammenti di circa 500 paia di basi (500bp). Il sequenziamento può essere fatto a partire da una sola estremità del frammento (sequenziamento con single-end reads) o partendo da entrambe le estremità e proseguendo in direzioni opposte (sequenziamento con paired-end reads). Il sequenziamento a paired-end reads è più sensibile e accurato di quello a single-end reads, perché facilita notevolmente le operazioni di alignment, consentendo fra l'altro di rilevare eventuali delezioni, duplicazioni o inserzioni nel DNA del paziente. È da notare che, nel sequenziamento a paired-end reads, le reads ottenute a partire da ciascuna estremità (chiamate per convenzione R1 e R2) non sono né complementari né sovrapponibili, poiché non arrivano a coprire l'intera lunghezza del frammento della sequencing library (tranne che nel sistema MiSeq di Illumina: leggi QUI). La sequenza che si frappone fra R1 e R2 resta ignota, ma sappiamo quanto è grande. Ad esempio, in un sistema nel quale si utilizzi una sequencing library con frammenti da 500bp e nel quale si producano reads di 100bp, la distanza intermedia fra R1 e R2 sarà di circa 300bp. In termini tecnici questa distanza viene definita inner mate distance (le paired-end reads vengono a volte definite anche mate reads, ma il mate pair sequencing è in realtà una variante del sequenziamento con paired-end reads: per saperne di più leggi qui). A titolo esemplificativo, si veda anche la figura qui sotto (cliccare per ingrandire).

single e paired-end reads,  R1, R2, inner mate distance
Figura 1: a partire dall'alto, frammento di DNA (ottenuto tramite rottura chimica o fisica del DNA), frammento con aggiunta degli adattatori (sequencing library), single end read, paired-end reads R1 e R2 e inner mate distance (distanza interposta fra R1 e R2). © 2016 Breda Genetics srl, tutti i diritti riservati.

In che modo il sequenziamento a paired-end reads aiuta a identificare eventuali delezioni, inserzioni o duplicazioni nel genoma del paziente?

In un esempio come quello sopra descritto (sequencing library con frammenti da 500bp e reads da 100bp) ci aspettiamo che, nell'allineare R1 e R2 con le sequenze di riferimento del genoma umano (alignment), la inner mate distance resti 300bp. Se invece osserviamo che R1 e R2 mappano a una distanza superiore o inferiore, significa che il paziente è portatore, rispettivamente, di una delezione o di una inserzione.

Per saperne di più: Libri e Pubblicazioni sulla Bionformatica (in italiano), Libri e Pubblicazioni sulla Bioinformatica (in inglese), Libri e Pubblicazioni sulla Next Generation Sequencing.  

Argomenti correlati:

Nessun commento: