giovedì 27 febbraio 2014

MATE PAIR SEQUENCING

Il sequenziamento NGS mate pair, detto anche mate pair sequencing, è un'applicazione efficace per la rilevazione di riarrangiamenti cromosomici nell'ordine delle centinaia di nucleotidi.

Il mate pair sequencing è sostanzialmente una variante del sequenziamento classico con pair-end reads. In entrambi i casi, infatti, si procede alla lettura del filamento partendo da direzioni opposte fino ad ottenere la sequenza delle sue estremità, mentre la sequenza dell'inserto centrale resta ignota, anche se ne sappiamo la grandezza (inner mate distance). La differenza principale sta nel fatto che nel mate pair sequencing il frammento di DNA viene prima circolarizzato e poi nuovamente rotto.

Ecco, in modo semplificato, i passi per la costruzione di una mate pair library: il DNA viene frammentato come al solito. Successivamente vengono selezionati, fra quelli più grandi (in genere quelli compresi fra 2 e 20 kb), solo frammenti di una determinata lunghezza, decisa a priori (ad esempio 2kb). Ecco quindi che si procede alla circolarizzazione dei frammenti di DNA, solitamente previa aggiunta di una sonda biotinalata a ciascuna delle due estremità. Il DNA così circolarizzato viene nuovamente frammentato. A questo punto si procede alla selezione dei soli frammenti contenenti le sonde biotinalate, che sono formati invero dalle estremità congiunte del frammento originario, unitesi durante la fase di circolarizzazione della molecola. L'aggiunta delle sonde biotinilate ha proprio lo scopo di permettere l'identificazione delle estremità senza dover procedere all'allineamento bioinformatico. Si aggiungono poi adattatori e primer a ciasuna estremità del frammento biotinilato e si procede al sequenziamento in direzioni opposte. Ed ecco che alla fine si ottengono le sequenze delle estremità del frammento originale, proprio come in un sequenziamento con pair-end reads. Per capire meglio gli step descritti si può dare un'occhiata alla figura qui sotto.

come funziona il mate pair sequencing: selezione dei frammenti - aggiunta delle sonde biotinilate - circolarizzazione - rottura - selezione dei frammenti biotinilati - sequenziamento - alignment
Fig. 1: rappresentazione schematica del flusso di eventi nel MATE PAIR SEQUENCING: una volta frammentato il DNA (DNA shearing), vengono selezionati frammenti di una lunghezza predefinita, alle estremità dei quali vengono aggiunte sonde biotinilate. Il frammento viene poi circolarizzato e successivamente rotto. Dopo la rottura vengono selezionati e sequenziati con pair-end reads solo i frammenti biotinilati. Le sequenze così ottenute (che sono quelle delle estremità del frammento originale) vengono allineate (alignment) per verificare se la inner mate distance è pari a quella attesa o se è superiore (paziente con delezione) o inferiore (paziente con inserzione).
Come fa il mate pair sequencing ad identificare eventuali riarrangiamenti?

Molto semplice: supponiamo di aver originariamente costruito una mate pair library con frammenti di 2kb e di avere utilizzato un sistema per la produzione di reads da 200 basi ciascuna. Sappiamo dunque fin dall'inizio che la inner mate distance (cioè la grandezza dell'inserto centrale la cui sequenza resta ignota) deve essere necessariamente pari a 2000 - 200 - 200 = 1600bp. Se in fase di alignment con le sequenze di riferimento del genoma umano le reads del paziente risultano distare 1600 bp, significa che il paziente non reca né inserzioni né delezioni. Se invece le reads mappano a distanza diversa (maggiore o minore), il paziente sarà portatore di un riarrangiamento (una delezione o un'inserzione rispettivamente).

Per saperne di più: Libri e Pubblicazioni sulla Next Generation Sequencing
 

Nessun commento: