venerdì 11 ottobre 2013

EXOME SEQUENCING

State per essere reindirizzati alla versione aggiornata di questa pagina...attendere prego.
Se il reindirizzamento non funziona entro 5 secondi, per favore cliccare qui.



EXOME SEQUENCING E APPLICAZIONIExome sequencing (o Whole-Exome Sequencing - WES) è un termine che identifica il sequenziamento dell'intera regione codificante del genoma di un individuo. Fino a pochi anni fa il test genetico per eccellenza consisteva nel sequenziamento di singolo gene (o di un ristretto gruppo di geni) tramite la metodica dell'elettroforesi capillare (più comunemente nota come sequenziamento Sanger). L’avvento delle nuove tecnologie di sequenziamento (Next Generation Sequencing - NGS e Third Gen Sequencing) ha invece trasformato lo studio della genetica delle malattie umane portando ad un'epoca di produttività senza precedenti. Grazie ai costi e ai tempi ridotti, tramite NGS è possibile analizzare un elevato numero di frammenti di DNA in parallelo fino ad ottenere la sequenza di molti geni in contemporanea o addirittura dell'intera regione codificante di un individuo. Ciò è di estremo interesse sia per la dignostica di routine che per la ricerca scientifica. Infatti, anche se la regione codificante rappresenta soltanto l'1% di tutto il genoma, si stima che fino all'85% di tutte le mutazioni patogene siano contenute in questa regione. L'exome sequencing è ad esempio utile in quei casi in cui manchi una diagnosi clinica precisa (e quindi un sospetto per un gene in particolare) e nei casi delle malattie geneticamente eterogenee, nelle quali alcuni geni devono ancora essere scoperti e nei quali i pazienti rimangono spesso senza la conferma genetica anche dopo l'esecuzione del test molecolare tradizionale.

vale la pena conservare le staminali del cordone omblicale?

 Come detto, per definizione, nell'exome sequencing viene analizzata la regione codificante del genoma. E' pur vero che alcuni enrichment kit (vedi la lezione sul Target Enrichment) sono ancora incompleti, mancando della copertura di alcune zone, ma è altrettanto vero che altri kit contengono primer anche per alcune regioni non codificanti, come ad esempio i confini esone/introne (dove possono localizzarsi un gran quantità di mutazioni) e alcune regioni regolatorie note per essere mutate in alcune patologie. 

APPLICAZIONI DELL'EXOME SEQUENCING

1. STUDIO DELLA PATOLOGIA MENDELIANA

L'approccio tradizionale alla ricerca delle malattie mendeliane è sempre stato lo studio di linkage seguito dalla tecnica del clonaggio posizionale. Questo approccio presenta tuttavia notevoli difficoltà, principalmente legate alla necessita di dover testare più di una famiglia (impresa non facile per malattie rare o rarissime) e eterogeneità genetica che talora caratterizza certe patologie mendeliane (si pensi, ad esempio, a sindromi come quella di Bardet-Biedl, di Joubert o di Kallmann, che possono essere causate da mutazioni in geni diversi) che rende quasi impossibile identificare il gene chiave quando li studi debbano limitarsi a poche famiglie. L'exome sequencing, invece, screenando a tappeto la sequenza codificante, permette di identificare subito varianti patogene o verosimilmente patogene. I geni coinvolti nella patogenesi della sindrome di Kabuki e di Miller, ad esempio, sono stati recentemente identificati grazie a studi di exone sequencing. Basti pensare che solo negli ultimi tre anni  sono stati scoperti tramite exome sequencing i geni di ben 100 malattie Mendeliane!

2. STUDIO DELLA PATOLOGIA MULTIFATTORIALE

Negli ultimi anni l'approccio tradizionale allo studio genetico delle malattie multifattoriali (cioè quelle malattie che si suppone insorgano a seguito dell'interazione fra fattori ambientali e predisposizione genetica) è stato prevalentemente basato sul genome array, ossia sullo screening di un certo numero di varianti sparse su tutto il genoma. Questi studi, noti anche come GWAS (Genome Wide Association Study), si basano sull'ipotesi di fondo che la suscettibilità genetica a una malattia multifattoriale sia dovuta all'interazione di varianti genetiche comuni. In effetti, le patologie multifattoriali sono patologie frequenti (si pensi solo al diabete di II tipo o alla cardiopatia ischemica) e l'ipotesi sottostante a un GWAS è quindi 'malattia frequente, variante frequente'. L'applicazione della NGS ha tuttavia rivoluzionato anche questo settore. Anche negli studi di associazione, cioè, si cominicia prendere in considerazione il genome o l'exome sequencing come alternativa al genome o exome array. L'exome sequencing, per via della sua economicità rispetto al genome sequencing, raprresenta in realtà l'alterantiva di scelta principale. L'applicazione del genome/exome sequencing sottende una filosofia sostanzialmente opposta, e cioè 'malattia frequente, variante rara'. Si pensa cioè che la suscettibilità alla patologia multifattoriale sia dovuta all'interazione più fra varianti rare che fra varianti frequenti.

3. DIAGNOSTICA DI ROUTINE

Naturalmente l'impiego dell'exome sequencing si sta rilevando molto utile anche nel settore della diagnostica di routine. Sequenziare l'intero esoma, oltre ad essere in molti casi ormai economicamente più vantaggioso dell'analisi Sanger,offre una certa possibilità di identificare la causa genetica anche nei casi in cui manchi una conferma clinica precisa, dando per l'altro l'opportunità di caratterizzare geneticamente patologie ereditarie fino ad ora poco conosciute. Il risultato di un semplice exome sequencing di routine può cioè rivelarsi non solo di interesse clinico, ma anche di interesse scientifico.

PROCESSO DI IDENTIFICAZIONE DELLE VARIANTI

Sequenziando l'intera regione codificante si ottiene una gran quantità di dati. A questi dati si giunge in particolare attraverso due fasi:

1. ALLINEAMENTO (ALIGNMENT)

Sofware specifici (Bowtie, Bowtie2, BWA, MAQ, SOAP ed altri) sono in grado di confrontare (o allineare che dir si voglia) le sequenze del paziente con le sequenze presenti nelle banche dati (le cosiddette reference sequences), ricostruendo come in un puzzle l'esoma del paziente. È questa la cosiddetta operazione di alignment. Per saperne di più potete leggere ALIGNMENT: COME RICOSTRUIRE LE SEQUENZE DEI GENI NELLE ANALISI NGS.


2. VARIANT CALLING

Una volta completato l'allineamento e aver quindi ricostruito la sequenza codificante di ogni gene, si rende necessario individuare le varianti di sequenza, ossia tutte le deviazioni del paziente rispetto alle reference sequence di ogni gene. È questa quella che si chiama operazione di variant calling, che nelle analisi ngs viene fatta in modo del tutto automatizzata. In generale la percentuale di errore dell'NGS è pari all'1%: è cioè possibile che una variante ogni 100 sia un in realtà un artefatto. Pur potendo questa considerarsi una percentuale tollerabile, specialmente avendo presente la mole di dati prodotta da un exome sequencing, molti laboratori fanno utilizzo di software atti a calcolare la probabilità che una variante sia o meno un artefatto (GATK sembra essere uno dei migliori). In ambito diagnostico, ogni variante con posibile significato clinico viene confermata attraverso il risequenziamento con elettroforesi capillare (Sanger sequencing).

Da un punto di vista pratico la cosa piu importante da sottolineare è che la maggior parte delle varianti rilevabili sono semplici polimorfismi senza alcun significato patogeno. Dunque, se la sfida per il bioinformatico è ottenere dati di qualità col minor numero di artefatti possibile, la sfida del genetista è essere in grado di interpretare propriamente il significato delle varianti. Per ulteriori dettagli sulla interpretazione delle varianti potete leggere la relativa lezione qui.

Argomenti correlati: