sabato 12 ottobre 2013

COS'È UNA REFERENCE SEQUENCE?

Cosa è una reference sequence
Di molti organismi, incluso l’uomo, conosciamo l’intera sequenza codificante e non codificante del genoma. La sequenza codificante e non codificante di ogni gene è annotata nei database informatici ed è comunemente nota come reference sequence. In alcuni casi possono esistere diverse reference sequences, ognuna per ogni isoforma della proteina in questione. Sappiamo, infatti, che, a causa dello splicing alternativo, molte proteine possono essere espresse in isoforme diverse, le quali sono in effetti codificate da trascritti alternativi (il termine trascritto - transcript - viene spesso utilizzato come sinonimo di reference sequence). Le reference sequences sono utilizzate in modo regolare nella ricerca e nella diagnostica di routine per confrontare le sequenze dei pazienti. In gergo tecnico si parla di allineamento (alignment): la sequenza del paziente viene cioè allineata con quella presente in banca dati per vedere se e dove essa presenti deviazioni (varianti) che potrebbero spiegare il fenotipo patologico del paziente. Il processo di identificazione delle varianti è detto in gergo variant calling e può essere eseguito manualmente dall'operatore (di solito per piccoli frammenti di DNA) o automaticamente da un software che valuta sia le caratteristiche elettroforetiche del tracciato (Sanger sequencing) che, nelle analisi exome/genome sequencing, la probabilità statistica che la variante identificata sia reale piuttosto che un artefatto.

Da un punto di vista pratico è molto importante insistere sul concetto di isoforme alternative e, quindi, di trascritti alternativi. Infatti, laddove una proteina presenti una o più isoforme alternative, bisogna analizzare ciascuna mutazione in ogni trascritto, poiché se in uno o più trascritti essa può apparire innocua, può in effetti risultare patogena in un altro trascritto. Ad esempio, è possibile che una mutazione che nel trascritto A cade in una regione intronica, cada nel trascritto B in un regione codificante, generando una mutazione missenso o nonsenso di significato patogeno. Di queste diverse possibilità è necessario tenere conto nell'interpretazione finale di un test genetico.

A: 29.09.14

Argomenti correlati: