mercoledì 19 febbraio 2014

IL FUTURO DELL'ANALISI BIOINFORMATICA

analysis key
Vista la sempre crescente capacità di output dei sequenziatori (che arriva ormai ai miliardi di basi a corsa), abbiamo già detto come una delle maggiori sfide del futuro sia costituita dall'analisi bioinformatica. L'enorme potenza di calcolo richiesta costringe già oggi a dover scegliere, in alcuni casi, fra accuratezza del risultato e velocità dell'analisi. Il futuro dovrà dunque portare programmi (e computer!) in grado di gestire una gran mole di informazioni in parallelo e in tempo reale. I calcolatori quantici sono già all'orizzonte e potrebbero forse essere la risposta.

Ma vediamo più nel dettaglio quali sono i punti chiave sui quali genetisti e sviluppatori potrebbero concentrarsi fin da subito:

1. INCREMENTO DELLA LUNGHEZZA DELLE READS: una delle maggiori limitazioni della tecnologia NGS oggi disponibile sta nelle reads troppo corte. La macchina che riesce a produrre le reads più lunghe è Roche 454, ma i costi di sequenziamento di questa piattaforma non sono indifferenti. Le piattaforme Illumina, che sono fra le più diffuse, producono reads piuttosto corte. Non molto migliore è la resa di altri sequenziatori (SOLiD, Ion Torrent). Purtroppo il problema è che più le reads sono corte e più difficile è fare l'alignment corretto, poiché maggiore è la probabilità che le reads siano localizzabili in punti diversi del genoma (allineamento non univoco). Reads lunghe, invece, essendo altamente specifiche in termini di sequenza, possono essere localizzate con maggiore precisione. Riuscire a ricostruire correttamente il puzzle delle sequenze geniche del paziente è fondamentale.

2. SEQUENZIAMENTO COMPLETO DI UN NUMERO SEMPRE MAGGIORE DI GENOMI UMANI: maggiore sarà la quantità di genomi per i quali sia disponibile l'intera sequenza, più precisi ed affidabili saranno i processi di variant calling e annotation. Sappiamo che moltissimi polimorifismi (cioè le varianti patologicamente neutre che sono alla base delle differenze interindividuali) sono già stati individuati. Tuttavia ne restano ancora molti da trovare e caratterizzare (cioè ad annotare nei database). Ancora oggi, in un'analisi genetica è assai facile imbattersi in varianti mai identificate prima e perciò dal significato incerto. Il sequenziamento del genoma completo di un numero maggiore di individui consentirà certamente di acquisire informazioni più precise e quindi di ridurre significativamente i problemi interpretativi delle varianti.

3. INTEGRAZIONE FRA ANALISI DEL GENOMA, DEL TRASCRITTOMA, DEL PROTEOMA e DELL'INTERATTOMA: per sapere con quale probabilità una determinata mutazione può essere biologicamente rilevante è necesessario sapere se il gene in cui questa si trova venga tradotto in proteina o trascritto in un ncRNA (non coding RNA). Non solo: idealmente dovrebbe essere possibile conoscere nel dettaglio l'interazione di quella proteina o di quel trascritto con le altre molecole della cellula. Ecco dunque che i software di analisi delle sequenze dovrebbero sapersi integrare con gli algoritmi di analisi delle proteine, dei trascritti e delle interazioni molecolari. In altre parole, analisi del genoma, del trascrittoma, del proteoma e dell'interattoma (interactome) dovrebbero operare in sinergia.

Per saperne di più: Libri e Pubblicazioni sulla Bionformatica (in italiano), Libri e Pubblicazioni sulla Bioinformatica (in inglese), Libri e Pubblicazioni sulla Next Generation Sequencing.

Argomenti correlati:

Nessun commento: