Primo Report trimestrale sull’attività di Ricerca del Dott. Riccardo Masetti

Primo Report trimestrale sull’attività di Ricerca del Dott. Riccardo Masetti

L'obiettivo primario del primo trimestre è stato quello di eseguire un sequenziamento massivo-parallelo del trascrittoma (Whole-Transcriptome Sequencing) di diversi casi di Leucemie Mieloidi Acute-infant (LAM-infant) con cariotipo normale allo scopo di identificare delle possibili mutazioni comuni (recurring mutations) che possono avere un ruolo importante nel processo di leucemogenesi e, di riflesso, nella definizione del profilo prognostico e terapeutico. In totale è stato sequenziato il trascrittoma dei blasti midollari di 13 casi di AML-Infant totali di cui 8 presentavano un cariotipo normale e non presentavano nessuno dei marcatori molecolari notoriamente associati alle leucemie mieloidi acute. I restanti pazienti esaminati, pur avendo anch'essi un cariotipo normale, presentavano alcune delle più frequenti e comuni alterazioni genetiche proprie delle LAM e sono stati analizzati al fine di avere un controllo positivo per tutto il processo di sequenziamento massivo.
Le librerie di RNA messaggero (mRNA) sono state generate mediate il TruSeq RNA Sample Prep Kit v2 (Illumina) in accordo con le indicazioni del produttore e il sequenziamento massivo-parallelo è stato eseguito sul sequenziatore di nuova generazione HiScanSQ (Illumina) in corse paired-end da 2x75 basi (con TruSeq SBS Kit v3-HS, Illumina). I dati di sequenziamento massivo sono stati quindi analizzati e filtrati allestendo specifiche pipeline per individuare tutte le possibili alterazioni genetiche (variazioni a singolo nucleotide, fusioni geniche, mutazioni frameshift, etc...) presenti nella coorte di pazienti analizzati.
Complessivamente sono state sequenziate 80.48 miliardi basi (GB) con una produzione totale di 1.1 miliardi di reads. La coverage aploide media ottenuta è di 35X. L'Allineamento delle sequenze contro la build 37 del genoma umano disponibile al National Center for Biotechnology Information (NCBI) e il successivo processamento dei dati con il software SNVMix2 ha permesso di identificare un numero totale di 1,868,155 variazioni a singolo nucleotide (SNVs). Di questi, 630,764 rappresentano delle nuove variazioni a singolo nucleotide non ancora identificate. Abbiamo distinto le nuove SNVs identificate in esoniche e non esoniche e, tramite l'utilizzo di un predittore (SNP&GO), abbiamo identificato 186 nuove SNVs potenzialmente associate alla patologia. Tra i geni trovati essere mutati nei casi analizzati, sono presenti sia geni notoriamente implicati in differenti tumori umani (KRAS, NRAS, JAK3, CREBBP, GATA1, MCL1) sia geni che invece non sembrano avere una diretta connessione con la trasformazione cellulare (FECH, UROD, UROS, GCAT, ect..). Una valutazione accurata del possibile ruolo biologico di queste mutazioni a singolo nucleotide sarà necessaria per determinare quali di queste mutazioni possono essere alla base della leucemogenesi e possono avere una rilevanza prognostica e terapeutica.
Per identificare dei possibili nuovi trascritti di fusione, i dati ottenuti dal sequenziamento massivo-parallelo sono stati analizzati con due differenti predittori di trascritti chimerici, ChimeraScan e deFuse. Eseguendo una intersecazione tra i potenziali trascritti di fusione identificati dai predittori è stato possibile identificare 33 putativi trascritti di fusione e, attraverso un filtraggio basato sul numero di reads che mappavano esattamente sulla fusione (splitted reads) e le reads che mappavano sulle regioni fiancheggianti la stessa (span reads), il numero di fusioni tra geni è stato ulteriormente ridotto sino ad 11 nuovi putativi trascritti di fusione. Importante considerare che tra questi putativi trascritti di fusione sono stati identificati i trascritti chimerici che sapevamo essere presenti in alcuni dei campioni analizzati. Tale dato rappresenta un importante controllo positivo interno a tutto il processo di sequenziamento massivo-parallelo e alla successiva analisi bioinformatica dei dati garantendo la correttezza del procedimento di predizione/filtraggio, nonché l'affidabilità sulle nuove putative fusioni di geni individuate. Tra le nuove putative fusioni tra geni identificate, la fusione CBFA2T3-GLIS2 è stata la prima a essere indagata maggiormente nello specifico data la sua ricorrenza in 3 dei casi di LAM-Infant a cariotipo normale sequenziati. La fusione deriva da una inversione paracentrica del cromosoma 16 e coinvolge il gene CBFA2T3, membro della famiglia di fattori trascrizionali ETO, e il gene GLIS2, codificante per una fattore trascrizionale che è strettamente correlato con i membri della famiglia GLI i quali mediano la risposta trascrizionale alla attivazione del pathway di segnalazione di Hedgehog. L'effetto biologico di questo trascritto chimerico e degli altri putativi trascritti di fusione identificati sarà validato nel prossimo futuro considerando le caratteristiche strutturali e funzionali della proteina chimerica codificata dalla fusione tra geni.
Lo studio proseguirà continuando la validazione delle alterazioni genetiche individuate (SNVs e trascritti di fusione) e allargando la casistica di LAM a cariotipo normale (infant e pediatriche) al fine di valutare la reale ricorrenza di queste nuove mutazioni.