L’Inova Translational Medicine Institute (Itmi), l’importante istituto di ricerca medica mondiale, ha implementato Cloudera Enterprise per analizzare in modo sicuro un’ampia raccolta di dati clinici e genomici in modo rapido e su vasta scala al fine di innovare più velocemente nell’ambito della ricerca della medicina traslazionale.
Come parte del Centro Inova per la Salute Personalizzata (Icph), il team di scienziati, ricercatori, analisti e collaboratori di Itmi utilizza algoritmi di apprendimento automatico su terabyte di informazioni cliniche e genomiche con l’obiettivo di identificare i legami genetici con le malattie.; realizzano scoperte dalle informazioni sui dati e, in collaborazione con il medico curante, sviluppano piani di trattamento personalizzati per i pazienti. Questo approccio è anche conosciuto come medicina di precisione e ha il potere di aiutare i pazienti a vivere più a lungo e ad avere una vita più sana.
La genetica svolge un ruolo importante nella maggior parte delle principali cause di morte negli Stati Uniti, tra cui malattie cardiache, cancro e diabete. L’Istituto raccoglie dati clinici da migliaia di pazienti di Inova di oltre 110 Paesi. Il Dna unico di una sola persona contiene sei miliardi di bit di informazioni. La mappatura dei codici Dna degli individui nelle sequenze genomiche aiuta gli scienziati a determinare la causa delle malattie e scoprire le terapie trasformative. Come parte di questo processo, l’Itmi sta assemblando quello che si prevede sarà uno dei più grandi database di sequenze di genomi di tutto il mondo collegato alle informazioni sui pazienti in un sistema sanitario.
“La sfida per i ricercatori e gli scienziati Itmi – ha dichiarato Aaron Black, Chief data officer di Itmi- è stata quella di analizzare in modo più rapido ed efficiente le nostre enormi e complesse raccolte di dati ‘grezzi’ e tradurre le analisi in una cura concreta del paziente. Siamo ora in grado di ottenere risposte in pochi minuti e possiamo trovare delle correlazioni che prima erano inimmaginabili. I nostri ricercatori dedicavano l’80% del loro tempo nel gestire la confusione dei dati e solo una piccola parte all’analisi degli stessi. Questa situazione si sta pian piano invertendo. Ora possiamo accelerare il ritmo della scoperta genomica e cambiare drasticamente il modo in cui interagiamo con i nostri team di ricerca. Riteniamo che questo migliorerà la nostra capacità di fornire le giuste terapie ai pazienti e, in definitiva, a migliorare i risultati. Quello che Cloudera ha realizzato lo ha reso un risultato raggiungibile a breve”.
Che cosa ha fatto Cloudera?
La piattaforma di Cloudera ha permesso a Itmi di ottimizzare l’analisi dei dati genomici a fini diagnostici. Questa analisi dei dati genomici consente a uno scienziato di bioinformatica di studiare le correlazioni genomiche di persone con condizioni come l’artrite, le malattie autoimmuni o il cancro. In passato, data l’enorme dimensione di genomi completi, il completamento di questo processo poteva richiedere a Itmi fino a due mesi. Utilizzando Cloudera, è possibile eseguire l’analisi end-to-end dei dati in una settimana. Per il futuro l’istituto prevede di eseguire queste analisi dei dati in poche ore.
Lavorando con Cloudera, Itmi ha creato un’infrastruttura bioinformatica globale per la raccolta di dati dei genomi dell’Istituto – sempre più consistente –contrapposta agli archivi clinici. L’infrastruttura è stata progettata per archiviare ed elaborare questa convergenza di dati biologici, in velocità e in modo scalabile, oggi e anche in futuro.
Considerando che un genoma è pari a più di tre miliardi di coppie di base di Dna, Itmi attualmente tiene traccia di circa 9.000 genomi completi sequenziati, con una previsione di crescere a 15.000 in futuro. Il moderno database analitico di Cloudera, alimentato da Apache Impala (in fase di progettazione), fornisce analisi SQL a elevate prestazioni per i big data. Con la flessibilità, la scalabilità e la velocità offerta dalla soluzione Cloudera, il team Itmi applica la contemporaneità multiutente e analisi ad alte prestazioni dei dati genomici acquisiti da madri, padri e bambini partecipanti a diversi studi familiari di base. Per esempio, l’Istituto è stato in grado di sfruttare la sua esperienza nell’analisi clinica e genomica per aiutare a individuare anomalie congenite precedentemente non diagnosticate nei bambini. Si tratta di un processo iterativo che richiede tempo ma, grazie a strumenti come Cloudera, Itmi prevede di accelerare ancora di più il processo di diagnosi per aiutare le famiglie.
“L’architettura unica e avanzata per i big data di Inova – ha commentato Shawn Dolley, industry leader, health e life science di Cloudera – risponde alla diversità della comunità dei pazienti e alla portata dell’innovazione. Cloudera è orgogliosa di lavorare con questi pionieri nella genetica clinica su larga scala, che stanno sviluppando la ricerca genomica e l’assistenza sanitaria personalizzata. Itmi sta migliorando il modo in cui i ricercatori e i clinici possono gestire e fruire dei dati genomici e molecolari. Tramite la combinazione di dati clinici e genetici e la stratificazione nell’apprendimento automatico trasformeremo le decisioni che vengono prese nella cura dei pazienti, nella prevenzione delle malattie e nella sanità pubblica di precisione”.