È italiano il software open source per analizzare i Big data di DNA e proteine. Lo hanno realizzato i ricercatori dell’Università Statale e del Policlinico di Milano, con lo scopo di rendere più semplice e veloce la ricerca scientifica nell’ambito biochimico, biomedico e della bioinformatica.
Si chiama reString il software made in Italy e open source di Big data che, in pochi minuti e pochi passaggi, è in grado di analizzare migliaia di dati su genoma e proteine, senza necessità di possedere know-how specifici.
reString analizza i Big data di DNA e proteine
I ricercatori del laboratorio di Farmacologia sperimentale e Biologia dell’Aterosclerosi dell’Università Statale di Milano hanno pubblicato su Scientific Reports della rivista Nature un articolo, in cui illustrano come hanno sviluppato il software open source e gratuito per analizzare i Big data di DNA e proteine. Il team di Giulia Chiesa, docente del dipartimento di Scienze Farmacologiche e Biomolecolari, ha compilato il programma informatico in Python, un linguaggio che gode dei seguenti vantaggi:
- è un linguaggio a codice aperto;
- l’open source è liberamente disponibile a tutti;
- il software è multipiattaforma e può girare sulla maggior parte dei sistemi operativi;
- risulta adattabile in base alle esigenze dei ricercatori;
- il programma informatico presenta un canale con il laboratorio che lo ha implementato, per poter richiedere un’estensione e l’aggiunta di nuove opzioni.
Inoltre, il software open source, dedicato all’analisi del genoma e delle proteine, consente anche ai ricercatori, senza competenze informatiche e privi di esperienza nel campo della bioinformatica, di condurre analisi complesse, ottenendo risultati in modo rapido e soprattutto in pochi click.
Il software reString, infatti, è in grado di analizzare centinaia di migliaia di dati, permettendo alla ricerca scientifica di non perdere tempo e di ridurre, se non azzerare, gli eventuali errori che invece un’analisi manuale potrebbe contenere e replicare.
reString, come funziona
reString può servire a comprendere al meglio quale effetto produce una dieta sul corpo umano, l’impatto dell’invecchiamento sul rischio di patologie cardiovascolari e molto altro ancora: “Il nostro software è in grado di recuperare in modo automatico informazioni e dati utili da enormi banche dati online, in base ai risultati che si stanno ottenendo in laboratorio”, ha dichiarato Stefano Manzini, primo firmatario dell’articolo scientifico che descrive il software reString nei dettagli: “È poi in grado di ‘riassumere’ questi dati in modo più immediato e comprensibile, mettendo insieme gli elementi comuni o più ricorrenti in tutte le condizioni sperimentali della ricerca, per quanto numerose possano essere”.
Lo sviluppo di questo software per i Big data di DNA e proteine potrà aiutare a “capire, all’interno di centinaia di migliaia di dati, quali siano i più promettenti nello spiegare un dato fenomeno e quindi in quale modo indirizzare ricerche future. Normalmente è un’analisi che viene svolta manualmente nei laboratori che non hanno ricercatori dedicati esperti in bioinformatica, e porta via parecchi giorni preziosi: ora, grazie a reString, può farlo chiunque e in pochi click”.