Nel tentativo di aiutare a combattere l’epidemia da Covid-19, Google Cloud ha creato COVID-19 Public Dataset Program, un archivio di dati pubblici, liberamente accessibili e consultabili, dedicato a ricercatori, data scientist e analisti impegnati a studiare e a comprendere l’entità della diffusione e dell’impatto di questo virus. L’accesso a set di dati e a strumenti in grado di analizzarli su larga scala grazie al Cloud, risulta essenziale per il processo di ricerca, soprattutto nella risposta globale al nuovo Coronavirus.
Il “registro” comprende il set di dati Johns Hopkins Center for Systems Science and Engineering (JHU CSSE), il Global Health Data della Banca Mondiale e i dati di OpenStreetMap, che rimarranno accessibili fino al 15 settembre 2020. Da specificare, è che non sono gestite o inserite informazioni personali identificabili (PII) né informazioni private sulla salute (PHI). Google segue pratiche e norme specifiche per garantire che i dati vengano gestiti in conformità con le norme sulla privacy e sulla sicurezza dei dati dei pazienti.
Data set e strumenti in Cloud per svolgere ricerche avanzate sul Covid-19
L’insieme di dati relativi al SARS-CoV-2 ora accessibili e disponibili gratuitamente per la ricerca, in modo rapido e semplice, eliminano la necessità di cercare e caricare file di dati di grandi dimensioni. Dall’interno di Google Cloud Console, i ricercatori possono accedere ai dati, così come alla descrizione degli stessi e a sample query per svolgere ricerche avanzate.
Con i data set disponibili sul data warehouse serverless cloud BigQuery si può disporre di query gratuite, che assieme alla possibilità di condividere rapidamente risultati e analisi con colleghi e persone in generale, facilita la comprensione di come si sta diffondendo il virus.
Inoltre, a disposizione dei ricercatori c’è BigQuery ML che aiuta a sviluppare modelli avanzati di machine learning su questi dati direttamente all’interno di BigQuery, senza costi aggiuntivi e senza la necessità di particolari competenze di programmazione poiché sono presenti modelli addestrati e accessibili tramite SQL, strumenti di business intelligence e fogli di calcolo.
Immagine fornita da Shutterstock.