Mauro Bellini @mbellini3 Linkedin
Per Big Data si intende un insieme eterogeneo di dati sia strutturati sia non strutturati, che può essere definito dal punto di vista delle dimensioni, del volume, della varietà e della veridicità.
I Big Data si qualificano in particolare per le modalità operative e per le strategie necessarie a gestire, interpretare ed estrarre valore da questi dati. La tipologia di analisi effettuabile e le modalità di esecuzione sono elementi determinanti per definire il concetto di Big Data.
I Big Data devono esprimere un volume di dati correlato e commisurato alla effettiva capacità del sistema di gestione di acquisire le informazioni dalle differenti fonti, nel rispetto delle fonti stesse. Operativamente un sistema è nella condizione di svolgere funzioni di Big Data nel momento in cui è in grado di gestire l’aumento del volume di dati raccolti con un aumento proporzionale della velocità e del flusso di informazioni gestibili per unità di tempo (per secondo).
Cresce con Mobile e Internet of Things la produzione di dati
Se si pensa all’aumento enorme di dati prodotti, grazie a fenomeni come Mobile e Internet of Things non si può non considerare che imprese e Pubbliche Amministrazioni potrebbero arrivare facilmente a produrre zettabyte di dati, comprendendo tutti i dati che arrivano appunto dall’IoT, dai Wearable, dalle componenti finanziarie, dai pagamenti digitali, dai dati legati agli ambienti e alle macchine che stanno alla base dell’Industria 4.0.
Per affrontare il tema Big Data occorre prima chiarire velocemente il concetto di Dataset. Con il costante aumento della dimensione dei Dataset, ovvero degli insiemi di dati strutturati in forma relazionale. Come può essere ad esempio il contenuto di una singola tabella di database in cui la dimensione del dataset è data dal numero dei componenti presenti, che formano le righe, e dal numero delle variabili per ciascun set di dati che formano le colonne.
Big Data: archiviare e ricercare enormi moli di dati in modo razionale
A fronte di un aumento del numero e delle dimensioni dei Dataset cresce la necessità di archiviare in modo razionale dati che aumentano costantemente in modo esponenziale e soprattutto di estrarre i dati e le informazioni necessarie sia direttamente alle attività delle imprese sia quelle che si possono definire come aggiuntive o accessorie, la cui importanza aumenta costantemente. Come ad esempio i dati che arrivano dall’ascolto dei social media e che permettono di disporre di una analisi dei propri clienti o dei propri prospect o dei mercati di riferimento in termini di trend o di umori che quanto più vengono raffinati tanto più possono incidere sul business.
I Big Data permettono la estrazione razionale, corretta e puntuale di questi dati e facilitano i passaggi per trasformali in informazioni e dunque, poi, in conoscenza. ma i Big Data permettono anche la interrelazione dei dati che provengono da fonti diverse ed eventualmente anche tra loro eterogenee. I Big Data consentono cioè la gestione di dati anche non strutturati, come possono essere. tweet, post, commenti, testi, immagini, email, dati GPS.
I Big Data permettono la gestione di enormi quantità di dati, nell’ordine di zettabyte, ovvero miliardi di terabyte e necessitano di una notevole capacità di calcolo.
Il McKinsey Global Institute ha definito i Big Data come un sistema che gestisce dataset la cui taglia/volume è talmente grande che eccede la capacità dei sistemi di database relazionali di catturare, immagazzinare, gestire e analizzare.