DataOps come nuovo tech topic della governance. Che cosa è e perché è importante in un’ottica di Big Data Management? Secondo la definizione di Gartner, la DataOps è “una pratica di gestione collaborativa dei dati che si focalizza sul miglioramento della comunicazione, dell’integrazione e dell’automazione dei flussi informativi tra chi gestisce e chi utilizza i dati all’interno di un’organizzazione“.
Dai big data agli smart data, le nuove sfide gestionali
Ogni giorno le aziende si ritrovano a dover gestire un mare di dati, oggi diventati come oro digitale. Il capitale costituito dalle informazioni è un grosso valore aggiunto per qualsiasi organizzazione. Ma, come ironizzano gli esperti, i dati non sono solo grandi: sono anche indisciplinati e distribuiti ovunque: ci vogliono un sacco di strumenti e moltissime competenze per raffinarli e renderli utili. La storia dei big data è nota.
Nel 2010 le aziende hanno iniziato a costruire le loro infrastrutture di big data, armonizzando una costellazione di piattaforme e applicazioni finalizzate alla loro:
- memorizzazione
- archiviazione
- gestione
- distribuzione
Nell’ultimo decennio le organizzazioni hanno iniziato a sperimentare sistemi finalizzati a sviluppare, implementare e integrare una vasta gamma di soluzioni eterogenee atte a semplificare la trasformazione dei dati in modo da abilitare una business intelligence altamente funzionale ed efficace. Oggi le aziende raccolgono i frutti di tutte queste passate sperimentazioni. Ogni impresa, grande o piccola, con un gran team IT o presidiata da pochi esperti oggi è in grado di trasformare velocmente i dati in informazioni altamente scalabili.
DataOps e il ruolo della cultura Agile
Questa trasformazione del Big Data Management si deve a due fattori.
- Uno è l’evoluzione della mentalità Agile e la definizione di un framework a supporto dei dati che triangola e risolve approccio, implementazione e richieste mediante la DataOps.
- L’altro legato allo sviluppo di una serie di scoperte tecnologiche che rendono la gestione dei dati end-to-end non solo possibile, ma anche più sicura, più veloce e decisamente più utile.
Dal DevOps alla DataOps
Modellata sull’onda montante del DevOps (un framework di ingegneria Agile per l’IT aziendale che ha semplificato lo sviluppo, l’implementazione e il miglioramento continuo delle applicazioni), l’ascesa della DataOps è il risultato di una reingegnerizzazione della gestione dei dati incentrata sulla creazione di un valore aggiunto. Questo approccio, noto come get-to-value-first-get-to-value-fast, consente all’azienda di fallire o di avere successo velocemente, basandosi solo su ciò che funziona.
Nel saggio del 2019 “Getting DataOps Right”, gli autori (Andy Palmer, Michael Stonebraker, Nik Bates-Haus, Liam Cleary, Mark Marinelli) spiegano come “La necessità di DataOps è emersa quando le grandi imprese si sono rese conto dell’importanza di usare tutti i dati generati nelle loro aziende come risorsa strategica per prendere decisioni migliori ogni giorno… Analogamente a come le aziende del web avevano bisogno del DevOps per avere un framework di riferimento coerente e di alta qualità per lo sviluppo di nuove funzionalità, le aziende oggi più che mai hanno bisogno anche di un framework coerente e di alta qualità per un rapido sviluppo di dati e analisi dei dati“.
Qual è la filosofia della DataOps
Avere una cultura DataOps significa saper abilitare nell’organizzazione una collaborazione interfunzionale rispetto:
- alla gestione dei dati
- all’apprendimento attraverso la pratica
- all’implementazione rapida
- alla costruzione di ciò che funziona
Nel corso del 2020, gli osservatori affermano come la DataOps potrebbe rivelarsi la punta di diamante della gestione dei dati proprio perché così efficace ma anche foriera di una nuova generazione di grandi tecnologie.
I driver della tecnologia DataOps
Non si può andare lontano senza avere a disposizione i migliori strumenti. Ad oggi esiste una nuova generazione di piattaforme e applicazioni che:
- consentono a tutte le soluzioni per la gestione dei dati accumulate nell’ultimo decennio dall’azienda di lavorare meglio insieme
- offrono un’alternativa economica e rapida da implementare per le PMI che desiderano cavalcare la gestione dei dati su vasta scala.
Ecco tre driver tecnologici chiave che consentono l’eccellenza di DataOps e la ricerca e il raggiungimento di un rapido time-to-value:
#1 Piattaforme estensibili
I dati aziendali possono vivere ovunque: in locale, nel cloud e nel multicloud. Per molte aziende, questa distribuzione dei dati tra più sistemi spesso compartimentati tra loro è sempre sembrato un problema insormontabile, ma non è così. Le piattaforme estensibili, che possono facilmente estrarre dati da una miriade di fonti per allinearle in un catalogo di metadati, risolvono i problemi di espansione senza richiedere la costruzione di un data lake. Questa è una grande vittoria in termini di agilità, ma anche di una modalità di approccio nativamente Internet-based e accessibile a tutti gli utenti aziendali.
#2 Catalogo dati aumentato
Proprio come una piattaforma estensibile consente alle aziende di sfruttare i dati indipendentemente da dove risiedono, i cataloghi di metadati di nuova generazione (in cui i dati sono facilmente accessibili, taggabili, annotati, arricchiti e condivisi), consentono alle aziende di orchestrare i loro attuali sistemi di gestione dei dati e potenziare le loro prestazioni. Mentre Gartner esorta le aziende a passare da soluzioni di gestione dei dati incentrate sullo storage a soluizoni incentrate sullo streaming per accelerare il time-to-value, i cataloghi dei metadati, che riducono notevolmente i costi amministrativi attraverso l’apprendimento automatico, sono la vera chiave di volta. Attraverso un unico cruscotto centralizzato, il nuovo cockpit, alla stregua di una cabina di pilotaggi, garantisce visibilità e gestione dei dati in modalità end-to-end.
#3 Self-service
Attingendo ai progressi delle piattaforme estensibili e ai cataloghi di metadati aumentati, allo sttao attuale i sistemi di gestione dei dati offrono una capacità inedita per tutte le aziende: il provisioning dei dati in modalità self-service. In passato, gli analisti dovevano aspettare anche delle settimane o addirittura dei mesi prima che l’IT trovasse, estraesse ed eseguisse il set di dati richiesti a supporto di un processo decisionale. Ora analisti, data scientist e utenti della business intelligence possono acquistare i data mart (raccoglitori di dati NdR) di cui hanno bisogno, facendo risparmiare tempo e risorse all’IT. Come bonus aggiuntivo, questo tipo di dati sono pre-commissionati, controllati dalla qualità, tokenizzati e arricchiti dagli sforzi collaborativi della DataOps, con una piena armonizzazione dei dati.
Come avere successo con la DataOps: esempi
La DataOps è già il presente. Le aziende più all’avanguardia stanno sfruttando questi strumenti per offrire valore aziendale più rapidamente e con costi inferiori rispetto al passato.
È il caso di una società di servizi finanziari regionali che, sfruttando una piattaforma estensibile per la gestione dei dati, ha integrato i dati che erano custoditi e sepolti in cinque linee di business diverse ma anche fonti di terze parti diverse per creare una visione a 360 gradi tale da fornire un record d’oro di tutti i suoi clienti. Questi dati sono stati messi a disposizione degli utenti attraverso un catalogo di metadati, tramite una modalità di accesso self-service ai data scientist. Il tutto in solo otto ore al giorno di lavoro di ingegneria dei dati, un grosso risparmio di tempo e risorse e maggiori entrate legate a progetti di vendita personalizzati in soli 6 mesi.
Aumentare il business grazie alla DataOps
L’approccio Agile di DataOps, sovralimentato dalle potentissime piattaforme di ultima generazione e a strumenti di gestione dei dati, garantisce massimo beneficio dai dati.
Indipendentemente dalle loro dimensioni, oggi tutte le aziende hanno a disposizione la metodologia e la tecnologia necessarie per:
- trattare i dati su larga scala
- attivare le loro pipeline di dati
- offrire alle loro persone e alle imprese il vantaggio di una intelligenza che fa davvero la differenza