Oggi, buona parte delle imprese si professa data-driven poiché le principali decisioni strategiche vengono indirizzate dall’analisi dei dati. Posto che la visione di data-driven company è ben più ampia, in quanto coinvolge la cultura, l’organizzazione e, soprattutto, le decisioni operative (non solo quelle strategiche), non è detto che il dato in sé sia in grado di fornire indicazioni attendibili. Prendere una decisione guidata dai dati non significa che sia di per sé corretta, e questo accade perché spesso le imprese si concentrano più sui modelli di analisi che sulla qualità dei dati di input, che invece è fondamentale per l’esito finale.
I dati devono essere affidabili, rilevanti, corretti e accurati, altrimenti tutto l’apparato di trust, di fiducia nei confronti del dato, viene messo seriamente in pericolo. In altri termini, i dati devono essere giusti in funzione dell’analisi da svolgere. Cosa che non sempre accade.
Data Quality, perché è una sfida per le imprese
Talvolta diamo per scontato che il dato sia una sorgente affidabile per le attività di analisi, ma così non è. Nicola Carracciuolo, Country Manager Italy di CKDelta, società del gruppo CKHutchison che si occupa di valorizzazione e monetizzazione dei dati della rete mobile WindTre, ci spiega che diverse aziende basano le proprie decisioni su dati che non rappresentano fedelmente la realtà: dati obsoleti, derivanti da fonti non aggiornate, con bassa storicità o polarizzati, che non riescono a rappresentare lo scenario che si sta – o che si vorrebbe – analizzare.
“Le aziende hanno un’infinità di dati a disposizione – spiega Carracciuolo – ma la tradizionale gestione a silos fa sì che essi siano in repository diversi, non comunicanti e, talvolta, abbiano proprio significati diversi. Ultimo aspetto, ma non meno importante, molti dati non vengono verificati e c’è il rischio che non siano corretti. A titolo d’esempio, parte di quelli che vengono utilizzati per il targeting dell’advertising online sono generati da bot: se l’azienda non se ne accorge o non ne tiene conto, l’impatto sulla spesa può essere determinante. Citando Forrester, il 20% della spesa dell’adv online è sprecata a causa della scarsa accuratezza dei dati, il che si traduce in decine di miliardi di dollari ogni anno”.
Altri aspetti che dovrebbero far riflettere le imprese nel cammino verso la data-driven company sono i repentini cambi di scenario dovuti a eventi globali come il Covid-19, il climate change e gli scenari geopolitici, che di fatto hanno reso obsoleti i dati storici su cui le aziende hanno sempre basato le proprie analisi e decisioni. Si consideri, per esempio, la mobilità urbana: negli ultimi anni sono repentinamente cambiati i servizi, le dinamiche di utilizzo e le abitudini dei cittadini, e questo ha reso necessari dati che descrivano il nuovo scenario. Ciò ha fatto venire meno le certezze e ha letteralmente spiazzato molte imprese, poiché l’applicazione della data science (via AI e Machine Learning) non può essere d’ausilio se il dato di partenza non descrive le dinamiche attuali.
Tutto ciò conduce a un’altra considerazione: al fine di descrivere correttamente i fenomeni, è sempre più importante integrare i dati interni con quelli di terze parti, come quelli dei clienti e dei social, che però – per definizione – hanno bisogno di opportune attività di cleaning al fine di fornire insight rilevanti e attendibili. Tutto ciò crea ulteriore complessità, ma è inevitabile in un percorso data-driven.
L’appropriatezza del dato è alla base dell’innovazione
Secondo Carracciuolo, c’è una connessione diretta tra la data quality e la capacità innovativa dell’impresa: “Innovazione significa trovare nuove soluzioni a problemi reali, con impatti significativi e duraturi. La qualità del dato permette, per prima cosa, di identificare il problema, che altrimenti rimarrebbe nascosto in informazioni poco significative, errate o incapaci di descrivere lo scenario oggetto di analisi. Il dato di qualità ci aiuta non soltanto a prendere decisioni strategiche rispetto ad obiettivi definiti, ma anche – e, talvolta, soprattutto – a comprendere problemi e inefficienze di cui l’azienda non è consapevole, indirizzandola verso soluzioni innovative. Grazie a tecniche avanzate di AI e Machine Learning, un buon dato può manifestare dei segnali deboli che, spesso, sono il sintomo di qualcosa di importante, da prendere in considerazione. Questi segnali deboli, ovviamente, non sono rilevabili in dati di scarsa qualità”.
Obiettivi chiari, diversità di dati e competenze di dominio
Come si dovrebbero muovere, oggi, le imprese per affrontare correttamente questa tematica e percorrere con grinta la strada che conduce alla data-driven company? Per CKDelta, il percorso parte da una chiara definizione degli obiettivi, poiché – come anticipato – il concetto di qualità del dato non è unicamente sinonimo di correttezza, ma di adeguatezza per l’analisi da eseguire: il dato deve essere quello giusto per l’obiettivo che l’azienda si pone.
Secondo punto, la ricchezza e la diversità di dati che, come detto, crea sfide importanti ma è l’unico modo per ottenere quelle correlazioni virtuose da cui emergono i segnali deboli. Sotto questo profilo, ci spiega Carracciuolo, è possibile – sfruttando algoritmi di AI e Machine Learning – utilizzare dati affidabili per il cleaning di altri dati con un livello minore di qualità e attendibilità. Anche in questo caso, l’esempio è quello dei dati dell’advertising online, che possono essere confrontati con quelli della telefonia mobile, tradizionalmente sono molto più attendibili. Lo stesso processo può trovare applicazione in molti altri ambiti, dalle utility al fintech.
Massimizzare la qualità del dato non è possibile senza forti competenze di dominio, ovvero non possono esistere data scientist generalisti. Proprio su questo punto, unito alle competenze tecniche, CKDelta fonda il proprio vantaggio competitivo: facendo parte di un gruppo globale operante nei settori della comunicazione mobile (è azionista unico di WindTre), del retail, delle infrastrutture e della logistica, CKDelta può miscelare le immense quantità di dati a propria disposizione con competenze avanzate di dominio, che sono fondamentali per definire il reale valore dei dati e per indirizzarlo verso risultati concreti.
Infine, ma non per importanza, non possono mancare un po’ di sana curiosità e una data culture pervasiva, che le imprese stanno cercando – in maniera più o meno faticosa – di introdurre al proprio interno. Sia pur indirettamente, anche qui la qualità del dato ha un impatto: la riduzione del rumore riduce anche la complessità e permette di raggiungere risultati concreti che alimentano un circolo virtuoso data-driven, il cui fine non è soltanto la correttezza delle decisioni strategiche, ma di tutte quelle che contraddistinguono l’operatività di ogni giorno.
Articolo in collaborazione con CKDelta