Tutti, consapevolmente o meno, siamo nella condizione di generare dati, in ogni momento della nostra vita. Principalmente nell’ambito della vita professionale, dove la produzione di dati è chiaramente indirizzata e finalizzata al raggiungimento di una serie di obiettivi, e nella vita sociale e personale dove la produzione di dati, diretta e indiretta è altrettanto importante anche se non sempre chiaramente identificabile. Sempre e comunque la rappresentazione delle nostre azioni in digitale o l’analisi del nostro comportamento come consumatori, solo per fare due esempi, sono un denominatore comune del nostro rapporto con il digitale che ha un impatto diretto a livello di relazione con le imprese o con le Pubbliche Amministrazioni. Nel business l’esempio oggi più calzante è quello dell’Industria 4.0 e dell’Impresa 4.0 che con la virtualizzazione dei processi e dei prodotti stessi sta permettendo alle imprese di esplorare forme un tempo impensabili di innovazione come, anche qui è solo un esempio, quella della Service Transformation, della trasformazione del rapporto con i clienti dalla vendita di un oggetto fisico alla vendita del servizio connesso all’utilizzo di quell’oggetto.
Siamo partiti da questi esempi per fissare il tema dell’importanza economica e sociale dei Big Data e della Data Science. Una centralità che sta conquistando un ruolo determinante nei processi di sviluppo della conoscenza nelle imprese e nelle Pubbliche Amministrazioni e che rappresenta una leva determinante per sviluppare nuove forme di vantaggio competitivo.
Ma se appare chiara l’importanza e il ruolo dei dati è altrettanto importante “fare in fretta” perché i processi di innovazione stanno vivendo una vera a propria accelerazione e i Big Data non aspettano. Tanto che il titolo scelto dall’edizione 2017 della ricerca dell’Osservatorio Big Data Analytics & Business Intelligence della School of Management del Politecnico di Milano appare esplicito e incalzante: “Big Data is now: tomorrow is too late”. Ed è lo stesso responsabile scientifico dell’Osservatorio Carlo Vercellis a sottolineare che la sfida è sulla rapidità nel costruire conoscenza e occorre leggere il mercato anche sul paradigma delle capacità dei concorrenti di acquisire conoscenza.
Le principali tendenze nell’adozione dei Big Data e della Data Science
La propensione agli investimenti in Big Data permette di individuare e capire i fenomeni che caratterizzano questo mercato. Certamente emerge un grande tema legato agli skill e alle competenze professionali così come allo sviluppo di nuove figure professionali, nuove modalità organizzative. All’orizzonte, in questo senso, appare anche la prospettiva legata allo sviluppo e all’adozione di nuovi strumenti di Self Service Data Analytics. Ma il vero tema riguarda la gestione della Data Science, ovvero i motori che spingono all’adozione o allo sviluppo di queste soluzioni e agli obiettivi che vengono posti a queste progettualità.
L’Osservatorio sintetizza i quattro grandi “motori” della Data Science:
- Business Driven – Sono le aree di business che guidano e il team di Data Scientist lavora direttamente con le aree di business di riferimento.
- Modello centralizzato – In questo caso l’azienda ha scelto di dare vita a una struttura dedicata alla Data Science, con un CDO Chief Data Scientist e con un team che si interfaccia con il business.
- Matriciale – Questo modello prevede una figura di coordinamento che è chiamata a gestire i progetti in relazione alle esigenze delle funzioni di business.
- Ibrido – Se si sintetizzano i modelli precedenti prende forma una sorta di modello ibrido che unisce sia la visione matriciale sia quella centralizzata.
Opportunità Data Science: il ruolo dei Data Scientist
Abbiamo visto che termini di nuove professionalità lo sviluppo di Big Data Analytics sta facendo emergere la nuova professionalità del Data Scientist (Leggi qui come si diventa Data Scientist), che esprime prima di tutto una chiara vocazione multidisciplinare in grado di comprendere sia skill prettamente digitali, di calcolo matematico, di analisi e di visualizzazione, ma anche competenze di analisi del business e dei mercati, di sviluppo e di capacità di personalizzazione degli stessi strumenti di analisi e di utilizzo di strumenti di machine learning. La crescita di una figura e di un ruolo come quello del Data Scientist va di pari passo con la crescita di nuovi modelli organizzativi che siano capaci di studiare nuove modalità di gestione delle attività di Analytics.
I progetti di Big Data prevedono ovviamente un importante coinvolgimento dei CIO o dei Responsabili IT che però sono chiamati a confrontarsi con soggetti o con team specifici composti da figure professionali specifiche che non fanno parte del team IT ma che ad esempio all’interno delle Line of Business utilizzano strumenti di Analytics per esigenze vicine al business e per gestire anche in autonomia i processi di interrogazione dei dati, di analisi alla visualizzazione degli insight, di conoscenza approfondita dei mercati. È in questo contesto che emerge l’utilizzo di soluzioni di tipo “self-service”.
Data Quality e Data Governance
La crescita dei dati in tutte le organizzazioni e la crescita di dati spesso eterogenei provenienti da fonti nuove e spesso ancora non strutturate (come possono essere, ad esempio, tutte le fonti di dati che fanno capo alla diffusione dell’Internet of Things) chiedono di mettere in relazione il tema della quantità dei dati con quello della qualità e di fatto conducono verso l’argomento della Data Governance. Governare lo sviluppo dei dati, la loro analisi e la gestione delle azioni che sono conseguenti all’analisi rappresenta una delle basi della Data Quality. Grazie alla Data Governance si possono controllare i processi e i metodi aziendali, si possono controllare gli errori, si possono prevedere e suggerire azioni preventive o correttive, proprio per garantire sempre la migliore qualità dei dati.
Più in particolare la Data Governance ha lo scopo di garantire che i dati siano gestiti in modo efficace e sicuro. E questa sicurezza deriva sostanzialmente dalla capacità di implementare una struttura organizzativa espressamente dedicata al raggiungimento di questo obiettivo. Questo obiettivo va calato anche a livello di team e di organizzazione e naturalmente anche a livello di competenze. Ecco che per la Data Governance ci si orienta verso competenze come:
- Responsabile Data Governance: può essere in realtà lo stesso CDO Chief Data Officer o comunque una figura che si occupa delle strategie di Governance e della loro implementazione.
- Data Owner: si tratta di una figura molto importante responsabile della definizione degli specifici requisiti di business del dato e di come devono essere indirizzati verso le azioni di business. Il Data System Owner è invece la figura del team IT che segue la gestione tecnica dei sistemi di governance dei dati.
- Data Quality Manager: focalizzata sul tema della qualità dei dati questa figura è chiamata a definire il quadro di riferimento della Data Quality aziendale.
- Data Steward: definisce e controlla l’implementazione delle politiche e degli standard aziendali legati alla qualità dei dati.
- Data User/Users: rappresenta le figure aziendali che sono chiamate a lavorare sui dati con diversi livelli di autorizzazione, con differenti mansioni per il raggiungimento degli obiettivi aziendali.
Le strategie e le azioni di Data Governance incidono direttamente sull’insieme dei processi e delle policy di trattamento dei dati con ricadute dirette in termini di data quality. La qualità è naturalmente una sintesi di diversi attributi come l’integrità dei dati, come la sicurezza e la compliance alle normative, come la data lineage, ovvero la possibilità di garantire la ricostruzione di un percorso di produzione e di analisi dei dati o anche come l’impact analysis, intesa come la capacità di analizzare gli impatti diretti e indiretti delle modifiche sui dati.
Dalla Data Science alla Customer Science
Nel corso del 2017 è di fatto avvenuta l’integrazione tra l’Internet of People e l’Internet of Things. I due fenomeni hanno iniziato a saldarsi partendo proprio dal presupposto della centralità dei dati. Le aziende hanno inaugurato o hanno intensificato la possibilità di mettere in relazione tanto il comportamento dei clienti (ad esempio) quanto il comportamento degli ambienti. Il lavoro di lettura, di analisi, di interpretazione di questi dati ha permesso di sviluppare nuovi servizi e di individuare nuove tipologie di esigenze. Il risultato si è concretizzato in nuove possibili azioni a livello di up-selling o cross-selling, ma anche di insight sempre più precisi sulle più specifiche esigenze dei clienti.
La crescita progressiva di Big Data Analytics e Data Science nel 2017
La ricerca dell’Osservatorio mostra un mercato in ottima salute. Nel 2017 il settore Big Data e Analytics ha superato i 1.100 milioni di euro e ha registrato una crescita del 22% rispetto ai 905 milioni di euro del 2016 mostrando una ulteriore accelerazione rispetto ai tassi positivi di crescita del 2016 (15%) e del 2015 (14%). Un trampolino quello del 2017 che getta le premesse per una crescita ancora più importante per il 2018 con aziende sempre più orientate verso l’“estrazione di valore” dai dati con investimenti in ambito Business Intelligence, Big Data e Analytics e Data Science.
L’utilizzo di Big Data Analytics appare sempre più fondamentale per cogliere diverse opportunità e per gestire fenomeni di sviluppo come Industry 4.0, Digital Banking, Smart Retail, o per supportare processi di adempimento a normative come GDPR e, nel caso delle banche, PSD2. Il tutto con il fine di individuare nuove forme di generazione di valore basate sui dati anche in termini di Data Monetization.
In questo scenario sia le grandi imprese (sorpattutto) sia le PMI (quelle più orientate all’innovazione) scommettono sulle potenzialità dell’analisi dei dati. Il mondo enterprise lo sta facendo interpretando una sorta di second wave della Data Driven Strategy per svolgere un ruolo attivo nella Data Driven Economy, le aziende più piccole si avvicinano invece alle tematiche e alle prospettive della Data Science attraverso strumenti di Data Visualization e di Data Analytics di base e servizi di supporto al Marketing e in questo senso un ruolo importante è svolto dalla Data Monetization.
I componenti del mercato Big Data e Data Science in Italia
(Per approfondire l’analisi del fenomeno Big Data Analytics in Italia leggi l’articolo Big Data: Cosa sono, come utilizzarli, soluzioni ed esempi applicativi)
Ma come si è sviluppata la crescita del 22% del mercato Big Data (per saperne di più sui leggi il servizio Data Science e Data Scientist, Big Data: soluzioni e skill della Data Driven Economy) nel nostro paese e come ha raggiunto i 1,103 miliardi di euro? A guidare questo settore, oggi, sono soprattutto le grandi imprese (87% della spesa complessiva contro il 13% delle PMI). È possibile vedere questa suddivisione degli investimenti:
- La quota più importante attiene al software (il 42%). Costituita da database, strumenti di sostegno all’acquisizione e all’elaborazione dei dati, ma anche da piattaforme di visualizzazione e di analisi dei dati, il software comprende anche soluzioni di software applicativo per il supporto al marketing, alle vendite, all’amministrazione, alla finanza o al controllo. In particolare poi il 12% della spesa software è dedicata a database, prevalentemente di tipo relazionale. Gli strumenti di ingestion, processing, integration e quality pesano poco meno del 6%, e quelli dedicati alla data visualization e reporting il 7%. Le piattaforme di Analytics e di Data Science valgono un ulteriore 12%, mentre i software indirizzati a supportare con logiche di Analytics avanzate uno specifico processo coprono il restante 5%.
- La seconda voce più rilevante è costituita dai servizi. Con il 33% le attività legate alla personalizzazione del software, alla integrazione con sistemi informativi aziendali e alla consulenza di rivisitazione dei processi rappresenta una componente importantissima del business Big Data. Più in dettaglio il 17% dei servizi è costituita dalla system integration, mentre il 10% riguarda espressamente attività di personalizzazione del software e il 6% risulta invece indirizzata da esigenze di consulenza di processo.
- Il ruolo fondamentale delle infrastrutture. Dimensionalmente più limitata rispetto alle altre voci la spesa per infrastrutture rappresenta il 25% degli investimenti in Big Data e Analytics in Italia. In questo contesto troviamo investimenti per sviluppare la capacità di calcolo, i server, lo storage sia in forma onpremise sia in Cloud. Nello specifico va evidenziato un 13% di investimenti in server e macchine virtuali, un 10% in storage mentre circa un quinto delle risorse di calcolo e storage fa riferimento a soluzioni cloud.
Le soluzioni di riferimento per i Big Data e la Data Science in Italia
Dal punto di vista degli investimenti in soluzioni e piattaforme la crescita del mercato Big Data nel 2017 ha premiato soprattutto le piattaforme di Analytics e Data Science, i database NoSQL/NewSQL, la system integration e i software di data ingestion e processing. Una tipologia di spese che segnalano come le imprese siano impegnate in investimenti che abilitano progetti complessi, con una logica predittiva. Nel caso specifico dell’Industria 4.0 e dell’Impresa 4.0 si può leggere questo fenomeno come una conferma dello sviluppo di progetti di Service Transformation e di Data Servitization.
I mercati di riferimento per la Data Science nel nostro paese
Se si guarda ai mercati di destinazione la ricerca dell’Osservatorio evidenzia come il mondo delle banche e della finanza continua a essere uno dei settori più attenti e sensibili a questo tipo di investimenti con una quota che arriva al 28%. Si sente poi l’effetto del fenomeno Industria 4.0 con il Manifatturiero che arriva al 24%, seguono poi le Telco e i Media con una quota del 14%, la PA e tutto il mondo della Smart Health al 7%. Un ruolo importante è svolto dalla Grande Distribuzione Organizzata e dal Retail che con il 7% evidenzia un interesse crescente per i Big Data così come nelle Utility (6%) e nelle Assicurazioni (6%). Nella lettura dei trend si osserva che alcuni settori sono più attenti di altri agli investimenti in Big data e Data Science con Assicurazioni, Manifatturiero e Servizi che crescono con tassi superiori al 25%, mentre Banche, Grande Distribuzione Organizzata e Telco e Media esprimono una domanda con tassi di crescita tra il 15% ed il 25%.
Perché le imprese scelgono i Big Data e la Data Science
Quali sono gli obiettivi delle imprese che scelgono di investire in Big Data e Data Science?
Per le imprese più orientate al mondo dei consumatori finali e in generale al B2C il miglioramento dell’engagement è un driver importantissimo tanto che la ricerca relativa al 2017 lo evidenzia in una quota che è pari al 70%, non possono mancare le vendite. Anche l’ambito della progettazione e della produzione sono ampiamente rappresentati con l’obiettivo di ridurre il time to market (66%). Sul fronte più gestionale ci sono imprese che hanno scelto di investire per ottimizzare la propria offerta e per ridurre i costi (57%) mentre nel 41% dei casi la scelta è legata alla ricerca di nuovi mercati.
Ma la ricerca, oltre alle aspettative, ha voluto misurare anche i riscontri ottenuti, ovvero la capacità di dare una risposta a queste aspettative. A parte il tema della ricerca di nuovi mercati (“solo” il 38% delle aziende dichiara di averlo raggiunto), in tutti gli altri casi i Big Data hanno prodotto risultati consistenti e più che apprezzabili con un aumento delle vendite (91%), con la riduzione del time to market (78%), ma anche con la riduzione dei costi (56%), con la ottimizzazione dell’offerta allo scopo di aumentare i profitti (73%).
Le quattro tipologie di analytics che compongono la Data Science
I percorsi per trasformare i dati in valore e per permettere alle imprese di diventare delle Data Driven Company possono essere schematizzati in quattro grandi componenti, tutte ovviamente rilevanti per la definizione di una strategia completa per i Big Data ma presenti in diversa misura nelle imprese in funzione delle competenze e delle risorse disponibili.
- Descriptive Analytics riguardano la maggior parte delle imprese che utilizzano sostanzialmente gli strumenti di Analytics orientati a descrivere la situazione attuale/passata dei processi aziendali e/o aree funzionali.
- Predictive Analytics sono costituite dagli strumenti avanzati per l’analisi dei dati e dai modelli predittivi.
- Prescriptive Analytics si compongono di strumenti avanzati che permettono ai decision maker di disporre di soluzioni operative e strategiche basate sulle analisi.
- Automated Analytics si tratta di strumenti che permettono di implementare con forme di automatismo le azioni che sono il frutto delle attività di analisi.
La figure professionali della Data Science in azienda
Nel corso della ricerca dell’Osservatorio Biga Data Analytics e Business Intelligence del Politecnico relativa all’anno 2018 si è portata l’attenzione sul ruolo della Data Science nelle imprese e nelle organizzazioni e la ricerca ha permesso di individuare che è in crescita il numero delle realtà che hanno scelto di adottare un modello di governance per la Data Science numero che è passato, nel corso del 2018 dal 17% al 31%, grazie all’inserimento di personale dedicato agli Analytics. Un fenomeno che nel 14% delle grandi aziende italiane coincide anche con l’avvio di una vera e propria strategia data-driven. L’inserimento di figure dedicate è la risposta più concreta al freno più importante nello sviluppo di strategie di Big Data nelle imprese. Un freno testimoniato dal fatto che nel 2018 il 77% delle grandi aziende indicava nella carenza di risorse interne dedicate alla Data Science come la principale difficoltà nel far partire progetti, Nello specifico poi il 29% di queste imprese sceglieva una azione di “supplenza” con consulenti esterni.
Ma quali sono le figure chiave per i progetti e per gestire strategie Big Data nelle imprese e nelle organizzazioni?
- Prima di tutto si parla di Data Scientist che si stanno diffondendo nelle grandi imprese e chi ancora non ha queste figure nella propria organizzazione prevede di farlo a breve.
- Un’altra figura chiave è il Data Engineergià ben presente nelle grandi imprese con compiti di data ingestion, di creazione di data pipeline e di programmazione.
- Il team Data Science comprende poi il Data Analyst a sua volta fortemente presente nelle grandi aziende italiane è una professione in forte sviluppo. I suoi compiti comprendono la produzione di reportistica efficace, la ricerca e la definizione di pattern e relazioni tra grandi moli di dati.
- Il Data Visualization Expert è un altro ruolo importante chiamato a unire competenze di Analytics con temi legati alla interpretazione e visualizzazione degli stessi e dunque con la creazione di dashboard e di rappresentazioni grafiche intuitive e comprensibili. È una figura ancora poco presente ma a sua volta in crescita.
- Ultima, ma certamente non per importanza, la figura del Data Science Manager, chiamato a coordinare i team dedicati agli Analytics.
Data Science tra Dati, Privacy e GDPR
Non può mancare nello sviluppo dei Big Data il tema GDPR, ovvero l’impatto a livello di Big Data degli adempimenti connessi al regolamento UE per la protezione dei dati personali. Il GDPR (General Data Protection Regulation) sarà applicato nei Paesi UE dal 25 maggio 2018 e fornirà regole più chiare in materia di informativa e consenso, grazie anche alla definizione di criteri che sono chiamati a regolare le procedure di gestione digitali dei dati: dal trattamento automatizzato dei dati personali, alle tematiche di protezione degli stessi dati alle forme di protezione di fronte alle violazioni (Data Breach) piuttosto che le logiche stesse per il trasferimento dei dati al di fuori dell’UE. Qualsiasi strategia di Big Data deve partire dalla normativa GDPR, a maggior ragione nel caso di aziende che operano nel B2C o comunque che sono chiamate a gestire volumi di dati legati a consumatori e clienti.
Analytics più “democratici” grazie al Cloud
Un altro grande tema è quello dell’accesso agli strumenti di Data Analytics, della possibilità di sostenere le nuove progettualità e per certi aspetti, più ancora, di sostenere la necessità di fare sperimentazione sulla Data Analytics, sperimentazione che serve poi per individuare delle linee di sviluppo sulle quali costruire i progetti veri e propri da “mandare in produzione”. In questo senso un ruolo crescente è svolto dal Cloud, che con la capacità di velocizzare l’utilizzo di soluzioni di Analytics, di sviluppare forme più flessibili, di ridurre i costi di accesso permette di aprire nuove prospettive anche per aziende con minori risorse. La scalabilità appare come una delle caratteristiche più importanti del Cloud nel percorso di sviluppo di progettualità da parte di aziende che sono nella necessità di analizzare grandi quantità di dati senza disporre di infrastrutture o soluzioni interne specifiche. Anche per questo l’offerta di servizi Cloud si sta arricchendo di piattaforme di Analytics, spesso anche con forme di specializzazione come possono essere gli IoT Analytics o i Social Analytics.
Articolo aggiornato da Mauro Bellini il 21 Ottobre 2019
Immagine fornita da Shutterstock