La Data Governance, ovvero la possibilità di esercitare un controllo più saldo sui dati e sulle pratiche di gestione degli stessi, riveste oggi importanza cruciale per le organizzazioni. Questa “disciplina” ha come obiettivo l’integrazione di sistemi e banche dati, per standardizzare i dati e il loro significato, grazie a opportune infrastrutture tecnologiche. Diversi i benefici riscontrabili: oltre a valorizzare il patrimonio informativo, migliora la conoscenza delle basi dati utilizzate in azienda; si arriva alla creazione di un dizionario comune, gli scambi tra i diversi sottosistemi informatici sono facilitati, c’è una migliore capacità di stimare i costi della non qualità dei dati e dei rischi associati e una maggior efficacia del servizio per l’utente finale. Non solo; vantaggi interessanti si intravedono anche attraverso attività collaterali: l’analisi dei dati, la loro certificazione e integrazione, il ridisegno dei sistemi, l’inserimento di controlli software, l’eliminazione di ridondanze, lo sviluppo di nuovi datawarehouse.
Tuttavia, impostare una corretta strategia di Data Governance richiede una particolare attenzione agli aspetti organizzativi con focus su persone, processi, ruoli e responsabilità. A spiegarlo è Enzo Ferrari, Product Manager Data Integration e Data Quality di SAS.
ZeroUno: Quali sono le aree aziendali interessate dalla Data Governance e in che modo devono essere gestite?
Ferrari: L’obiettivo più comune di un progetto di Data Governance è standardizzare la definizione dei dati, stabilire le regole per il loro accesso e utilizzo, identificare i soggetti interessati, chiarire le responsabilità. In definitiva, esercitare un controllo sistematico sui dati a livello enterprise in modo che ne sia condivisa l’interpretazione e la comprensione, mantenendone il più elevato livello di qualità possibile. Ciò significa pensare in modo ampio alla gestione di persone, processi, metodologie e tecnologie; a tutti quegli elementi dell’informazione necessari a creare un costante e corretto trattamento di tutti i dati. Da un punto di vista pratico, fare Data Governance implica attività di data quality, gestione dei dati, dei processi aziendali e dei rischi legati al trattamento dei dati.
ZeroUno: Da un punto di vista metodologico, come deve essere “organizzata” la Data Governance?
Ferrari: La Data Governance necessita di uno sforzo organizzativo piuttosto impegnativo perché richiede l’intervento di diverse aree di business e deve quindi essere guidata da un team di persone con competenze e conoscenze sia di business sia tecnologiche. I team dedicati alla Data Governance, solitamente, sono composti da persone di uffici e funzioni diverse: non solo amministratori di dati e personale Ict, ma anche responsabili delle diverse linee di business (marketing, amministrazione, vendite, ufficio legale, ecc.); questo perché la problematica è vasta e occorre avere una chiara visione d’insieme per affrontarla. In particolare, nelle fasi iniziali si seguono metodologie per il monitoraggio e il miglioramento dei dati aziendali che utilizzano strumenti per la mappatura dei dati, la loro profilazione, pulizia e controllo.
ZeroUno: Dal punto di vista architetturale e tecnologico, invece, cosa significa fare Data Governance? Quali sono gli step di implementazione tecnologica da attuare per raggiungere uno status ottimale?
Ferrari: Un efficiente programma di Data Governance dovrebbe prevedere tre differenti livelli architetturali: nello strato più basso è necessario implementare strumenti di Etl (Extract, transform and load), per trasformare, aggregare e instradare i dati, sia in modalità batch sia in tempo reale, indipendentemente dalla loro tipologia (analitici, operazionali e transazionali), e di data quality, per analizzare, bonificare, correggere, arricchire e uniformare i dati rendendoli qualitativamente validi, fruibili e generare informazioni consistenti e affidabili.
A un livello intermedio si trova l’ambiente finalizzato al controllo e al monitoraggio delle policy di data quality e dei modelli (compresi quelli per la compliance) che, attraverso strumenti user-friendly, consentono agli utenti, solitamente di business, di impostare e definire le regole e controllarne l’esatta applicazione.
Al livello architetturale superiore, infine, andrebbero impostate le funzioni di gestione e valutazione dei processi di controllo del data quality (ossia implementare sistemi che monitorizzino gli scostamenti rispetto alle metriche definite).
Va sottolineato comunque che, da un punto di vista tecnologico, non stiamo parlando di scelte invasive. Il cambiamento più complesso viene invece dall’adeguamento dei processi e dall’assegnazione delle responsabilità. Per poter avere una corretta Data Governance, in grado di fornire informazioni utili alle analisi dei dati, è fondamentale identificare i soggetti interessati, assegnare i corretti ruoli (chi è responsabile dei dati e delle necessarie correzioni, chi le deve effettuare, come e quando è opportuno compierle, ecc.).