“Sul mercato siamo tutti alla ricerca di dati, tutti abbiamo capito che il nostro lavoro è basato sui dati, siamo o vogliamo diventare data driven – esordisce Antongiulio Donà, Country Sales Leader di Talend –Tuttavia al momento questo desiderio si configura soprattutto come un esercizio gigantesco di raccolta di dati che ci vede più collezionisti che veri analizzatori, capaci di capire dai dati come ci stiamo comportando e immaginare come ci dovremmo comportare”.
È vero che sono a disposizione strumenti di Business Intelligence per estrarre informazioni dalla massa informe dei dati, ma di fatto le grandi basi dati, i Big Data, sono diventate difficili da controllare, con dati che arrivano da più fonti, molti arrivano da Internet che di per sé non garantisce certo l’affidabilità del dato o da provider che ne difficilmente sono davvero in grado garantirne la qualità.
È quanto invece promette nuova versione della piattaforma Talend Data Fabric, che consentirà, grazie a Talend Data Score, di valutare istantaneamente la salute dei dati, ottimizzandoli e rendendoli pronti all’uso, accelerando così le migrazioni al cloud, semplificando le analisi dei dati e garantendone la conformità.
Da collezionisti ad analisti di dati
Le soluzioni Talend cercano di offrire una risposta concentrandosi soprattutto su due aspetti, some sottolinea Donà:
- la qualità dei dati e la distribuzione all’interno delle aziende in una logica self-service per mettere gli operatori finali nelle condizioni di poter lavorare in modo facilitato;
- il governo dei dati, per sapere come sono fatti nel loro essere profondo.
L’elemento caratterizzante della piattaforma Talend è riuscire a indicare la qualità che ci si può aspettare sia dati interni sia dai dati provenienti dall’esterno.
“L’impostazione di Talend stravolge il comportamento tradizionale, che vede prima l’integrazione dei data base e poi la pulitura dei dati – aggiunge Donà – Secondo Talend la qualità dei dati (quanto sono affidabili, credibili e utilizzabili) è l’unico elemento che li caratterizza”.
Come opera la piattaforma Talend, grazie a Trust Score
“Quando si lavora su una piattaforma. sono previsti strumenti come il nostro Data inventory che punta a un insieme di dati di cui viene fatto una sorta di inventario – spiega Donà – A questo punto interviene Trust Score che ne analizza un estratto e restituisce in un cruscotto, semplice da comprendere, la diagnosi di qualità”.
Gli utenti sono immediatamente in grado di valutare dal cruscotto se un certo data set è pronto per l’utilizzo; in particolare l’IT può decidere se metterlo in produzione o se serve un lavoro ulteriore supportato dai preparatori dei dati Talend.
Per entrare più in dettaglio sul funzionamento della piattaforma:
- i data set, presenti in ambienti multi cloud, on-premise e ibridi, inclusi data warehouse in cloud dei principali fornitori, vengono indicizzati automaticamente con un crawler;
- i criteri utilizzati per valutare l’affidabilità dei dati, trasparenti per le organizzazioni, sono generalmente validità, popolarità, completezza, rintracciabilità e utilizzo;
- l’intelligenza artificiale e umana concorrono per dare un’immagine completa della salute dei dati;
- la piattaforma Talend, Trust Score incluso, sono realizzati con software open source, con tutti i benefici di trasparenza, qualità e potenza connessi.
In prospettiva…
“Operiamo e continueremo a operare su clienti di tutte le dimensioni direttamente o appoggiandoci sui partner; in pratica tutti i principali System Integrator presenti sul mercato italiano rivendono le nostre soluzioni – sottolinea Donà, che conclude – Da Trust Score ci aspettiamo che da un lato generi un grande interesse dai parte di organizzazioni già nostre clienti per i benefici significativi che potrebbero averne, dall’altro un boost importante da nuovi clienti non appena percepisco il ruolo dirompente che può offrire la capacità di sapere in pochi secondi la qualità di un data base”.