MILANO – La conoscenza del cliente attraverso l’analisi di informazioni multisource rappresenta uno dei capisaldi della “nuova” economia data driven; per raggiungere questo obiettivo, i data lake, permettendo di archiviare i dati nel loro formato naturale in un unico repository, rappresentano la metodologia di archiviazione ideale. Ma l’equazione che lega dati e conoscenza non è scontata, se non esiste una stretta governance sui processi di analisi e raccolta delle informazioni.
Da qui deriva la proposition di Talend, azienda francese specializzata in soluzioni di integrazione cloud e big data: “Secondo Gartner – ha precisato Massimo Tripodi, Sales Country Manager della filiale italiana – il 90% dei dati all’interno dei data lake non viene utilizzato; Experian sostiene che il 32% sia inaccurato [campione di aziende statunitensi, ndr]. I progetti di data lake, insomma, sono destinati a fallire se non corredati da servizi a supporto per il governo e la qualità delle informazioni. Spesso i data lake sono stati costruiti con l’obiettivo di archiviare quanti più dati possibile, senza prevenire la formazione di silos informativi e trascurando gli aspetti di gestione e pulizia che invece dovrebbero guidare dall’inizio lo sviluppo del progetto”.
Per sbrogliare la matassa, integrazione e governance sono le parole magiche e si concretizzano nell’offerta tecnologica del vendor: la piattaforma Talend Data Fabric, nella versione Winter 17, permette di connettere dati da una pluralità di fonti cloud e locali, sfruttando tecnologie open source come Hadoop o Spark 2.0 (novità dell’ultima release) e aggiungendo funzionalità di preparazione per big data (tra cui un data-dictionary pre-configurato e personalizzabile, che permette il riconoscimento automatico del valore dei dati grezzi nel data lake) e una app self-service di stewardship (i responsabili delle Lob possono intervenire nei processi di governance dei dati, contribuendo a preservare integrità e compliance).
Nata in Francia nel 2005, oggi Talend conta 1.300 clienti nel mondo e sfiora un fatturato di 100 milioni di dollari: “Da sei anni, cresciamo con un tasso del 40% e da sette trimestri l’offerta cloud ha totalizzato +100%. In Italia, abbiamo 22 clienti all’attivo e nel 2016 abbiamo realizzato +165% rispetto al budget assegnato. Abbiamo definito un piano biennale di crescita, che arricchirà l’organico con nuove figure commerciali, tecniche e di marketing”, ha dichiarato Tripodi che ha identificato i pillar a sostegno della crescita: modello di go-to-market orientato al cliente, tecnologia future-proof (integrazione rapida con nuove soluzioni e rilascio di software / updates ogni due settimane), supporto nativo a Hadoop e Spark. Le direttrici di investimento future riguardano l’estensione del supporto alle piattaforme cloud (oggi limitato ad Amazon, ma in programma per Azure e altri provider locali) e alle tecnologie big data (si aggiungerà Apache Beam, modello di programmazione open source per attività di elaborazione dati in batch o streaming), nonché funzionalità per la governance dei dati e self-service.