La capacità di collezionare, gestire e distribuire i dati oggi è fondamentale per qualsiasi azienda di successo. L’enorme quantità di informazioni disponibili, infatti, può generare effettivo valore soltanto con un’adeguata infrastruttura alla base che ne permetta la governance. Il cloud si rivela un’ottima soluzione per disporre di performance e spazio di archiviazione scalabile, ottimizzando i costi con un modello di pagamento a consumo e demandando le attività di manutenzione.
Così è possibile sintetizzare la storia sviluppata da Bata, noto marchio di calzature, con la tecnologia di Snowflake, società americana con un fatturato da due miliardi di dollari, che fornisce una piattaforma SaaS per la gestione unificata dei dati.
Nata nel 1894 nell’attuale Repubblica Ceca, l’azienda di scarpe ha accresciuto nel tempo i suoi mercati e oggi vanta una presenza globale. La crescita del business e la parallela digitalizzazione si sono accompagnate a maggiori necessità tecnologiche, soprattutto in termini di capacità del data warehouse. Da qui, la decisione di passare alla soluzione cloud di Snowflake con l’obiettivo di sostituire l’architettura dati in essere basata su uno scenario on-premise, ottenendo un guadagno significativo in termini di capacità e flessibilità.
La crescita aziendale e le nuove esigenze di data warehouse
«Bata – racconta Riccardo Lunardi, Business Intelligence and Planning Manager per l’Europa – è uno dei più grandi produttori di calzature di tutto il mondo. È presente in più di 70 paesi in cinque continenti, ha 21 impianti produttivi di proprietà distribuiti in 18 Paesi e attualmente conta oltre 5300 punti vendita, gestiti sia direttamente sia in franchising».
Nel Bel Paese, Bata ha consolidato una rete di oltre 240 negozi e nel quartier generale di Padova risiedono i Sistemi Informativi che centralizzano la raccolta dati per tutto il Vecchio Continente.
«Nel database che gestiamo – spiega Lunardi – convogliano le informazioni delle cinque country europee, ovvero Italia, Spagna, Svizzera, Repubblica Ceca e Slovacchia, e di tutti i franchising distribuiti sul territorio, dal Portogallo ai Paesi dell’Est. I dati raccolti riguardano la gestione del magazzino e della logistica, ma anche le vendite, quindi le casse dei negozi, le anagrafiche dei clienti, il sistema CRM (Customer Relationship Management) e così via, con un livello di dettaglio molto spinto».
L’enorme mole di informazioni da gestire, in crescita continua, si scontrava quindi con i limiti di performance e capacità di storage degli ambienti on-premise che rappresentavano l’architettura as-is di Bata.
«Il nostro data warehouse – precisa Lunardi – include dati di stock e di vendita dal 2010. Nel 2018 siamo passati a un data center on-premise piuttosto “carrozzato”, che ci ha permesso di avere un po’ di respiro. Tuttavia, negli ultimi cinque anni, il volume di dati è cresciuto considerevolmente, nonostante evitiamo di scendere sotto a un certo livello di granularità; ad esempio, le scorte a magazzino vengono fotografate settimanalmente e non giornalmente.
Avendo un database su Oracle, riscontravamo un problema di spazio e la necessità di effettuare una serie di manutenzioni sempre più pesanti per migliorare le performance. Servivano quindi competenze tecniche molto elevate e un maggiore coinvolgimento di ditte esterne. Inoltre, c’erano i costi che orbitavano attorno al pagamento dell’appliance puro».
Il cloud per migliorare spazio, performance e scalabilità
Sulla spinta di driver primari come le performance, lo spazio e i costi, è stata fatta una serie di valutazioni che hanno portato all’incontro con Snowflake. «Avremmo potuto – puntualizza Lunardi – proseguire sulla via dell’on-premise semplicemente continuando a potenziare la struttura esistente, ma abbiamo preferito altre strade e personalmente sono rimasto molto impressionato dalle potenzialità di Snowflake. Così, dopo un salto di ruolo da Specialist a Manager della mia divisione, ho scelto di portare avanti questo cambiamento tecnologico, convinto che il cloud sia l’alternativa che prenderà piede e andrà inevitabilmente a sostituire la componente on-premise».
Secondo Lunardi, “l’architettura dati di nuova generazione” propugnata da Snowflake porta sia benefici materiali in termini di costi, prestazioni e spazio, sia vantaggi non tangibili come la tranquillità di non pensare ai limiti dell’infrastruttura e la possibilità di concentrare le “risorse mentali” solo su attività produttive. Nello scenario on-premise infatti, lo sforzo era diretto soprattutto a garantire che le performance del database e lo spazio su disco fossero sufficienti a supportare le necessità aziendali.
L’importanza dell’ETL per strutturare l’acquisizione delle informazioni
Il passaggio da Oracle a Snowflake, che è compliant a livello di SQL, finora è avvenuta senza criticità.
«L’obiettivo del progetto – afferma Lunardi – era effettuare la migrazione dei dati evitando di apportare cambianti pesanti, cercando di razionalizzare e ottimizzare il più possibile i processi di backend e di toccare il frontend il meno possibile.
L’utilizzo di uno strumento ETL (Extract, Transform, Load) in cloud, in grado quindi di comunicare nativamente con un database sulla nuvola, ha facilitato il processo di migrazione dei dati. Le difficoltà hanno interessato piuttosto la riscrittura del linguaggio procedurale di SQL, che, nel nuovo database, va gestito a livello di workflow ETL piuttosto che come un processo scritto in codice.
La scelta di quanto mettere all’interno del database viene demandata all’utente e, ad esempio, non esiste un rinforzo automatico sui duplicati. Pertanto, bisogna strutturare bene la componente ETL per evitare che il processo raddoppi le chiavi. Infatti, i caricamenti non vanno in errore, i dati entrano lo stesso e vengono duplicati. Diventano quindi necessari dei controlli pre- e post- inserimento. Pertanto, è stata dedicata un’attenzione particolare alla componente ETL per strutturare al meglio la fase di acquisizione delle informazioni».
Verso una soluzione di data warehouse interamente sul cloud
Inizialmente l’iniziativa si è concentrata sui job principali e più pesanti. «Dopo circa cinque mesi dall’inizio del progetto – prosegue Lunardi -, attualmente stiamo perfezionando i job che richiedono più lavoro dal punto di vista degli strumenti di integrazione e dello spostamento dal punto A al B. Da oltre un mese abbiamo iniziato una fase di caricamento parallelo, ovvero sul mondo as-is e contemporaneamente con tutti i tool nuovi. Ciò ci permette di controllare che anche sulla parte di frontend del dato combaci tutto e quindi di prendere sempre più fiducia nel potere staccare la spina dall’on-premise».
Come dichiara Lunardi, l’obiettivo finale è spostare completamente la componente di data warehouse su Snowflake, lasciando tutta l’appliance sulla parte di casse Oracle che avranno quindi l’ambiente di datacenter interamente dedicato.
Dati disponibili più velocemente e con migliore visualizzazione
Il cambiamento ha portato significativi vantaggi non solo in termini di prestazioni, spazio e scalabilità dell’infrastruttura dati, ma anche dal punto di vista del business. «Possiamo sviluppare con più confidenza – suggerisce Lunardi – tutta una serie di tool per l’utente finale, migliorati in termini di richiesta del dato e visualizzazione grafica.
Ad esempio, abbiamo progettato e implementato per tutti i negozi della catena italiani ed europei una dashboard di PowerBI per interrogare i dati relativi al punto vendita, anche del giorno stesso, in modalità live. Con il database in essere, ciò non sarebbe stato possibile o almeno non alla stessa velocità. Per quanto una dashboard grafica possa essere interessante, se il motore dietro è lento nel caricare i dati, gli utenti non saranno incentivati nell’adozione».
La disponibilità dei dati, secondo Lunardi, permette di aumentare l’efficienza e la produttività degli addetti al punto vendita, che riducendo i tempi per la ricerca delle informazioni e altre attività gestionali, potranno dedicarsi maggiormente a seguire il cliente, con ricadute positive sulla qualità del servizio.
Insomma, l’utilizzo gradualmente sempre più ampio e intenso di Snowflake fornisce una continua riprova dell’efficacia del cloud per ottimizzare il data warehouse aziendale, allineando la tecnologia alle esigenze strategiche del business.