Parlare oggi di modernizzazione del data warehouse ha un significato che va oltre l’aspetto tecnologico. Il dato ha assunto un ruolo di primo piano nelle strategie aziendali, tanto che sempre più spesso si parla di organizzazioni data-driven o data-enabled. E siccome l’azienda moderna ha bisogno di poter prendere decisioni operative basandosi sui dati in suo possesso per fronteggiare una situazione economica in continuo cambiamento, è necessario che tali informazioni siano disponibili il più velocemente possibile per poter effettuare le corrette elaborazioni e analisi.
In questo senso il data warehouse tradizionale mostra i suoi limiti. È necessario quindi attivare un processo di modernizzazione così da ottenere i risultati sperati, in particolare se si considera che i dati sono sempre di più, e anche di natura diversa. Ma allora quale via scegliere? Una c’è e si chiama cloud.
Alta flessibilità e scalabilità e bassi costi
Il cloud rappresenta sicuramente la migliore opportunità per avere a disposizione una piattaforma che consenta un’elevata flessibilità e un’alta scalabilità. E ciò senza dover implementare una farm in locale e nemmeno effettuare investimenti di alcun tipo in hardware. Grazie a queste caratteristiche, il cloud risulta il modo migliore per poter disporre dello strumento più adatto a gestire tutti i dati, anche quelli che oggi non si stanno ancora usando in azienda o se si stanno usando solo parzialmente. Un esempio sono quelli che provengono dai dispositivi dell’Internet of Things per produrre analisi real-time o Near Real-Time.
“Il data warehouse tradizionale è nato quando non c’erano gli smartphone, non si faceva un uso massiccio né del web né dei social e l’IoT non conosceva – afferma Simone Bocchi, Data & Analytics Specialist di Horsa –. Nel tempo le cose sono cambiate e oggi è necessario avere un sistema che possa accogliere la nuova mole di dati, sia come formato sia come numerosità. I dati aumentano e, grazie alla sua flessibilità, il cloud ci può aiutare a gestirli perché ci permette di aumentare le risorse senza doverle acquistare né configurare: per attivarle all’occorrenza basta aver sottoscritto uno specifico contratto. E quando non ci servono più, basta spegnerle. Sempre più sorgenti sono già presenti nel cloud, va quindi da sé che cloud-to-cloud sia la soluzione più armonica e semplice da gestire”.
Un altro aspetto importate che fa del cloud una scelta di elezione per la modernizzazione del data warehouse è il controllo dei costi. Infatti, la scelta di un servizio cloud evita in primo luogo l’acquisto di macchine, compreso anche l’overprovisioning per cautelarsi contro eventuali picchi improvvisi di utilizzo, di cui si sfrutta tutta la potenza di calcolo o di storage solo per un limitato periodo dell’anno. C’è poi anche il rischio che tali macchine raggiungano l’obsolescenza senza essere state usate più di tanto. La conferma arriva da uno studio di Uptime Institute il quale indica che il 30% dei server in tutto il mondo è inutilizzato. Non va però dimenticato che un server anche quando è solo acceso e non esegue nessuna attività può consumare fino al 40% della potenza massima. Quindi, anche se inoperoso, un server comporta comunque costi energetici significativi, costi che si eliminano con un servizio cloud.
I dati in cassaforte
Oggi più che mai, un aspetto cui le aziende prestano particolare attenzione è la sicurezza del dato. In questo il cloud risulta molto competitivo. Infatti, usa un sistema di protezione talmente sofisticato che sarebbe davvero molto difficile e costoso implementare e gestire localmente. Un sistema che porta a isolare tutti i componenti della piattaforma. In tal modo, se un attacco dovesse avere successo, i cyber criminali non potrebbero entrare direttamente nella rete aziendale e nei suoi sistemi, ma, al massimo, potrebbero penetrare in uno dei servizi attivati, che comunque sono tutti controllati e gestiti.
Sicurezza però significa anche garanzia sulla disponibilità del dato. Nel cloud, della manutenzione della piattaforma e degli upgrade si fa carico il provider da cui si acquista il servizio. “È il service provider che assicura di mantenere il sistema performante ed efficiente, anche in un’ottica di business continuity – precisa Bocchi –. Viene garantito un livello di servizio by design. Questo, se fosse attivato on premise, comporterebbe un costo molto rilevante e un lungo processo di implementazione”.
L’ideale per scoprire nuovi insight
Il cloud è la soluzione ideale anche per chi deve elaborare molti dati in ottica advanced analytics, come può capitare quando si devono gestire informazioni provenienti dai dispositivi dell’IoT. “Quando si parla di machine learning e di tutto il lavoro che fanno i data scientist – sottolinea lo specialista di Horsa – c’è bisogno di servizi dedicati e, in alcuni casi, anche di una potenza computazionale di tale portata che sarebbe impensabile avere localmente, ma che invece nel cloud si attiva all’occorrenza in modo semplice grazie alla flessibilità e alla scalabilità di cui si è parlato. Così, se dovesse servire, si potrebbero avere rapidamente a disposizione servizi dedicati di advanced analytics da collegare al “moderno” data warehouse per usarlo come sorgente di dati aziendali e storici e, allo stesso tempo, come ambiente per gestire i big data e i dati in real-time.
Va precisato che il continuo aumento di informazioni, i big data, porta a dover gestire moli importanti di dati destrutturati e di tipo diverso rispetto a quelli che tendenzialmente si è abituati ad analizzare. Inoltre, quando si parla di big data solitamente i dati non provengono da database, ma sono su file e in formati destrutturati. Realizzare un data warehouse moderno Fare una modernizzazione del data warehouse significa anche poter accogliere questo tipo di dati e poterli analizzare in modo molto semplice, usando piattaforme che non richiedono particolari conoscenze o di imparare nuovi linguaggi.
Per fare un esempio, consideriamo il caso dell’industria 4.0: come è possibile monitorare in tempo reale i dati provenienti dalle migliaia di sensori IoT montati sulle macchine? In questo caso abbiamo un flusso di dati, un data streaming. Le macchine li espongono in rete e questi possono essere letti e memorizzati all’interno di un data warehouse moderno. Diventano quindi disponibili per ogni tipo di elaborazione sia necessaria, compreso l’advanced analytics.
In conclusione
“In estrema sintesi – conclude Simone Bocchi –, effettuare una modernizzazione del data warehouse significa avere sempre a disposizione i servizi e le risorse aggiuntivi che servono per gestire adeguatamente i dati, indipendentemente dalla numerosità e dalla tipologia, e le analisi che si potrebbero fare, anche in un’ottica di advance analytics. Attivo i servizi che mi servono solo quando devo utilizzarli. Questo risultato lo posso ottenere solo con il data warehouse in cloud moderno.”
Immagine da Shutterstock