Ridondanza del data center (o nell’accezione inglese data center redundancy) è un approccio consolidato di componenti duplicati finalizzati a mantenere la continuità operativa dei servizi di una sala macchine nel caso alcuni componenti smettano di funzionare correttamente, permettendo di effettuare le attività di manutenzione e ripristino necessarie senza impattare sugli utenti e sul business.
I tempi di inattività, infatti, possono costare migliaia di euro alle aziende e la ridondanza è una strategia che riduce al minimo i rischi di interruzione. Secondo uno studio dell’Uptime Institute del 2022, i problemi legati all’alimentazione causano il 43% delle interruzioni significative dei data center. Ecco perché i gruppi di continuità (UPS) e i generatori sono tasselli imprescindibili se si vuole impostare la ridondanza del data center in modo corretto. I sistemi di raffreddamento sono un altro componente di cui è sempre opportuno avere una soluzione di backup, poiché un loro guasto potrebbe arrivare a compromettere una o più macchine in modo irrecuperabile.
Ridondanza del data center: come e perché è importante
Vero è che progettare la ridondanza del data center significa teoricamente spendere di più nell’hardware. L’importante è tenere a mente che l’ammontare del costo dei tempi di inattività di un data center giustifica pienamente l’investimento. Basta guardare qualche dato: nel 2019, una singola ora di inattività del server aziendale è costata tra $ 301.000 e $ 400.000 per il 25% delle aziende (Fonte: Statista 2022). Per molte organizzazioni si parla di valori ancora più alti (e in continua crescita considerando gli accessi ai dati e ai servizi cloud sempre più centrali per tutte le aziende). La ridondanza del data center consente di:
- mantenere la continuità operativa dell’infrastruttura
- ridurre al minimo i rischi di down dei sistemi e dei servizi
- accelerare i tempi di ripristino in caso di fail over
- aiutare le organizzazioni a garantire il rispetto degli accordi sui livelli di servizio (SLA)
Data management e ridondanza
Molte aziende stanno aumentando la raccolta e l’analisi dei dati perché possono migliorare il processo decisionale, semplificare le operazioni e altro ancora. Tuttavia, questa tendenza lascia le organizzazioni con notevoli quantità di informazioni sensibili a portata di mano, sollevando preoccupazioni legali ed etiche in caso di violazioni. La ridondanza aiuta a garantire che le tecnologie dei dati funzionino come dovrebbero se alcuni componenti si guastano, lasciando meno aperture per queste violazioni.
Livelli di ridondanza del data center
La ridondanza del data center è disponibile a vari livelli. Le aziende che desiderano prendere le decisioni più informate sull’architettura del proprio data center devono comprenderli nel dettaglio per riconoscerne il significato più intrinseco. I livelli di ridondanza sono incentrati sul concetto di N, che indica l’infrastruttura minima necessaria per far funzionare un data center a piena capacità. Ad esempio, se un data center necessita di quattro unità UPS per funzionare, N rappresenterebbe quattro unità. N si applica anche ad altri componenti, come sistemi di raffreddamento, sistemi di rete, sistemi di archiviazione e altri.
- Il livello più basso di ridondanza è N+1, il che significa che un data center ha un componente in più. Allo stesso modo, l’architettura N+2 fornisce due componenti ridondanti per un dato valore N. N+1 è un’architettura più comune di N+2, perché consente la ridondanza del data center e riduce al minimo i costi hardware. Molte organizzazioni potrebbero preferire N+1 per la sua convenienza in quanto possono acquistare meno hardware.
- 2N rappresenta la ridondanza al 100%, in cui i data center hanno un backup identico ai componenti richiesti. In un data center dove N è il numero di unità UPS, 2N significa averne il doppio. Alcune architetture vanno ancora oltre e forniscono 2N+1, che equivale a un backup completo più un altro componente.
Ridondanza del data center e classificazione dei tier
Il sistema N è un modo utile per misurare la ridondanza, ma in pratica, ottenere il massimo tempo di attività è qualcosa di più della semplice aggiunta di componenti. Uptime Institute ha creato un sistema per spiegare l’infrastruttura necessaria alla piena operatività del data center, ripartita su quattro livelli principali.
#1 Data center di primo livello
I data center di livello I sono quelli più basilari. Queste strutture dispongono di un’infrastruttura ridondata sufficiente a garantire un funzionamento efficiente, ma necessitano di ulteriori ridondanze. Possono resistere a interruzioni dovute a errori umani, ma non a interruzioni impreviste. In più devono essere spente per effettuare la loro manutenzione.
#2 Data center di livello II
Un data center Tier II include una certa ridondanza del sistema di alimentazione e di raffreddamento, garantendo un tempo di attività maggiore. I dipendenti, per guasti piccoli, possono rimuovere i componenti a caldo, ovvero senza spegnere il data center. Ma guasti di grandi dimensioni mettono comunque offline la struttura.
#3 Data center di livello III
I data center Tier III garantiscono la ridondanza per ogni componente della struttura. Un guasto in qualsiasi punto non influisce sulle operazioni del data center. Gli arresti non sono necessari per sostituire o mantenere le apparecchiature.
#4 Data center di livello IV
I data center Tier IV rappresentano lo stato dell’arte della continuità operativa. Queste strutture dispongono di diversi sistemi di backup indipendenti e isolati che richiedono livelli di ridondanza 2N o 2N+. Sebbene la loro manutenzione sia costosa, i tempi di inattività per questo tipo di data center sono molto improbabili.
Suggerimenti per la scelta del giusto livello
Qualsiasi organizzazione che fa affidamento sulle operazioni del data center necessita di ridondanza, ma i requisiti variano a seconda delle situazioni. Bisogna bilanciare il livello di cui ha bisogno l’azienda con il budget IT a disposizione. Il tutto in modo concreto e razionale, cioè non guardando solo all’esborso preventivo ma valutando il costo di potenziali tempi di inattività del data center, con tutte le ricadute del caso in termini di servizio e di immagine aziendale. Il che significa saper fare risk management.
I team IT, infatti, quando progettano la ridondanza del data center dovrebbero considerare la loro tolleranza al rischio. Le aziende con pochi dati sensibili o in cui gli ambienti cloud non sono mission-critical possono permettersi maggiori rischi, quindi l’architettura N+1 è probabilmente sufficiente. Tuttavia, le organizzazioni potrebbero aver bisogno di maggiore ridondanza se si affidano maggiormente al cloud o si trovano in settori più regolamentati.
Infine, è opportuno considerare i requisiti legali e la sicurezza in queste decisioni. Alcune normative potrebbero richiedere tempi di attività più lunghi. Allo stesso modo, le aziende che affrontano maggiori rischi per la sicurezza informatica dovrebbero puntare a una maggiore ridondanza per mitigare gli attacchi informatici. Indipendentemente dal livello di un’organizzazione, gli strumenti di monitoraggio automatizzati possono accelerare le risposte agli incidenti per aiutare a prevenire i tempi di inattività.