Con disaster recovery si intende, letteralmente, un ripristino di emergenza in seguito al verificarsi di una catastrofe, ovvero il tempo e il lavoro necessari per ritornare attivi e operativi dopo un evento di perdita di dati o inattività (fonte Zerto).
Il disaster recovery non riguarda soltanto il tempo in cui sistemi e dipendenti non riescono a essere operativi, ma anche la quantità di dati persi. Si intendono, perciò con questo concetto, l’insieme delle misure tecnologiche e organizzative atte a ripristinare sistemi, dati e infrastrutture necessarie all’erogazione di servizi di business. Il Disaster Recovery Plan (DRP) è il documento che esplicita tali misure, compreso all’interno del più ampio piano di continuità operativa (BCP). Le aziende dovrebbero porsi questa domanda: “Quanto ci costa un’ora di inattività?” E soprattutto: “È possibile ricordare e riprodurre il lavoro che i dipendenti (o i sistemi) hanno svolto nelle ultime ore?” Il 95% delle aziende non è in grado di rispondere a queste domande.
Disaster recovery e backup dei dati
Una soluzione ben nota è quella di effettuare un backup dei dati, che comporta la replica dei dati o delle virtual machine in un altro dispositivo o ubicazione. Questa operazione va eseguita periodicamente in base a un intervallo di tempo prestabilito (ad esempio ogni 24 ore), affinché tali dati, o virtual machine, possano essere ripristinati o utilizzati per scopi di conformità.
Tuttavia, in casi di emergenza, il backup è uno strumento insufficiente senza l’adozione di una soluzione di disaster recovery (DR) che permetta di ripristinare file, software e funzionalità. In genere, una soluzione di questo tipo non si limita a ricopiare i dati nel sistema in cui si trovavano originariamente, se un server è inattivo, è necessario reinstallarlo, riconfigurarlo e persino sostituirlo. Con un backup, le virtual machine devono essere ricreate praticamente da zero, poiché i processi di backup non offrono funzionalità di automazione.
Disaster recovery e business continuity
Nelle aziende di oggi, in cui le attività sono basate sui dati e non conoscono interruzioni, la business continuity dipende completamente dalle infrastrutture IT, che devono restare sempre attive e operative 24h al giorno. I costi dei tempi di inattività sono enormi e la perdita dei dati può mettere a serio rischio l’esistenza stessa delle aziende. La perdita dei dati non è causata soltanto da calamità naturali, interruzioni di corrente, guasti dell’hardware ed errori commessi dagli utenti ma è sempre più spesso la conseguenza di problemi riscontrati con il software. È quindi fondamentale adottare strategie di sicurezza e business continuity intese a ridurre al minimo i rischi di perdita dei dati e tempi di inattività per le aziende moderne.
Ricerche condotte da vari istituti dimostrano che il volume e i costi della perdita dei dati aumentano di anno in anno. La necessità di adottare una strategia di business continuity in grado di garantire tempi di attività e diminuire la perdita dei dati, equivale alla sottoscrizione di una polizza assicurativa digitale per qualsiasi azienda. Il rischio è più probabile di ciò che sembra.
Le aziende e il DRP
Quante aziende hanno effettivamente pensato a questa eventualità e hanno adottato un Disaster Recovery Plan? Lo studio Global State of Cybersecurity nelle piccole e medie imprese del 2019 del Ponemon Institute ha rilevato che oltre un terzo delle Pmi non ha in atto un piano di risposta agli incidenti. Questa mancanza di preparazione potrebbe essere estremamente costosa in quanto le aziende sono tenute a riportare i loro sistemi alla normalità dopo un attacco. Quali sono le conseguenze:
- il 93% delle aziende senza disaster recovery, che subisce una perdita dei dati, è fuori mercato entro un anno.
- un singolo attacco ransomware, ad esempio, può distruggere anni di dati e mettere in ginocchio un’organizzazione in pochissimo tempo. Peggio ancora sono i casi in cui i dati riservati finiscono nelle mani sbagliate. Se non si dispone di una corretta strategia di risanamento e di risposta, potresti dover affrontare un danno reputazionale paralizzante.
- anche i dati analitici potranno risultare macchiati per una eventuale analisi di mercato.
Non si tratta di una calamità così lontana da immaginare se pensiamo che, negli ultimi cinque anni oltre il 50% delle aziende ha avuto un evento di inattività che è durato più di una giornata lavorativa completa. Il 52% degli incidenti di perdita di dati è dovuto a un errore umano.
Secondo i grandi player, quasi tutte le aziende possono riprendersi da un disastro se dispongono di un piano DR sufficiente. Ciò che conta davvero è l’adozione di una cultura della responsabilità attraverso la formazione continua del personale, combinata con una politica DR chiaramente documentata e un supporto proattivo per la tua infrastruttura tecnologica.
Disaster recovery e strategie
Il ripristino di emergenza è il processo di ripristino delle normali operazioni dopo che un evento imprevisto ha distrutto una parte o l’intera infrastruttura IT. Tutte le organizzazioni dovrebbero disporre di un piano di ripristino di emergenza. Tuttavia, l’importanza del ripristino di emergenza è ancora maggiore per le aziende che dipendono fortemente dai dati.
Sono cinque i requisiti indispensabili per il ripristino di emergenza di big data:
Backup da remoto
I backup off-site assicurano che i dati rimangano incolumi nel caso in cui un disastro fisico, come un incendio o una forte tempesta, distrugga l’infrastruttura di produzione. Una sorta di porto sicuro durante le emergenze.
Backup in loco
Il vantaggio dei backup dei dati in loco è che i dati possono spesso essere ripristinati più rapidamente dai server in loco rispetto ai siti remoti. Questo sempre se la struttura non è stata danneggiata in ogni su parte.
Playbook per big data
Quando hai a che fare con un guasto imprevisto dell’infrastruttura, hai bisogno di un piano per guidare tutte le tue azioni mentre ripristini i dati. Un playbook è una serie di passaggi scritti in anticipo e che segui quando ti ripristini da un disastro. I tuoi playbook dovrebbero essere scritti per essere in qualche modo adattabili, ovviamente, a qualsiasi tipo di emergenza possa verificarsi.
Garantire il continuo afflusso di dati
Un disastro può distruggere la tua capacità di continuare a raccogliere i dati, ma non ne impedisce il flusso. Durante il ripristino di emergenza, è importante assicurarsi di mantenere l’acquisizione continua dei dati nella misura del possibile, anche se le operazioni di analisi vengono interrotte.
Strumenti di trasformazione dei dati
Lo spostamento dei dati dalle posizioni di backup ai server di produzione può richiedere molto tempo quando ci sono molti dati. Dovrai disporre di buoni strumenti di trasformazione dei dati a disposizione durante il ripristino di emergenza.
Assicurati che le posizioni di backup riescano a gestire la quantità di nuovi dati che verranno generati durante il tempo necessario per ripristinare le operazioni.
Conclusioni
Attraverso le strategie appena elencate sarà possibile non solo la disponibilità di dati di backup in caso di emergenza, ma anche il ripristino delle operazioni sui dati di produzione il più rapidamente possibile. I dati di backup da soli sono di scarso valore se non si riesce a utilizzarli rapidamente, in una più ampia strategia di ripristino di emergenza di big data. Occorre adattare il piano di ripristino di emergenza per includere una sezione sui big data e assicurarsi di implementare alcuni dei suggerimenti dati. Si aumenteranno cosi le possibilità di riportare gli ambienti big data a un livello di servizio accettabile il più rapidamente possibile dopo un disastro.