La deduplicazione dei dati riduce la quantità di spazio di storage richiesto dai backup con potenziali vantaggi per la protezione dei dati; consente infatti backup più rapidi e frequenti, ripristini più rapidi, e finestre temporali di memorizzazione potenzialmente più lunghe entro i limiti dei requisiti di conformità regolatoria e della policy aziendale.
La deduplicazione è in grado di influire sull’applicazione di backup, a seconda del suo approccio.
Ad esempio, i tool di backup che gestiscono lo storage a blocchi dovrebbero funzionare perché i dati deduplicati sono protetti sul dispositivo di storage target. Invece, i tool di backup basati su archiviazione di file possono in generale annullare la deduplicazione – con conseguente aumento dello storage necessario sul dispositivo di storage target – a meno che il tool di backup supporti in modo specifico la deduplicazione dei dati di Windows Server 2012 R2. Per esempio, un tool come Windows Server Backup supporta completamente la deduplicazione, e gli amministratori IT possono ripristinare un volume completo o singole cartelle dal backup.
Bisogna però ricordare che la deduplicazione non funziona su volumi di sistema e di avvio, drive remoti, file cifrati (in cui i dati sono già straordinariamente disordinati), oppure file più piccoli di 32 KB. Di questi contenuti vengono eseguiti il backup e il ripristino proprio come per qualsiasi file tradizionale.
La deduplicazione esegue periodicamente i cosiddetti processi di garbage collection per recuperare chunk di storage non più in uso. È meglio eseguire un backup dopo un processo di garbage collection per accertarsi che qualsiasi modifica per liberare storage sia catturata nel backup e non le sia consentito “invecchiare”.
La deduplicazione dei dati fornisce un importante mezzo per migliorare l’efficienza dello storage, ridurne i costi e velocizzare i processi di protezione dei dati. Ma l’efficienza e le prestazioni della deduplicazione possono variare in base al carico di lavoro e alle impostazioni di deduplicazione.
Gli amministratori IT dovrebbero dedicare il tempo necessario a effettuare un benchmark di ogni volume di storage prima e dopo la deduplicazione, per poter valutare qualsiasi riduzione di prestazioni, poi devono regolare la pianificazione e altre opzioni per ottimizzare le prestazioni del server e di altri carichi di lavoro.
I processi di backup e recupero devono inoltre essere preventivamente testati per comprendere le esigenze di storage dei dati deduplicati e per consentire agli aggiornamenti e alle patch dei tool di protezione dei dati di incrementare l’uso dello storage per backup deduplicati.