Cosa accade se un’applicazione presenta problemi con i dati deduplicati? È possibile interrompere la deduplica di Windows Server?
Le esigenze in termini di storage sono andate via via aumentando al crescere delle richieste in fatto di dati dei tipi di file con cui lavorano le nuove applicazioni, dai database clienti, agli archivi e-mail e alle librerie di PDF a immagini file media in streaming.
La deduplica dei dati si è fatta strada come potente tecnologia per mitigare le richieste delle aziende in materia di storage identificando e rimuovendo elementi di dati ridondanti, o chunk, senza alterare o compromettere i dati.
Windows Server 2012 R2 fornisce funzionalità di deduplica espanse, a cui però gli specialisti IT devono ricorrere correttamente dopo averne valutato l’adeguatezza in modo tale da poterne prevedere i vantaggi in termini di prestazioni dell’applicazione e del sistema.
Una volta abilitata e configurata su una piattaforma Windows Server 2012 R2, la deduplica dei dati è solitamente fornita come processo in background avviato periodicamente dal server; ciò è leggermente diverso dalle funzionalità di deduplica inline native per alcuni sottosistemi di storage.
Di conseguenza, quando viene effettuata la deduplica di Windows Server, le prestazioni di alcune applicazioni o tipi di file possono non essere ottimali, ad esempio nel caso di file che richiedono accesso continuo, vengono modificati spesso o richiedono pattern degli I/O attivi. Tra gli esempi, i sistemi host Hyper-V, file di database SQL, Exchange server, Windows Server Update Services (WSUS) e file di dimensioni superiori a 1 TB.
Il problema alla base è che i file che cambiano di frequente non possono essere deduplicati in modo efficiente. Per un processo di deduplica il server deve fornire grandi risorse di elaborazione – e le modifiche immediate ai file dell’applicazione si limitano ad annullare la deduplica.
Ciò non rappresenta un problema per i sottosistemi di storage dedicati, come quelli di EMC che sono concepiti per fornire deduplicaz continua, ma piuttosto un forte carico di elaborazione per i server tradizionali. Nella pratica, la deduplica si applica meglio ai file che non hanno subito modifiche per diversi giorni.
Se si deve selezionare un ciclo di deduplica breve, accertarsi di effettuare un benchmark dell’applicazione prima e dopo l’attivazione della deduplicaz per confrontare le prestazioni e accertarsi che non influisca negativamente su quelle dell’applicazione.
Quando l’impatto della deduplica di Windows Server sull’accesso a un’applicazione o un file è negativo, le opzioni a disposizione sono molte.
Innanzitutto, un amministratore IT può scegliere di cambiare la frequenza di deduplica modificandone la pianificazione o preferendo processi di deduplica manuale.
Inoltre, le opzioni come StopWhenSystemBusy arresteranno la deduplica se il processo interferisce con il carico di lavoro del server, mentre le opzioni Priority possono essere utilizzate per creare un ordine di priorità tra i processi di deduplica. L’Expand-DedupFile cmdlet può espandere (o annullare la deduplica di) specifici file se è necessario per esigenze di compatibilità o prestazioni.
Nella maggior parte dei casi, la pianificazione o altre opzioni possono migliorare le prestazioni senza che sia necessario disabilitare la deduplica; in alcuni casi, però, questa deve semplicemente essere disabilitata. Può essere rimossa su un volume eseguendo un Start-DedupJob cmdlet indicando come tipo di processo “Unoptimization”.