EMC Data Domain

EMC Data Domain
30 aprile 2015 Alessio Sciuto

La caratteristica più importante che uno storage di successo deve avere è sicuramente quella di garantire l’integrità dei dati in qualsiasi evenienza, dal guasto di un disco, all’interruzione improvvisa dell’alimentazione ad un errore di I/O. Quando si verifica uno o più degli eventi citati, non solo i dati devono essere preservati, ma è anche richiesto che lo storage goda della flessibilità necessaria affinché possa rimanere operativo, fornendo i servizi richiesti in modo trasparente.

Tra i leader che operano nel mercato, sicuramente EMC spicca nelle soluzione di storage di deduplica grazie ad EMC Data Domain, il quale dispone di tutti i numeri per fornire un eccellente valore per il business grazie ad importanti funzionalità come l’efficienza, la velocità di esecuzione ed l’affidabilità del ripristino dei dati critici. Tali funzionalità variano in modo sostanziale tra le diverse soluzioni di deduplica ed il Data Domain si distingue in quanto non si concentra solo sui risparmi di storage della deduplica, ma fornisce anche la scalabilità, l’efficienza della replica e le prestazioni richieste.

La principale priorità per la piattaforma di protezione dei dati di backup viene data alla garanzia di integrità dei dati, grazie ad EMC Data Invulnerability Architecture che verifica il ripristino end-to-end durante ogni operazione di backup e ripristino. Ciò vuol dire che i dati ripristinati vengono validati mediante una verifica che avviene subito dopo la scrittura, confrontandoli con il checksum dei dati inviati. In tal modo eventuali errori rilevati possono essere corretti immediatamente senza dover riavviare il job di backup. Viene inoltre evitato che si verifichi l’eliminazione dei dati esistenti, impedendo l’aggiunta di nuovi dati a quelli esistenti, in modo che essi non vengano mai sovrascritti.

Le prestazioni sono garantite dalla tecnologia SISL (Stream Informed Segment Layout) che permette al sistema Data Domain di eseguire l’elaborazione di deduplica direttamente nella cpu e nella ram, indipendentemente dal numero di dischi presenti e dai protocolli utilizzati che potrebbero anche essere inefficienti come quello NFS e CIFS. In tal modo le prestazioni miglioreranno col passare del tempo conseguentemente allo sviluppo dei processori in linea con la legge di Moore, la quale afferma che “Le prestazioni dei processori, e il numero di transistor ad essi relativi, raddoppiano ogni 18 mesi”. Il software Data Domain Boost si occupa di fornire parti del processo di deduplica ai server di backup o ai client delle applicazioni, facendo in modo che il sistema Data Domain possa concentrarsi sull’identificazione dei dati univoci e sulla scrittura dei nuovi dati su disco. In tal modo solo i dati univoci saranno quelli che verranno trasferiti dal server o dal client di backup al sistema Data Domain. Grazie all’utilizzo di questo software si ottiene un notevole miglioramento della velocità dei backup senza apportare modifiche ai server ed all’infrastruttura di backup esistenti, oltre ad una riduzione della larghezza di banda richiesta. Data Domain Boost, inoltre, fornisce il failover automatico dei percorsi, il quale migliora l’affidabilità dei backup ed elimina l’esigenza di gestire mountpoint garantendo in tal modo la prosecuzione dei backup anche in caso di perdita di un percorso.

Oggigiorno il disaster recovery costituisce un concetto ormai affermato nella maggior parte delle aziende. Con esso ci si riferisce all’insieme delle misure tecnologiche ed organizzative adibite al ripristino di sistemi, dati e infrastrutture necessarie all’erogazione dei servizi di business per le aziende dinnanzi a gravi emergenze dovute ad eventi distruttivi, quali disastri naturali o semplicemente mancanza di corrente, che comprometterebbero la regolare attività. In queste situazioni, il disaster recovery su nastro comporterebbe numerosi rischi, tra cui guasti dell’hardware dei supporti a nastro o danneggiamento dei supporti stessi e ritardi nel ripristino dello storage su nastro.

Per questo motivo il Data Domain si avvale di software come il Data Domain Replicator progettato per migliorare il disaster recovery. Nello specifico, grazie ad esso, i sistemi EMC Data Domain replicano nel sito remoto solo i dati univoci e avviano la replica mentre sono ancora in corso i backup, avvalendosi del supporto di topologie di replica one-to-one, one-to-many, many-to-one, many-to-many e in cascata. Sono resi in tal modo più veloci anche i test di DR periodici, grazie ad un’esclusiva funzionalità snapshot denominata fastcopy. Il vantaggio che risulta evidente consiste nell’opportunità di sostituire il nastro fisico ed eliminare tutte le complessità ed i rischi ad esso associati.