L’evoluzione dell’hard disk: passato, presente e futuro dello storage (2° parte)

L’evoluzione dell’hard disk: passato, presente e futuro dello storage (2° parte)
28 settembre 2016 Ottavio Meccio

Ci eravamo lasciati alla fine degli anni ‘80 del secolo scorso, con i personal computer che si stavano diffondendo sulle scrivanie e nelle case degli utenti e con le esigenze di storage che andavano quindi diversificandosi tra quelle aziendali e quelle del mercato “consumer”.

L’allargamento del bacino di utenza dei computer diede un fortissimo impulso ai produttori di hard disk, tanto che durante gli anni ‘90 si assistette ad una vera e propria esplosione delle densità di memorizzazione, con l’introduzione del primo hard disk da 1 gigabyte nel formato 3,5 pollici e con la comparsa dei primi drive da 2,5 pollici specificatamente prodotti per il nascente mercato dei computer portatili. Inoltre la velocità di rotazione dei dischi crebbe fino a raggiungere i 7200 giri/min per gli hard disk IDE e i 10.000 giri/min per gli hard disk SCSI.

Alla fine del secolo, i dischi avevano raggiunto una capacità di archiviazione dell’ordine dei 20 gigabyte al costo di circa 240 dollari. Per fare un paragone, nel 1980 ci volevano 240.000 dollari per avere un gigabyte di spazio di archiviazione; nel 1990 di dollari ne “bastavano” 8.000; alla fine degli anni ‘90 il costo era di circa 12 dollari al gigabyte, cioè 200.000 volte in meno del 1980.

Cominciarono a comparire soluzioni che permettevano l’archiviazione dei dati direttamente tramite rete LAN, senza la necessità di appoggiarsi a grossi file server. Queste soluzioni, chiamate NAS (Network-attached Storage), contenevano due o più dischi, spesso configurati in array RAID, e permettevano di centralizzare l’archiviazione dei dati in un dispositivo altamente specializzato e accessibile a tutti gli utenti della rete.

Negli anni 2000 la velocità di rotazione dei dischi si spinse fino a 15000 giri/min e, proprio per venire incontro alle maggiori esigenze di throughput dei personal computer, fu sviluppata una nuova interfaccia di comunicazione chiamata SATA (Serial ATA) che andò pian piano a sostituire l’ormai vetusta ATA (rinominata P-ATA, cioè Parallel-ATA, con riferimento al metodo con il quale i dati viaggiano sul cavo). SATA è attualmente lo standard utilizzato in quasi tutti i dischi rigidi ad alta capacità e basso costo.

Grazie all’introduzione della tecnologia di lettura/scrittura PMR (perpendicular magnetic recording) la capacità dei dischi crebbe fino a superare il terabyte di dati per singolo disco.

La crescita dell’e-business e le necessità di throughput sempre maggiori dei database relazionali, portò alla nascita dell’interfaccia SAS (Serial Attached SCSI) specificatamente progettata per i server: similmente all’interfaccia SATA, essa utilizzava un protocollo seriale point-to-point per il trasferimento dei dati ed era molto più performante delle altre interfacce SCSI.

Contemporaneamente, le esigenze di immagazzinamento dati sempre maggiori, la necessità di unire le risorse computazionali di più server per lavorare in cluster, il crescente ricorso alla virtualizzazione, fece nascere l’esigenza di separare la parte computazionale dei server da quella di storage, invertendo quel processo di integrazione computer-storage che era nato all’inizio degli anni ’80.

La nascita di protocolli di comunicazione come iSCSI (Internet SCSI), che permette di inviare comandi SCSI a dispositivi di archiviazione fisicamente collegati a NAS o ad altri dispositivi remoti utilizzando il protocollo TCP/IP, permise di consolidare l’archiviazione dei dati su dispositivi non connessi direttamente ai server (Direct Attached Storage) ma collegati a questi attraverso una rete LAN ad alta velocità. In questo modo si aveva la possibilità di utilizzare dispositivi di storage remoti in luogo di dischi fisici localmente connessi. Una rete LAN il cui scopo principale è il trasferimento di dati tra sistemi di computer ed elementi di storage e tra gli elementi di storage stessi, è chiama SAN (Storage Area Network).

Attualmente, la disponibilità di dispositivi di rete ad alte prestazioni, insieme con i nuovi standard per il cablaggio strutturato, ha reso possibile l’utilizzo di un design gerarchico che ha consentito di mettere i server e i dispositivi di storage in un locale specifico all’interno dell’azienda, chiamato Data Center. All’interno dei Data Center, l’insieme dei dispositivi di storage, spesso composti da array di centinaia di dischi SCSI che raggiungono capacità complessive nell’ordine delle centinaia di terabyte, gestiti da controller dedicati e con un’affidabilità del 99,999 per cento, è chiamato Data Store ed è collegato ai server attraverso una rete SAN.

Ma quel è il futuro degli hard disk ?

In poco più di 50 anni, il prezzo al megabyte di un hard disk è sceso dai 2.000 dollari del 1960 ai circa 0,00005 dollari di oggi. Ma attualmente la tecnologia degli  hard disk basata su dischi magnetici rotanti ha raggiunto i suoi limiti: la massima capacità raggiunta oggi da un singolo disco rigido è nell’ordine dei 10 terabyte per i dischi da 3,5 pollici e dei 4 terabyte per i dischi da 2,5 pollici, con tempi di accesso ai dati che vanno dai 4 ai 9 millisecondi e la velocità di lettura massima nell’ordine dei 300 megabyte/sec.

Inoltre, l’utilizzo di reti SAN basate su collegamenti in fibra ottica di tipo Fibre Channel, che hanno aumentato ulteriormente la banda a disposizione, e l’elevata densità di dischi presenti in ambienti di storage enterprise, che si traduce in consumi elettrici elevati e grandi quantità di calore prodotto, unita alla maggior delicatezza insita in un dispositivo di tipo meccanico, ha reso questi limiti ancora più evidenti, inducendo molte aziende ad interessarsi alla tecnologia flash memory anche per i dispositivi di storage di tipo enterprise.

Una flash memory è una memoria a stato solido di tipo non volatile che per le sue prestazioni, il basso consumo di energia, il basso sviluppo di calore e l’assenza di parti meccaniche in movimento, sta soppiantando in moltissimi ambiti l’uso dell’hard disk di tipo tradizionale.

I dispositivi di memorizzazione di massa basati su memoria flash sono chiamati SSD (Solid-state Drive) e hanno interfacce di tipo SATA, SAS o SCSI in maniera del tutti simile ai normali hard disk.

I vantaggi principale delle unità SSD rispetto agli hard disk tradizionali, sono:

  • Totale assenza di rumorosità
  • Maggiore resistenza agli urti
  • Minori consumi
  • Minor calore prodotto
  • Tempi di accesso inferiore a 0,5 millisecondi
  • Velocità di lettura massima nell’ordine dei 1000 megabyte/sec
  • Non necessitano di deframmentazione.

Inoltre sono in fase di sperimentazione SSD con capacità di 100 terabyte in un normale fattore di forma da 2,5 pollici, mentre si prevede che gli hard disk tradizionali, per via dei limiti tecnologici, non raggiungeranno mai tali capacità. Nonostante i molti benefici, la tecnologia flash ha ancora alcuni svantaggi rispetto al disco rigido:

  • Prezzo al gigabyte più che doppio rispetto agli hard disk tradizionali, il che si traduce in minor capacità a parità di costo.
  • Peggiore permanenza dei dati quando non alimentati e a seconda della temperatura d’esposizione.
  • Ciclo di vita dell’unità predeterminata dal numero massimo cicli di scrittura che una cella può sopportare (tipicamente 1000 cicli a cella)

Ma i problemi di questa tecnologia sembrano destinati a risolversi in futuro molto prossimo, tanto è vero che molte aziende hanno già iniziato ad offrire soluzione All-Flash come parte della loro offerta di storage per il segmento enterprise.

Allo stato attuale, si può affermare che le unità SSD non sostituiranno immediatamente gli hard disk come dispositivo primario nella storage enterprise ma non ci vorranno molti anni affinché il costo delle memoria flash scenda a livelli tali da essere concorrenziale. Inoltre, le nuove tecnologie consentiranno di produrre chip in grado di garantire una permanenza dei dati pari o superiore a quella degli hard disk tradizionali, rendendo questa tecnologia la soluzione ideale per qualsiasi esigenza di archiviazione futura, e relegando i vecchi ma ancora affidabili hard disk al ruolo di unità utili solo per il backup o per carichi di lavoro di tipo sequenziale.