Durante il Huawei Innovative Data Infrastructure Forum 2024, tenutosi a Berlino e incentrato sul tema “Data Awakening: Building Leading AI-Ready Data Infrastructure”, Peter Zhou, vicepresidente di Huawei e presidente della Data Storage Product Line, ha inaugurato l’evento delineando la prospettiva di Huawei sul futuro dello storage dei dati.
Questa visione è guidata da diversi elementi chiave, tra cui ultra performance, resilienza dei dati, un nuovo paradigma dei dati, scalabilità, sostenibilità e la capacità di integrare e gestire i dati end-to-end (data fabric).
Più della metà dell’energia dei data center sarà consumata dall’AI
A partire dagli anni ’90, le necessità delle imprese sono evolute dall’uso di singoli host, database, servizi di virtualizzazione e condivisione file alla gestione di big data e analisi ad alte prestazioni (HPDA). Questo cambiamento ha comportato una transizione dalle tecnologie DAS, SAN e NAS a sistemi non strutturati di archiviazione dei dati. Con l’emergere dell’intelligenza artificiale generativa (IA), la necessità di soluzioni affidabili per lo storage dei dati è diventata ancora più pressante nell’attuale panorama tecnologico.
Con l’aumento delle dimensioni dei cluster IA fino a includere decine o addirittura centinaia di migliaia di GPU, si è verificato un incremento delle interruzioni e dei malfunzionamenti del cluster. Il processo prolungato di scrittura ripetuta dei dati di checkpoint e di ripresa dell’addestramento ha portato a un esteso periodo di inattività delle schede di calcolo, riducendo l’utilizzo del cluster al di sotto del 50%.
Inoltre, si prevede che entro il 2026 il consumo energetico globale dei data center aumenterà 2,3 volte rispetto al 2022, equivalente al consumo energetico annuale del Giappone. Più della metà dell’energia dei data center sarà consumata dall’AI. L’intelligenza artificiale sta destinata a trasformare il tradizionale processo di archiviazione dei dati, focalizzandosi non solo su performance, affidabilità e paradigma dei dati, ma anche su scalabilità, sostenibilità e data fabric.
Huawei vuole ridefinire lo storage dei dati
Di conseguenza, Huawei intende ridefinire lo storage dei dati nei prossimi anni attraverso l’innovazione in sei dimensioni:
1. Ultra performance: miglioramento delle prestazioni dell’archiviazione dati fino a 10 volte rispetto ai sistemi tradizionali. Lo storage supporta una larghezza di banda in PB/s e 100 milioni di IOPS, aumentando notevolmente l’efficienza dell’intero processo IA.
2. Resilienza dei dati: grazie all’architettura innovativa e alle tecnologie avanzate si garantisce un’elevata affidabilità pari al 99,99%. L’integrazione del motore per il rilevamento del ransomware aumenta l’accuratezza del rilevamento fino al 99,99%. Il tempo di ripristino del checkpoint durante l’addestramento IA è ridotto a meno di un minuto.
3. Nuovo paradigma dei dati: i dati tensoriali multidimensionali sono abilitati a supportare un rapido recupero dei dati tramite un motore di ricerca intelligente. La tecnologia RAG (retrieval-augmented generation) lavora con la base di conoscenza incorporata per eliminare l’allucinazione nei modelli IA di grandi dimensioni.
4. Scalabilità: un singolo cluster di storage può essere ampliato per ottenere una capacità di livello EB e ogni motore può essere incrementato con un numero maggiore di GPU, DPU o NPU per il calcolo near-storage.
5. Sostenibilità: le innovazioni nei supporti e nei dispositivi di storage hanno portato a livelli straordinari di efficienza energetica (meno di 1 watt/TB) e densità di storage (superiore a 1 PB/U).
6. Data fabric: le funzionalità avanzate per la gestione e la ricerca dei metadati consentono una visibilità globale e una gestione efficiente dei dati, nonché una mobilità dei dati 10 volte più efficiente.
Il lavio di OceanStor A800
Queste innovazioni hanno gettato le basi per il lancio dell’OceanStor A800 ad alte prestazioni, che rappresenta una potente aggiunta ai modelli della serie OceanStor A di Huawei. Progettato specificamente per l’intelligenza artificiale, OceanStor A800 è in grado di aumentare l’utilizzo dei cluster IA del 30% e offre prestazioni superiori rispetto ai prodotti concorrenti, con larghezza di banda e IOPS rispettivamente quattro e otto volte maggiori. In termini di scalabilità, OceanStor A800 possiede una capacità di livello EB con un massimo di 512 controller, nonché uno scaling fino a un massimo di 4.096 schede di calcolo.
Per quanto riguarda la conservazione dello spazio e dell’energia, la soluzione raggiunge una straordinaria densità di archiviazione di 1 PB/U e un’efficienza energetica di 0,7 watt/TB. Inoltre, offre un nuovo paradigma dei dati con indice vettoriale, dati tensoriali e RAG. In termini di resilienza, l’accuratezza del rilevamento del ransomware è migliorata dal 99,9% al 99,99%. Infine, la capacità del data fabric facilita la gestione degli asset dati.
Parallelamente, le innovazioni nei supporti di archiviazione stanno guidando lo sviluppo sostenibile. Le nuove unità SSD ad alta capacità di Huawei offrono una capacità 10 volte superiore a parità di dimensioni del disco, riducendo ulteriormente il consumo energetico dei data center. Con una capacità di 128 TB per disco, le nuove unità SSD consumano l’88% in meno di spazio e il 92% in meno energia rispetto alle unità SSD degli altri fornitori per l’archiviazione di un PB. Per essere pronte per l’IA, le aziende devono essere pronte per i dati. Il file system globale Omni-Dataverse incorporato nel DME rende le risorse dati aziendali visibili, gestibili e trasferibili in tutte le regioni, creando una solida base per un data lake AI.
OceanClub
Durante l’IDI Forum è stata presentata anche OceanClub, una piattaforma con l’obiettivo di promuovere lo sviluppo di applicazioni industriali e l’innovazione tecnologica collaborativa nel campo dello storage dei dati. Questa piattaforma favorisce la condivisione e lo scambio di informazioni tecniche tra esperti, studiosi, ingegneri e appassionati di tecnologia. In qualità di organizzazione no-profit, OceanClub intende fornire ai professionisti del settore IT l’opportunità di beneficiare delle opportunità offerte dall’era dell’IA e dei dati, offrendo anche la possibilità di partecipare a seminari e altre opportunità formative sia online che offline.
Solo nel 2024 sono previsti oltre 100 eventi in più di 30 Paesi in Europa, Medio Oriente e Asia-Pacifico. I membri sono incoraggiati a contribuire alla piattaforma attraverso la condivisione di conoscenze, la pubblicazione di articoli e la partecipazione a eventi. Un piano reward prevede l’accesso prioritario a servizi premium e opportunità di scambio in Cina.