Pure Storage ha annunciato una partnership con il CERN, il laboratorio europeo per la fisica delle particelle, per valutare come la tecnologia flash possa supportare le crescenti esigenze di High Performance Computing (HPC) legate agli esperimenti condotti al Large Hadron Collider (LHC). La collaborazione, avviata nell’ambito del programma CERN openlab, punta a studiare le potenzialità della tecnologia DirectFlash in contesti caratterizzati da carichi computazionali intensivi e volumi dati su scala exabyte.
Il CERN genera enormi quantità di dati attraverso i propri esperimenti di fisica delle alte energie, dati che devono essere acquisiti, archiviati e resi accessibili in modo efficiente per consentire l’analisi da parte della comunità scientifica. In questo scenario, le soluzioni di storage tradizionali cominciano a rappresentare un collo di bottiglia, rallentando i processi di calcolo. La sostituzione delle tecnologie legacy con la piattaforma dati di Pure Storage promette di incrementare densità, prestazioni ed efficienza energetica, in linea con gli obiettivi di sostenibilità del laboratorio.
Una nuova generazione di storage per HPC e Grid Computing
La collaborazione si inserisce in un progetto pluriennale che ha l’obiettivo di ottimizzare l’infrastruttura storage del CERN, integrando la tecnologia flash all’interno dello stack applicativo utilizzato per i workload di HPC e Grid Computing. Le valutazioni in corso sono orientate a misurare benefici concreti in termini di risparmio energetico e miglioramento delle performance, in vista delle future sfide poste dal programma High-Luminosity LHC (HL-LHC).
“Insieme con CERN openlab stiamo estendendo i limiti di ciò che è possibile fare negli ambienti HPC e Grid Computing che sono al servizio dei workflow scientifici più avanzati. Con l’integrazione della nostra tecnologia allo stato dell’arte nel sistema storage distribuito su larga scala del CERN, CERN openlab si prepara a gestire volumi di dati senza precedenti con livelli inediti di velocità e affidabilità permettendo ai ricercatori di affrontare le straordinarie sfide che nasceranno nell’era dell’High-Luminosity Large Hadron Collider (HL-LHC)”, ha dichiarato Rob Lee, CTO di Pure Storage.
Dal canto suo, il CERN punta a sperimentare nuove architetture di conservazione dati che possano fungere da riferimento per altri istituti di ricerca. “Ci aspettiamo che questa partnership produca importanti frutti nel comprendere il futuro della conservazione dei dati scientifici. Per prima cosa prevediamo di integrare questa tecnologia nel nostro sistema storage distribuito su larga scala e di riuscire a fornire i dati in maniera molto più efficace ottenendo un modo per scalare le prestazioni storage al di là di quanto è oggi possibile. In secondo luogo qui al CERN contiamo di dare il via a una nuova generazione di scoperte rivoluzionarie nella fisica delle alte energie dimostrando alla comunità scientifica le potenzialità che il miglioramento delle capacità storage offre per accelerare la velocità dell’innovazione e delle scoperte negli istituti di ricerca di tutto il mondo”, ha commentato Luca Mascetti, Storage CTO di CERN openlab.
Flash e HPC: un binomio strategico per la ricerca scientifica
L’adozione congiunta di storage flash e infrastrutture di High Performance Computing (HPC) si sta affermando come una soluzione chiave per sostenere i crescenti fabbisogni computazionali della ricerca scientifica.
I sistemi HPC, progettati per elaborare trilioni di operazioni al secondo (teraflop e petaflop), si basano su cluster di nodi paralleli connessi da reti ad alta velocità. Queste architetture sono essenziali per analizzare i big data generati da simulazioni, sensori e strumenti di misura, come quelli utilizzati nella fisica delle alte energie, nella climatologia o nella bioinformatica.
In parallelo, lo storage basato su memoria flash NAND si distingue per la sua capacità di offrire throughput elevati, tempi di risposta nell’ordine dei microsecondi e una significativa riduzione della latenza rispetto ai dischi rotazionali.
L’assenza di componenti meccanici, unita a un’efficienza energetica superiore, consente una densità di dati molto più alta e una gestione termica più efficace, aspetti fondamentali nei data center ad alte prestazioni. Inoltre, grazie alla parallelizzazione intrinseca dei canali di accesso e alla possibilità di ottimizzare lo I/O tramite software-defined storage, la tecnologia flash si integra con i carichi HPC, contribuendo a massimizzare le performance e ad abilitare una scalabilità lineare.