TECHTARGET

GPU (Graphic Processing Unit): cos’è, a che serve e quali sono le specifiche più importanti?

Per rilasciare sistemi elaborativi caratterizzati da una elevata potenza, i responsabili dei data center oggi hanno due opzioni: moltiplicare i nodi intesi come computer indipendenti, oppure aumentare i processori a livello di GPU. Ecco le caratteristiche di una GPU da valutare

Pubblicato il 01 Apr 2019

concept di GPU (Graphic Processing Unit)

Le GPU (Graphic Processing Unit) sono oggi diventate soluzione di riferimento per accelerare i carichi di lavoro e abilitare l’High Performance Computing. I server che al loro interno hanno un acceleratore GPU supportano i carichi di lavoro HPC e i data center hyperscale, applicazioni di AI e di training (HGX-T), inferenza (HGX-I) o supercomputing (SCX). Ma quali sono le caratteristiche importanti da considerare?

Che cosa è un GPU e a che cosa serve

Che cosa sono le GPU? Le GPU sono processori che supportano un tipo di calcolo parallelo altamente specializzato. Ogni server accelerato da una GPU sostituisce decine di server CPU generici, fornendo un aumento sostanziale del throughput applicativo a costi più contenuti.

Le GPU, ad esempio, aiutano analisti e ricercatori ad analizzare volumi di dati nell’ordine dei petabyte in tempi più rapidi o a gestire la necessaria potenza elaborativa che serve ai sistemi collegati all’uso dell’Intelligenza Artificiale e, in particolare, al deep learning. Sono sempre la GPU a supportare i calcoli computazionali necessari agli ambienti di simulazione garantendo velocità e potenza distribuita a desktop, applicazioni e workstation virtuali.

GPU: quali sono gli aspetti principali da valutare

Oggi le GPU sono soluzioni multicore. Per avere la garanzia che siano garantite sia la compatibilità hardware che le prestazioni effettive nel data center, è importante esaminare con attenzione:

  • potenza elaborativa
  • memoria
  • supporto del sistema operativo

Gli esperti ricordano le prestazioni non elaborate siano un punto di attenzione importante nella valutazione di una GPU.

Ecco una miniguida che in 4 punti aiuta a valutare correttamente una GPU:

#1 Misurare la potenza elaborativa di una GPU

Le prestazioni della GPU sono misurate in trilioni di operazioni in virgola mobile al secondo (TFLOPS). Questo numero, in sintesi, indica quanti calcoli possono essere completati da una GPU in un secondo. Quando si eseguono operazioni in virgola mobile a 64 bit, la soluzione consumer GPU Nvidia GeForce GTX 1080 Ti può eseguire fino a 0,355 TFLOPS. Le soluzioni di fascia enterprise sono ovviamente molto più potenti: Nvidia Tesla P100 è classificata nell’ordine dei 4,7-5,3 TFLOPS mentre la Tesla V100 è classificata nell’ordine dei 7-7,8 TFLOPS.

Esistono anche GPU che utilizzano operazioni in virgola mobile a 16 bit al secondo e che quadruplicano le prestazioni in meglio rispetto ai punteggi a 64 bit. Questo perche queste GPU utilizzano la metà dello spazio di archiviazione e la larghezza di banda delle GPU a doppia precisione.

#2 Controllare la memoria e la numerosità dei core

Valutare la memoria grafica e la larghezza di banda della memoria è un altro aspetto importante. Le GPU di classe enterprise hanno una memoria grafica più veloce, come GDDR5, rispetto alle GPU vendute sul mercato consumer e supportano una RAM a bassa latenza. L’hardware di memoria utilizza una maggiore larghezza di banda per evitare i colli di bottiglia in fase di elaborazione.

Il numero di core è un’altra specifica che va considerata quando si valuta una GPU. Le GPU consumer hanno un chip GPU con centinaia di core, mentre le GPU di classe enterprise offrono più chip GPU e migliaia di core per aumentare le capacità di elaborazione parallela. Ad esempio, Nvidia Tesla M10 fornisce 4 chip GPU con 640 core di architettura di dispositivo unificata per GPU, per un totale di 2.560 core. Le differenze architetturali tra i vari modelli di GPU offerte dai produttori rende difficile un confronto diretto dei core. Quello che è più importante sapere in merito alle specifiche di una GPU è che quelle di classe enterprise hanno più core e consentono un parallelismo molto più grande.

#3 Verificare il supporto al sistema operativo

Un aspetto importante da considerare sono le modalità di supporto del sistema operativo della GPU. Non tutte le soluzioni proposte da Nvidia, ad esempio, dispongono di driver GeForce disponibili per le versioni di Windows Server. Ciò significa che con questo tipo di sistema operativo bisogna prodotti GPU di taglio enterprise come, ad esempio, GPU Nvidia Tesla o GPU Quadro. I driver Linux, invece, sono disponibili per qualsiasi tipo di GPU Nvidia.

Un altro aspetto fondamentale è quello di controllare la compatibilità applicativa. Anche se alcune GPU sono ottimizzate per eseguire una determinata applicazione, può succedere che un’altra GPU non garantisca prestazioni equivalenti. Il rischio è che queste applicazioni, se non sono codificate per l’hardware della GPU, possano addirittura non funzionare affatto.

Altre considerazioni sulle specifiche di una GPU

Anche il modo in cui le GPU sono installate su un server va a influenzare le prestazioni. Le interfacce PCIe, in cui la GPU si configura come una scheda di espansione, offrono un’ampia compatibilità tra qualsiasi server tramite uno slot PCIe. Questo tipo di soluzioni coniugano le esigenze associate alla gestione dello spazio fisico e la potenza necessaria, ma sono limitate nella larghezza di banda, con un picco pari a circa 16 GBps. Un fabric interconesso come Nvidia NVLink è in grado di trasferire dati bidirezionali fino a 300 GBps tra GPU o CPU.
<!– [if lte IE 8]>

<![endif]–>SCARICA hbspt.cta.load(3901390, ’29dc2038-5077-44b8-a70a-a5c8179ff1f4′, {});

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Speciale Digital360Awards e CIOsumm.it

Tutti
Update
Round table
Keynote
Video
Digital360Awards e CIOsumm.it, i momenti salienti
Eventi
Digital360 Awards e CIOsumm.IT, ecco i progetti vincitori
Tavola rotonda
Evoluzione del CIO: da centro di costo a motore strategico del business
Tavola rotonda
Business Process Augmentation: dall’RPA alla GenAI… il dato e tratto
Approfondimenti
Sistemi digitali potenziati: l’intelligenza dei chatbot è nelle mani dei CIO
Tavola rotonda
Intelligenza collaborativa e AI: sfide e opportunità per i CIO nell’era dello Human to Machine (H2M) 
Approfondimenti
Open Source: collaborazione e innovazione nel caos apparente del software libero 
Metodologie
BANI: che cos’è e come l’AI può aiutare i CIO a gestire la felicità (e l’infelicità) dei talenti
Prospettive
AI in un mondo complesso. Tra ordine e disordine, le aziende iniziano a capire la giusta via
Approfondimenti
Intelligenza Umana vs Intelligenza Artificiale insieme. Non invece
Eventi
Digital360 Awards e CIOsumm.IT, al via l’evento conclusivo
Video
Digital360Awards e CIOsumm.it, i momenti salienti
Eventi
Digital360 Awards e CIOsumm.IT, ecco i progetti vincitori
Tavola rotonda
Evoluzione del CIO: da centro di costo a motore strategico del business
Tavola rotonda
Business Process Augmentation: dall’RPA alla GenAI… il dato e tratto
Approfondimenti
Sistemi digitali potenziati: l’intelligenza dei chatbot è nelle mani dei CIO
Tavola rotonda
Intelligenza collaborativa e AI: sfide e opportunità per i CIO nell’era dello Human to Machine (H2M) 
Approfondimenti
Open Source: collaborazione e innovazione nel caos apparente del software libero 
Metodologie
BANI: che cos’è e come l’AI può aiutare i CIO a gestire la felicità (e l’infelicità) dei talenti
Prospettive
AI in un mondo complesso. Tra ordine e disordine, le aziende iniziano a capire la giusta via
Approfondimenti
Intelligenza Umana vs Intelligenza Artificiale insieme. Non invece
Eventi
Digital360 Awards e CIOsumm.IT, al via l’evento conclusivo

Articoli correlati

Articolo 1 di 4