Quasi nessuno si può dire esente dalla tentazione di integrare l’AI generativa, utilizzandola per ottimizzare i propri processi. Per ogni organizzazione la sfida è quella di riuscire a farlo in modo efficace. Il mondo IT, invece, è animato da un’altra mission: il suo compito è realizzare quei cambiamenti tecnologici fondamentali per supportare le esigenze di un uso sempre maggiore dell’AI generativa in modo sostenibile.
Lo spiega chiaramente Robert Haas, Department Head, Hybrid Cloud Research, IBM Research Europe: “le quantità di risorse, energia e tempo che vengono spese per sfruttare questa tecnologia sono semplicemente scandalose. Dobbiamo trovare il modo di ridurre l’impronta di queste applicazioni in termini di consumo energetico, perché non è accettabile per il futuro”.
Re-imparare a costruire chip
Il primo ambito importante in cui serve imprimere una decisa evoluzione è quello dei semiconduttori. È diventata palese e popolare la sua importanza con le criticità subite alla supply chain durante la pandemia. Ancora oggi richiama l’attenzione perché al centro di “giochi geopolitici” che regolano dinamiche globali preoccupanti, con un’Europa che cerca un po’ di sovranità, eliminando una dipendenza che potrebbe diventare critica in futuro.
Mentre si assiste a tutto ciò, a livello tecnologico si è chiamati a gestire la “scomparsa” della Legge di Moore, quella che prima “ci garantiva che ogni nuova generazione di tecnologia dei semiconduttori ci avrebbe permesso di essere più veloci, quasi gratis. Si deve quindi continuare a migliorare la densità e l’efficienza della tecnologia dei semiconduttori” spiega Haas.
Le strategie per la nuova generazione di chip
Un primo passo è stato quello compiuto da IBM iniziando a costruire transistor “in verticale”. “In un semiconduttore, questi elementi sono posizionati in piano sulla superficie, determinandone essenzialmente la densità. Noi abbiamo pensato di girarli di 90 gradi facendo sì che la superficie richiesta fosse molto minore e ci permettesse di impacchettare più transistor sulla stessa superficie” spiega Haas.
Con un‘attenta gestione della temperatura durante la costruzione di queste strutture, si è così arrivati a poter ridurre ulteriormente le dimensioni dei transistor “e ci aspettiamo di poter continuare così: questo è solo un primo passo nella giusta direzione”.
Un altro primo passo importante, sempre nell’ambito della realizzazione di chip, riguarda ancora la loro struttura, perché deve poter arrivare a supportare un’attività ad alta intensità di dati, come il training di un modello. “In questo tipo di processi si muovono molti dati avanti e indietro e avvengono numerosi scambi che consumano molta energia. Si deve quindi intervenire sulla costruzione fisica di questi sistemi avvicinando l’elemento che elabora le informazioni e quello che le contiene. Si devono costruire chip in modo tridimensionale, impilando strati di chip semiconduttori uno sopra l’altro e realizzando un processore, un acceleratore e un pezzo di memoria come un sandwich. Solo così si minimizza la distanza da percorrere per accedere ai dati, spendendo meno energia e meno tempo” illustra Haas. E sottolinea l’importanza di questo step tecnologico dal punto di vista della sostenibilità: “se non cambiamo le fondamenta del modo in cui usiamo l’AI generativa – aggiunge- non saremo mai in grado di affrontare gli enormi problemi ambientali che abbiamo già di fronte”.
Cercasi campioni di prompting
Di tutt’altro genere è il secondo “task” su cui l’IT si deve impegnare per massimizzare i vantaggi dell’AI. In questo caso si parla di competenze, di quelle di cui è esplosa la richiesta sul mercato. L’ambito è quello del prompting engineering. Si tratta di skill essenziali per cogliere il valore dei modelli AI e calarlo all’interno della propria organizzazione. Haas spiega perché: “per addestrare un modello enorme utilizzando tutti i dati disponibili al mondo si spendono oltre 10 milioni di dollari. Non lo si fa ogni mese, quindi, per ogni compito specifico. È qui che la messa a punto del prompt diventa un passaggio fondamentale: è ciò che ci permette di usare i modelli generali a disposizione per un caso particolare per noi rilevante”.
Ecco, quindi, come oggi a ogni tipo di azienda servano persone esperte in prompting, che sappiano creare istruzioni adeguate, accurate, efficienti e tempestive per risolvere le loro esigenze specifiche, utilizzando i modelli già disponibili. È una nuova forza lavoro urgente da formare, per rincorrere le promesse di una tecnologia che le vorrebbe già al desktop, in azione.
Cloud ibrido per dati a portata di AI
Il terzo elemento IT citato da Haas come fondamentale non è una novità ma un trend che governa da tempo il mercato. Si tratta del cloud ibrido, “una tecnologia che forma un binomio ideale con l’AI generativa: entrambe traggono molti vantaggi l’una dall’altra”.
“Ogni azienda può avere grandi quantità di dati sparsi, in-house e su diversi cloud. Per addestrare in modo efficiente i modelli è necessario avere la possibilità di eseguirli in un ambiente ibrido multi-cloud, quindi, perché sarebbe impensabile portarli prima tutti in uno stesso ambiente: non sarebbe realistico – spiega Haas – mi devo quindi affidare alla capacità di un cloud ibrido per rendere possibile l’esecuzione di queste operazioni, indipendentemente da dove si trovano i dati. È necessario un ambiente comune che permetta di eseguire queste operazioni in modo più efficiente, senza costringere le organizzazioni a riarchitettare l’intera infrastruttura dei dati”.
Questo approccio, questa “preparazione infrastrutturale” all’uso di modelli AI, è propedeutico anche al modo in cui IBM sta spingendo le aziende a sfruttarli. Haas lo illustra così: “riteniamo meglio che ciascuna possa costruirne a seconda dei propri bisogni, creando valore da sola per il proprio specifico business e controllandone i rischi. Si tratta di decidere tra l’essere un semplice utente o un creatore di valore, e vale per tutti i settori. La vera domanda che tutti si devono porre è la stessa: come inserire l’AI generativa nel proprio ambito efficacemente? Ciascuno lo deve poter valutare da protagonista”.