Nonostante la continua evoluzione tecnologica a cui assistiamo, chi lavora a stretto contatto con l’innovazione sa che deve spesso fare i conti con alcune inevitabili imperfezioni. Tutto sta nel capire fino a che punto possono essere tollerabili e tollerate, o se richiedono un intervento. È una valutazione delicata, che andrebbe reiterata regolarmente su tutti gli errori considerati, fino a ieri, accettabili. Oggi o domani potrebbero non esserlo più e far scattare un alert, perché diventati compromettenti. Un esempio in tal senso sono i soft error.
Raggi cosmici e soft error “sorvegliati speciali”
Il 2008 sembra passato remoto, considerando i repentini passi avanti compiuti dalla tecnologia. Proprio in questo anno Cisco aveva portato all’attenzione di tutti il verificarsi di guasti di tipo “single event upset” su alcune delle sue schede di linea, a causa di “neutroni termici provenienti da radiazioni cosmiche di energia inferiore a 15eV”.
Un avvertimento rimasto sepolto sotto altre emergenze “meno soft”, ora riportato alla luce dai ricercatori della giapponese NTT e dell’Università di Hokkaido. I due team sono arrivati alla stessa preoccupante conclusione. I materiali utilizzati per costruire e raffreddare i computer potrebbero impattare negativamente su questo tipo di errore, facendo peggiorare la situazione.
Nel documento intitolato “Energy-Resolved SEU Cross Section From 10-meV to 800-MeV Neutrons by Time-of-Flight Measurement” gli errori soft sono descritti come errori spontanei e transitori, all’origine di inconvenienti come un crash o la corruzione dei dati in memoria. Questo era già noto “ai tempi”, però. Il vero e proprio scopo dello studio è invece la stima di quanto siamo divenuti suscettibili a questo problema, in modo da poter sviluppare contromisure migliori.
Per trovare una risposta, i ricercatori hanno sviluppato una sorta di test sull’impatto dei neutroni su un field-programmable gate array (FPGA), utilizzando la tecnica del tempo di volo dei neutroni e gli strumenti del Los Alamos Neutron Science Center e del Japan Proton Accelerator Research Complex. Le tecnologie messe in campo servono a misurare l’energia di un neutrone e hanno permesso di rilevare una grande quantità di errori “soft”.
Dai numeri ottenuti con diversi parametri sarebbe emerso che “il contributo dei neutroni a bassa energia agli errori soft è stato di circa 1/5-1/4 del conteggio totale degli errori e di 1/4-1/3 con neutroni superiori a 1 MeV”. Secondo i ricercatori si tratta di “proporzioni significative”.
Neutroni termici e ambienti IT
Osservando i risultati, NTT sottolinea alcuni trend significativi. Per esempio, il tasso di soft error tende a essere più basso intorno alla soglia dei 0,1 MeV, ma aumenta quando l’energia diminuisce ulteriormente. Questi dati si potrebbero spiegare con la presenza di boro nei semiconduttori.
Un’altra interessante osservazione riguarda poi l’elevato tasso di errore in corrispondenza di neutroni nella banda di energia intorno ai 25 meV (2,5 x 10-8 MeV), noti come “neutroni termici“. In questo caso il fenomeno risulta spiegabile ma anche allarmante: è proprio il tipo di particelle che viene prodotto quando i neutroni ad alta energia entrano in materiali contenenti idrogeno. Ciò avviene in presenza di quasi tutti i materiali caratteristici degli ambienti informatici: acqua, plastica e i substrati elettronici contengono questo elemento.
I risultati di questo studio ci portano quindi a riflettere su materiali, processi e dispositivi che abitualmente adottiamo. Il raffreddamento ad acqua, per esempio, secondo i calcoli di NTT, dovrebbe far aumentare in modo significativo il numero di neutroni termici. Queste e altre congetture derivanti da questo studio, possono trasformarsi in interessanti indicazioni per adeguare la propria attrezzatura in modo che sia appropriata. Tutto ciò suggerisce una massiva revisione dei rischi finora considerati trascurabili, alla luce della rapida evoluzione che tutto il mondo IT, hardware e software, sta vivendo.