Attualità

Cosa c’è sotto il cloud di Amazon? Alla scoperta dell’infrastruttura dei data center AWS

Quali sono le caratteristiche infrastrutturali dei data center di AWS tali da garantire livelli di disponibilità pari al 99,9%? Peter DeSantis, Senior Vice President Global Infrastructure and Customer Support della multinazionale le ha illustrate all’ultimo AWS Re:Invent, soffermandosi sui criteri alla base della progettazione dei siti distribuiti nelle attuali 24 regioni, sulle novità nell’evoluzione del processore Graviton e sull’impegno di Amazon per un mondo più green

Pubblicato il 04 Feb 2021

foto Peter DeSantis

All’ultimo AWS Re:Invent, il keynote di Peter DeSantis, Senior Vice President di AWS Global Infrastructure and Customer Support (in foto di apertura), è stato dedicato a illustrare cosa si cela sotto le prestazioni del cloud di Amazon e come la sua infrastruttura sia stata ottimizzata per gestire alcuni dei carichi di lavoro più impegnativi al mondo. DeSantis ha introdotto il tema parlando dei “risultati favolosi” riportati dai clienti sia nel miglioramento delle performance sia nell’abbassamento dei costi. Risultati che si possono comprendere partendo dalla domanda che il SVP della multinazionale statunitense ha posto in apertura all’uditorio virtuale dell’evento: come opera AWS?

Progettare l’infrastruttura seguendo il motto “tutto fallisce”

Per spiegarlo, Peter DeSantis ha preso le mosse da alcune citazioni di leader che l’hanno accompagnato nel corso degli ultimi 10 anni, a cominciare da quella di Werner Vogels, CTO e Vice President di Amazon: “Tutto fallisce”. Ed è proprio per “anticipare il fallimento” che la progettazione dei prodotti nel colosso di Seattle si traduce nella costruzione di componenti che garantiscano i migliori livelli di disponibilità nei suoi data center. Il concetto di fallimento è accompagnato da altri due, quello del raggio di esplosione e quello della complessità.

Il primo si riferisce alla interdipendenza delle componenti di un sistema e, perciò, se una di queste smette di funzionare, è importante sapere quante altre ne vengono influenzate. La complessità, invece, si ripercuote sia sull’identificazione di un problema sia sulla celerità nella sua risoluzione. DeSantis ha fatto l’esempio di come AWS abbia contenuto il raggio di esplosione e la complessità nella maintainability simultanea con ridondanza che coinvolge generatori, gruppi di continuità o UPS (Uninterruptible Power Supply) e commutatori. L’azienda anzitutto ha introdotto due sistemi di alimentazione completamente indipendenti in maniera tale che, in caso di guasto dell’uno, non ci fosse alcuna conseguenza sull’altro. In merito alla riduzione della complessità, ha poi trasformato gli UPS in tante piccole unità collocate direttamente in ogni rack, così che ciascuno sia facilmente e immediatamente sostituibile. Questi accorgimenti oggi garantiscono una disponibilità media dei data center pari a 99,99997%, il che è uguale a 9 secondi di downtime all’anno.

Le regioni di AWS per una ridondanza che non teme incidenti

Un altro fattore distintivo che, a detta di Peter DeSantis, differenzia AWS dai competitor riguarda non solo il design dell’infrastruttura dei data center basato su regioni che comprendono availability zones (AZ), ma anche la trasparenza sulla loro esatta collocazione. “Le regioni – ha sottolineato – sono progettate per essere completamente isolate l’una dall’altra a livello di infrastruttura e anche di software e servizi. By default, tutti i servizi AWS vengono creati e distribuiti per ogni regione allo scopo di assicurare che non ci siano problemi su più regioni contemporaneamente. In 15 anni servizi come Amazon S3, EC2 e DynamoDB non hanno mai avuto problemi significativi in più regioni simultaneamente”.

Ciascuna regione di AWS prevede un minimo di tre AZ affinché sia garantita la vicinanza in termini di latenza per la replica sincrona, ma allo stesso tempo non ci sia un’eccessiva prossimità che potrebbe far subire a entrambi i siti i danneggiamenti derivanti dal medesimo incidente naturale (terremoto, alluvione, incendio). Attualmente esistono 24 regioni indipendenti nel mondo e le prossime saranno posizionate a Cape Town e Milano, a cui si aggiungeranno in futuro Svizzera, Spagna e Indonesia.

Durante le tre settimane di Re:Invent 2020 sono state annunciate anche le seconde regioni in India, Giappone e Australia. AWS, oltre, a preoccuparsi della migliore progettazione dei data center ai fini della ridondanza fisica ottimale, ha triplicato dal 2015 a oggi il numero di fornitori di componenti critiche per far fronte a interruzioni causate dalla carenza di materiale, da scioperi o situazioni imprevedibili come quelle a cui ci ha abituati la pandemia. Per questo ha sviluppato una supply chain diversificata in termini di geografia e fornitori. “Come la separazione può proteggere l’infrastruttura, può anche proteggere la catena di approvvigionamento tra regioni” ha detto De Santis.

Graviton2 e l’impegno per la sostenibilità di Amazon

L’intervento del SVP si è anche soffermato a lungo sulle caratteristiche del processore Graviton2 e sul fatto che si allontana dal comune approccio simultaneous multi-threading (SMT) adottato dalle CPU x86 tradizionali. Per rispondere all’esigenza dei carichi di lavoro delle architetture cloud-based, Graviton2 infatti sfrutta il paradigma dello scale-out invece dello scale-up, lavorando con core indipendenti in parallelo, piuttosto che con giganteschi compiti singoli che lasciano inattivi una parte dei core, generando per di più maggiori consumi energetici.

Ed è su quest’ultimo fronte, quello dell’efficientamento energetico e della sostenibilità, che si è concentrata la conclusione di Peter DeSantis. Tra impianti eolici e solari realizzati su larga scala per alimentare i propri data center, AWS è riuscita a produrre 6500 megawatt di capacità di energia rinnovabile e punta ad avere il 100% entro il 2025.

A questo si aggiunge il sostengo da 2 miliardi di dollari a The climate pledge, piano a cui hanno aderito 31 aziende insieme ad Amazon, tra cui Verizon, Rivian, Siemens e Unilever. L’obiettivo è quello di produrre zero emissioni entro il 2040, dieci anni prima di quanto stabilito dall’accordo di Parigi. Nell’attesa, l’utilizzo di materiali alternativi al calcestruzzo per edificare una parte, seppur marginale, dei data center, e il riciclo dell’acqua per il raffreddamento degli impianti a sostegno dell’agricoltura, rappresentano ulteriori tappe lungo la costruzione di quel mondo green a cui anche Amazon vuole contribuire.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Speciale Digital360Awards e CIOsumm.it

Tutti
Update
Round table
Keynote
Video
Digital360Awards e CIOsumm.it, i momenti salienti
Eventi
Digital360 Awards e CIOsumm.IT, ecco i progetti vincitori
Tavola rotonda
Evoluzione del CIO: da centro di costo a motore strategico del business
Tavola rotonda
Business Process Augmentation: dall’RPA alla GenAI… il dato e tratto
Approfondimenti
Sistemi digitali potenziati: l’intelligenza dei chatbot è nelle mani dei CIO
Tavola rotonda
Intelligenza collaborativa e AI: sfide e opportunità per i CIO nell’era dello Human to Machine (H2M) 
Approfondimenti
Open Source: collaborazione e innovazione nel caos apparente del software libero 
Metodologie
BANI: che cos’è e come l’AI può aiutare i CIO a gestire la felicità (e l’infelicità) dei talenti
Prospettive
AI in un mondo complesso. Tra ordine e disordine, le aziende iniziano a capire la giusta via
Approfondimenti
Intelligenza Umana vs Intelligenza Artificiale insieme. Non invece
Eventi
Digital360 Awards e CIOsumm.IT, al via l’evento conclusivo
Video
Digital360Awards e CIOsumm.it, i momenti salienti
Eventi
Digital360 Awards e CIOsumm.IT, ecco i progetti vincitori
Tavola rotonda
Evoluzione del CIO: da centro di costo a motore strategico del business
Tavola rotonda
Business Process Augmentation: dall’RPA alla GenAI… il dato e tratto
Approfondimenti
Sistemi digitali potenziati: l’intelligenza dei chatbot è nelle mani dei CIO
Tavola rotonda
Intelligenza collaborativa e AI: sfide e opportunità per i CIO nell’era dello Human to Machine (H2M) 
Approfondimenti
Open Source: collaborazione e innovazione nel caos apparente del software libero 
Metodologie
BANI: che cos’è e come l’AI può aiutare i CIO a gestire la felicità (e l’infelicità) dei talenti
Prospettive
AI in un mondo complesso. Tra ordine e disordine, le aziende iniziano a capire la giusta via
Approfondimenti
Intelligenza Umana vs Intelligenza Artificiale insieme. Non invece
Eventi
Digital360 Awards e CIOsumm.IT, al via l’evento conclusivo

Articoli correlati

Articolo 1 di 4