Il posto migliore dove vivere è West Perth in Australia. Così ha stabilito Sas, fornitore di software e servizi di analytics, analizzando migliaia di fonti di dati, attraverso tecniche di machine learning.
Nello specifico, i data scientist coinvolti nel progetto Paradise Found hanno individuato i criteri più importanti dai dati stessi, in controtendenza rispetto alle classifiche tradizionali che usano criteri di valutazione predeterminati. Sulla base degli otto criteri chiave identificati (Istruzione e carriera, Famiglia, Cultura, Natura, Sicurezza e infrastrutture, Costo della vita, Ristoranti e shopping, Salute), West Perth ha ottenuto il primo posto tra le circa 150.000 città analizzate a livello mondiale.
Ma ognuno di noi ha esigenze e desideri diversi: dunque mediante il Paradise Configurator tutti possono scoprire in un batter d’occhio il proprio angolo di paradiso. Con questo tool SAS vuole dimostrare a chiunque le potenzialità del machine learning: a differenza delle tradizionali classifiche, Paradise Configurator determina qual è la località migliore in base alle esigenze di ognuno.
5 milioni di record da 1.124 fonti di dati: sono i big data utilizzati per trovare il posto migliore al mondo dove vivere
Algoritmi intelligenti, attraverso tecniche di machine learning, hanno preso in considerazione nelle 150.000 città analizzate numerosi elementi come: condizioni meteorologiche, mercato del lavoro, assistenza sanitaria, indici dei prezzi, inquinamento ambientale, trasporti pubblici. Ma anche elementi più specifici, come il prezzo di un chilo di banane, la lunghezza dei percorsi pedonali, il numero di alberi, la larghezza dei marciapiedi e il numero di ore che un cittadino trascorre ogni anno negli ingorghi stradali e West Perth ha ottenuto punteggi alti nelle varie categorie considerate.
Più nello specifico, per Paradise Found per capire qual possa essere il posto migliore al mondo dove vivere, sono stati esaminati oltre 5 milioni di record provenienti da 1.124 fonti di dati uniche. Sono stati inclusi sia dati strutturati che testuali (per esempio sotto forma di testi da agenzie statistiche) ottenuti da varie fonti open source e open data come studi sulle città, social media (come TripAdvisor e Twitter), servizi di dati internazionali forniti da organizzazioni quali la Banca mondiale, l’UNESCO, l’OMC, Numbeo e l’UE; e servizi di dati georeferenziati come Google Places e OpenStreetMap.
Tutte queste informazioni sono state combinate all’interno della SAS Platform e analizzate attraverso tecniche di machine learning e data mining, con l’utilizzo di differenti software tra cui SAS Visual Data Mining & Machine Learning e SAS Visual Analytics.
“Paradise Found – ha commentato Michela Guerra, Regional Marketing Communication Manager SAS – non è la solita classifica sulle città. È una survey analitica. L’abbiamo implementata per dimostrare come le tecniche di machine learning possano supportare il processo decisionale. I metodi tradizionali utilizzano una serie di criteri per la creazione di sondaggi che servono a determinare quali dati devono essere raccolti e statisticamente valutati per lo scopo. Per Paradise Found, invece, abbiamo elaborato tutti i dati disponibili, permettendo al machine learning di stabilire quali criteri fossero davvero importanti. In questo modo, nessun aspetto può essere ignorato semplicemente perché nessuno l’ha cercato. Sono i dati a parlare, non un’ipotesi di modello. Ecco perché questo progetto è un ottimo esempio di ciò che analytics e machine learning sono in grado di fare, ovvero individuare pattern nei dati a partire da una prospettiva del tutto oggettiva. Può essere divertente sapere dove si trova il posto migliore del mondo. Ma nel mondo del business, questo approccio analitico è uno strumento fondamentale per la sua capacità di scoprire opportunità e modelli di business completamente nuovi”.