150.000 città, 5 milioni di record, un solo vincitore

SAS ha individuato il posto migliore al mondo a partire da migliaia di fonti di dati, ribaltando completamente le ricerche di mercato tradizionali. E il vincitore è West Perth, in Australia.

Attraverso tecniche di machine learning, i data scientist coinvolti nel progetto Paradise Found hanno individuato i criteri più importanti dai dati stessi, in controtendenza rispetto alle classifiche tradizionali che usano criteri di valutazione predeterminati. Sulla base degli otto criteri chiave identificati (Istruzione e carriera, Famiglia, Cultura, Natura, Sicurezza e infrastrutture, Costo della vita, Ristoranti e shopping, Salute), West Perth ha ottenuto il primo posto tra le circa 150.000 città analizzate a livello mondiale.

Per Paradise Found, sono stati esaminati oltre 5 milioni di record provenienti da 1.124 fonti di dati uniche. Sono stati inclusi sia dati strutturati che testuali (ad esempio sotto forma di testi da agenzie statistiche) ottenuti da varie fonti open source e open data come studi sulle città, social media (come TripAdvisor e Twitter), servizi di dati internazionali forniti da organizzazioni quali la Banca mondiale, l’UNESCO, l’OMC, Numbeo e l’UE; e servizi di dati georeferenziati come Google Places e OpenStreetMap.

Tutte queste informazioni sono state combinate all’interno della SAS Platform e analizzate attraverso tecniche di machine learning e data mining, con l’utilizzo di differenti software tra cui SAS Visual Data Mining & Machine Learning e SAS Visual Analytics.

150.000 città, 5 milioni di record, 1.124 fonti di dati per trovare il paradiso in terra

Algoritmi intelligenti, attraverso tecniche di machine learning, hanno preso in considerazione nelle città analizzate numerosi elementi come: condizioni meteorologiche, mercato del lavoro, assistenza sanitaria, indici dei prezzi, inquinamento ambientale, trasporti pubblici. Ma anche elementi più specifici, come il prezzo di un chilo di banane, la lunghezza dei percorsi pedonali, il numero di alberi, la larghezza dei marciapiedi e il numero di ore che un cittadino trascorre ogni anno negli ingorghi stradali e West Perth ha ottenuto punteggi alti nelle varie categorie considerate.

“Paradise Found non è la solita classifica sulle città. È una survey analitica. L’abbiamo implementata per dimostrare come le tecniche di machine learning possano supportare il processo decisionale. I metodi tradizionali utilizzano una serie di criteri per la creazione di sondaggi che servono a determinare quali dati devono essere raccolti e statisticamente valutati per lo scopo. Per Paradise Found, invece, abbiamo elaborato tutti i dati disponibili, permettendo al machine learning di stabilire quali criteri fossero davvero importanti. In questo modo, nessun aspetto può essere ignorato semplicemente perché nessuno l’ha cercato. “Sono i dati a parlare, non un’ipotesi di modello”, ha commentato Michela Guerra, Regional Marketing Communication Manager SAS. “Ecco perché questo progetto è un ottimo esempio di ciò che analytics e machine learning sono in grado di fare, ovvero individuare pattern nei dati a partire da una prospettiva del tutto oggettiva. Può essere divertente sapere dove si trova il posto migliore del mondo. Ma nel mondo del business, questo approccio analitico è uno strumento fondamentale per la sua capacità di scoprire opportunità e modelli di business completamente nuovi”.