Le organizzazioni moderne stanno dando sempre maggior importanza al valore dei dati, da cui, attraverso efficaci sistemi di analisi basati su intelligenza artificiale (AI) e machine learning (ML), è possibile estrarre insight preziosi per il miglioramento di qualunque attività di business. Tra le imprese, la popolarità degli algoritmi di AI e ML sta crescendo, anche grazie alla diffusione di servizi cloud come AutoML: quest’ultimo, accessibile attraverso la nuvola tramite API (Application Programming Interface), è stato introdotto da Google nel 2018, per semplificare l’approccio alla data science, rendere la AI rapidamente accessibile a sviluppatori e aziende d’ogni tipo, e applicare il ML alla risoluzione di problemi di business concreti.
Approccio semplificato alla data science con AutoML
Tradizionalmente, l’adozione delle tecniche e metodologie di machine learning ha sempre richiesto competenze molto approfondite, oggi sempre più ricercate sul mercato, ma anche difficili e costose da reperire, data l’attuale carenza di figure professionali in grado di padroneggiare l’insieme di complesse conoscenze che un data scientist deve possedere. Requisiti critici sono, ad esempio, la conoscenza dei linguaggi di programmazione (Python, R, Java, Scala, Julia); la capacità d’integrare numerose fonti informative per costruire le data pipeline; l’abilità di preparare i dati per l’analisi, di gestire con efficacia gli algoritmi, e, nel caso dell’implementazione di piattaforme di deep learning, la conoscenza di framework come PyTorch e Tensorflow.
AutoML per il riconoscimento d’immagini, l’analisi testuale, le traduzioni
La suite di prodotti di machine learning AutoML è studiata per consentire, anche a sviluppatori con esperienza e competenze limitate nei settori AI e ML, di addestrare modelli di ML di qualità elevata, personalizzabili in funzione delle differenti necessità aziendali. Le applicazioni di AutoML spaziano dalla creazione di modelli di visione artificiale per il riconoscimento d’immagini (AutoML Vision) o la classificazione di contenuti video (AutoML Video); al rilevamento di struttura, significato e classificazione di contenuti testuali (AutoML Natural Language), al riconoscimento e traduzione di differenti lingue (AutoML Translation).
In tutte queste applicazioni, il motore di ML AutoML, non automatizza la data science, non sostituisce i data scientist, ma è un processo automatico per facilitare la selezione degli algoritmi, la messa a punto degli iperparametri e la valutazione dei modelli: tutte operazioni che altrimenti richiederebbero lunghi tempi di analisi, assieme a elevate competenze tecniche e alla capacità di comprendere le differenti tipologie di data set e modelli che, di volta in volta, entrano in gioco nei singoli casi applicativi.
Training dei modelli con dataset più piccoli
Un aspetto chiave è che AutoML consente di costruire modelli affidabili, e ottenere risultati di qualità, anche utilizzando data set di dimensioni più contenute, perché non deve imparare da zero: e ciò grazie all’adozione di tecniche come il ‘transfer learning’ (TL), che sfrutta modelli già pre-addestrati su grandi data set di tipologia simile. Ad esempio, nel caso di AutoML Vision, per raffinare il modello di riconoscimento possono essere sufficienti poche centinaia d’immagini, anziché decine di migliaia. In tal modo, è possibile usare meno potenza computazionale, e ridurre i tempi e i costi del processo di training, rispetto alle tecniche non basate su transfer learning.
Utilizzi in industria, retail, medicina
In campo industriale, AutoML può essere applicato nel controllo qualità, per l’identificazione di difetti e anomalie nei prodotti. Nel settore retail e nell’e-commerce, le funzionalità di classificazione di AutoML sono utilizzabili per eseguire in automatico l’etichettatura della grande varietà di capi d’abbigliamento disponibili in negozi e punti vendita. Nel Regno Unito, il supermercato online Ocado, utilizzando il ML riesce a rispondere quattro volte più velocemente alle e-mail urgenti dei clienti, aumentando l’efficienza del contact center del 3,5%, e incrementando la velocità di analisi dei dati dell’80%. In medicina e assistenza sanitaria, la società Imagia usa AI e AutoML per addestrare i modelli a scoprire marcatori di malattie degenerative legate all’età.