Il deep learning è una branca dell’intelligenza artificiale (AI) che sta guadagnando crescente interesse e applicazioni nelle imprese. Sottocategoria del machine learning (ML), il deep learning si distingue da altre applicazioni dell’AI per l’utilizzo delle reti neurali artificiali, ossia di algoritmi direttamente ispirati alla struttura e al funzionamento del cervello umano. L’imitazione delle strutture biologiche consente infatti alle macchine di confrontarsi con forme di apprendimento strutturato profondo e gerarchico che sono caratteristiche del mondo animale e umano, utili nei campi del riconoscimento delle immagini, della lingua parlata, del linguaggio naturale oltre che nella comprensione di altri fenomeni complessi. In questo post ci focalizzeremo su come il deep learning può essere sfruttato dal data scientist.
Come funziona il deep learning
Il deep learning opera sfruttando differenti classi di algoritmi disposti su più livelli in cascata, dove ogni livello effettua trasformazioni ed estrazioni basate su caratteristiche specifiche usando come input il prodotto del livello precedente: in un processo di visione, per esempio, il primo livello impara a riconoscere i vertici delle figure geometriche, il secondo a distinguere triangoli e rettangoli, il terzo a comprendere forme complesse e relazioni spaziali e così via, fino a dare significato all’immagine.
Nel deep learning l’apprendimento procede quindi per livelli d’astrazione crescenti, creando gerarchie di concetti. Va da sé che la potenza del deep learning dipenda dal numero di livelli intermedi impiegati e quindi dalla grandezza della rete neurale. Benché la richiesta di capacità computazionali cresca esponenzialmente con le dimensioni della rete, il deep learning non pone problemi di scalabilità.
Rispetto ai metodi d’apprendimento superficiale usati nel ML e caratterizzati da un livello massimo di prestazione che, una volta raggiunto, non è passibile di ulteriore miglioramento, i sistemi di deep learning possono continuare a migliorare man mano che si aggiungono nuovi dati nel training.
Il data scientist e le applicazioni del deep learning
Le tecnologie analitiche più avanzate e le capacità dei data scientist d’estrarre valore dai dati consentono all’azienda di sbagliare di meno, rivoluzionare modalità operative e di relazione con i propri clienti. L’AI e il deep learning consentono al data scientist di indagare gli aspetti più complessi, accelerando i tempi d’analisi e valorizzando ulteriormente il patrimonio dati aziendale.
La disponibilità di dati, unitamente a infrastrutture hardware (CPU e GPU) sempre più performanti e servizi computazionali accessibili “on demand” hanno fatto fare alle tecnologie di deep learning passi evolutivi importanti negli ultimi cinque anni. L’innovazione molto veloce e concentrata su ambienti open source non ha favorito i data scientist nel tenere il passo con le conoscenze per sfruttare al meglio le tecnologie.
I sistemi di deep learning richiedono al data scientist molto impegno nel rendere disponibili i dati per il training. Gli algoritmi di deep learning possono essere di due tipi fondamentali: supervisionati e non supervisionati. Nel primo caso l’essere umano è funzionale al processo di apprendimento, in quanto fornisce gli input e le correzioni che permettono al sistema di diventare sempre più efficace, per esempio, nei compiti di classificazione. Nel caso degli algoritmi non supervisionati, il sistema di deep learning opera autonomamente riconoscendo pattern (ovvero somiglianze, relazioni, ciclicità) che per complessità o per la mole d’informazioni in gioco sfuggirebbero all’essere umano. Al data scientist resta in questo caso il compito chiave d’interpretare le relazioni identificate dalla macchina, per eliminare quelle spurie e dare alle altre il valore che meritano.
Il deep learning ha trovato applicazioni che vanno dalla computer vision (per la conduzione automatica di auto, droni e robot impiegati nell’industria) al riconoscimento per le chatbot con i clienti. Deep learning è impiegato per il riconoscimento facciale in applicazioni di videoconferenza e sorveglianza; per il riconoscimento di immagini diagnostiche in radiologia; per aiutare i ricercatori a individuare le correlazioni tra sequenze genetiche, malattie e farmaci; per l’analisi dei dati rilevati dai sensori IoT in servizi di manutenzione predittiva; per applicazioni avanzate di check out automatico nei supermercati e health care.