Multimodal PAML (Predictive Analytics and Machine Learning) significa immaginare un futuro in cui l’analisi predittiva diventerà una commodity per tutte le linee di business. Dedicate alle analitiche spinte, supportate dal machine learning, questo tipo di soluzioni apre le porte alla scienza dei dati anche a chi scienziato dei dati non è. Analisti aziendali, ingegneri, professionisti del marketing, responsabili delle risorse umane, web specialist e manager di ogni line of business possono collaborare con i data scientist, costruendo in autonomia alcuni modelli associati alle ruotine operative più semplici. È così che i data scientist possono concentrarsi su progetti più innovativi e sfidanti. A spiegare l’evolutiva dei multimodal PAML sono gli analisti di Forrester, che hanno svolto una serie di ricerche finalizzate a fotografare l’evoluzione dell’offerta e il livello di maturità dei mercati.
Multimodal PAML: una definizione
La definizione che Forrester dà al PAML aziendale è quella di un software che fornisce ai team di esperti dei dati aziendali e ad altri portatori di interesse:
- gli strumenti per analizzare i dati
- gli strumenti di workbench per costruire modelli predittivi usando algoritmi statistici e di machine learning
- una piattaforma per distribuire e gestire risultati e modelli analitici che include anche finalità di training
- gli strumenti collaborativi a supporto di team aziendali estesi, inclusi executive, data engineer, sviluppatori di applicazioni, professionisti DevOps e ingegneri AI
Predictive Analytics and Machine Learning Solution: esempi
Rispetto all’offerta, Forrester opera una segmentazione delle soluzioni PAML:
- Soluzioni PAML basate su notebook – I documenti notebook sono documenti prodotti dall’app Jupyter Notebook, che contengono codice ed elementi di rich text (equazioni, figure, collegamenti e via dicendo). In sintesi, sono documenti che possono essere letti da una persona e che contengono la descrizione dell’analisi e i risultati (figure, tabelle e così via) o sono documenti eseguibili che effettuano l’analisi dei dati. Questo tipo di soluzioni favorisce un approccio basato sul codice, offrendo strumenti di workbench incentrati sulla codifica in R, Python e altri linguaggi di programmazione, utilizzando la versione di Jupyter open source o un’interfaccia proprietaria che rende la codifica più efficiente. I fornitori di questo segmento aggiungono al PAML funzionalità significative e differenziate come, ad esempio, il provisioning ambientale, la gestione dei progetti, l’implementazione e la gestione dei modelli, strumenti di visualizzazione e via dicendo.
- Soluzioni PAML automatizzate – Aiutano i professionisti che non sono data scientist a costruire modelli. Questo segmento si concentra soprattutto sugli strumenti per automatizzare le fasi del ciclo di vita della modellizzazione. Le soluzioni incentrate sull’automazione consentono ai data scientist e agli altri professionisti non specializzati di creare modelli mediante processi di configurazione anziché di codifica e specifica di ogni fase della pipeline in chiave data science.
- Multimodal PAML – Sono le soluzioni che offrono la più ampia gamma di strumenti a supporto di molteplici paradigmi, con una diversificazione anche a livello di interfaccia utente. Le caratteristiche di queste soluzioni sono il più ampio set di strumenti di workbench, tra cui interfacce grafiche (GUI), procedure guidate di configurazione, soluzioni automatiche e ambienti di codifica. Molte di queste soluzioni forniscono anche strumenti per i non-data scientist che consentono di costruire pipeline di dati, creare modelli di machine learning e collaborare con i team dei data scientist.
Rispetto all’offerta attuale di mercato esistono anche alcuni distributori multimodali o notebook-based che includono la componente di automazione.
PAML per le LOB: in arrivo i citizen data scientist
Come sottolineano gli esperti, i dati sono la benzina dell’intelligenza artificiale e il butterfly effect del business. Oggi le aziende lavorando su meccanismi previsionali supportati da algoritmi sempre più avanzati, utilizzano il machine learning per identificare il tasso di conversione dei clienti, fare upselling e cross-selling, risolvere i colli di bottiglia della logistica, pianificare la produzione, prevedere guasti in macchinari e impianti, ottimizzare la gestione dei talenti, migliorare la gestione dell’organizzazione intraziendale.
Tuttavia, a fronte di un uso sempre più pervasivo dell’intelligenza euristica, ci sono ancora migliaia di altre applicazioni e processi aziendali che potrebbero beneficiare dei modelli predittivi. Favorire la maturità dei manager rispetto all’uso delle analitiche è l’obiettivo dei PAML multimodali. Ma attenzione, avvertono gli analisti: queste soluzioni, progettate per semplificare l’applicazione dell’analisi predittiva quando i bisogni sono chiari e specifici, non significa affatto che il carico di lavoro del data scientist diminuirà.
Sarà proprio il contrario. Le soluzioni PAML multimodali, infatti, nascono come strumenti di supporto all’impresa collaborativa più smart. Non a caso, la road map evolutiva ha tempi brevissimi: secondo gli analisti, da qui ai prossimi due anni i data scientist faranno un uso sempre più spinto di soluzioni PAML multimodali. Il che porterà a una nuova generazione di quelli che Forrester chiama citizen data scientist.
Enterprise collaboration potenziata dall’AI
La maggior parte dei team che si occupano della scienza dei dati è piccola e molto dispersa a livello organizzativo. Gli sforzi si indirizzano soprattutto verso i progetti più ripetitivi, in particolare quelli legati ai vari portatori di interesse delle LOB o attività che comportano lo sviluppo di nuovi casi d’uso. Nella ricerca di Forrester, commissionata da SAP, intitolata Powering The Intelligent Enterprise With AI, Machine Learning, And Predictive Analytics, gli analisti evidenziano come per oltre 6 aziende su 10 (64%) i team dedicati alla data science facciano fatica a stare al passo con la continua domanda di dati che arriva dall’alto. Troppo spesso le organizzazioni incontrano difficoltà nell’inglobare modelli di apprendimento automatico nelle applicazioni che hanno di produzione: scalare la gestione dei dati, le analisi e le pratiche di data science non è semplice e nemmeno immediato.
Come sottolineano gli analisti Forrester nella ricerca intitolata Multimodal Predictive Analytics And Machine Learning Solutions, Q3 2018, per supportare l’esplosione dei casi di utilizzo delle analitiche predittive all’interno delle organizzazioni i team devono diventare più grandi, includendo i manager delle LOB capaci di abbracciare una nuova cultura dei dati. A contribuire a fare la differenza sono soprattutto i multimodal PAML, supporto prezioso per i gruppi di lavoro dei data scientist che operano in community diversificate in cui lavorano uomini d’affari, ingegneri dei dati, softwaristi, sviluppatori e ingegneri specializzati nell’AI. Non a caso da qui ai prossimi anni le previsioni di Forrester sono che i team di data science allargati diventeranno più numerosi e consistenti rispetto ai team di sviluppo software.
Data scientist: limiti e opportunità
Portare una componente di automazione nella scienza dei dati è un obiettivo pragmatico, oltre che strategico. È impossibile, infatti, che i team di data science possano sfornare e mantenere migliaia di modelli predittivi per ogni minimo bisogno. Il ciclo di vita della scienza dei dati basato sulle variazioni del processo CriSP-DM (Cross-industry standard process for Data Mining) è ormai obsoleto, perché troppo sequenziale e, a livello manuale, troppo iterativo per consentire di aumentare una produttività dei dati consistente.
Forrester, facendosi portavoce anche dello scontento dei data scientist, evidenzia come i modelli predittivi sviluppati, a fronte degli sforzi, alla fine vengano implementati in bassa percentuale nelle aziende.
Il motivo non è solo il caos a livello organizzativo che rende difficile l’esatta comprensione di come vadano progettati e applicati i modelli calati nel mare magnum dei sistemi aziendali. Una parte importante del problema è legata alla tecnologia: i codici di programmazione dei software in uso nelle aziende non sempre sono fatti per integrare i modelli sviluppati dai data scientist. La finalità dei modelli è quello di diventare applicazioni. I multimodal PAML favoriscono la cooperazione tra i data scientist e i team di sviluppo delle applicazioni, favorendo l’integrazione dei modelli ai vari tool che questi professionisti usano per progettare, sviluppare e distribuire le applicazioni.
Prestare attenzione all’evoluzione della programmazione
Un’altra grande sfida per i professionisti dei dati, infatti, sarà quella di tenere il passo con l’innovazione open source. Come sottolineano gli esperti, il cambio di strumenti e l’apprendimento di nuovi linguaggi di programmazione rischiano di uccidere la produttività. I team di data science hanno bisogno di un rapido accesso all’innovazione associata, ad esempio, all’uso del deep learning applicato a nuovi casi d’uso aziendali e un approccio multimodale li aiuta a fare la differenza.
Molti team che utilizzano soluzioni di multimodal PAML sono costretti a utilizzare anche una soluzione basata su notebook per ottenere un rapido accesso alle librerie open source. Chi offre multimodal PAML deve rendere disponibili rapidamente nuove librerie open source, preoccupandosi anche di aggiornare le librerie esistenti.
Multimodal PAML: il quadro dell’offerta
Rispetto al quadro dell’offerta multimodal PALM, nella Forrester Wave sono inclusi 13 fornitori: Dataiku, Datawatch, Fico, IBM, Knime, MathWorks, Microsoft, RapidMiner, Salford Systems, SAP, SAS, Tibco Software e World Programming.
Gli analisti hanno valutato i punti di forza e di debolezza dei principali fornitori, ripartendoli su tre diversi cluster:
- Offerta attuale – La posizione di ciascun fornitore sull’asse verticale del grafico di Forrester Wave indica la forza dell’offerta attuale. I criteri chiave della valutazione includono workbench, modelli operazionali, algoritmi, architettura e soluzioni aziendali.
- Strategia – Il posizionamento sull’asse orizzontale indica la forza strategica dei fornitori rispetto alle loro capacità in termini di execution, alla roadmap delle soluzioni, alle modalità di supporto all’implementazione, ai prezzi ma anche alla tipologia di partner.
- Presenza sul mercato – I punteggi associati alla presenza sul mercato riflettono, tra i vari criteri di valutazione, il livello d’adozione delle soluzioni di ciascun fornitore da parte dei clienti, le stime relative alle entrate generate dai prodotti e la market awareness.