Oltre 144mila dipendenti, quasi 8mila filiali con una rete internazionale che si snoda in circa 50 paesi del mondo, operatore globale nell’asset management con più di 223 miliardi di attività gestite (17 i paesi dove il gruppo effettua operazioni bancarie). Sono i numeri importanti che caratterizzano Unicredit, oggi uno dei gruppi finanziari più di rilievo a livello internazionale, che in Europa figura come primo operatore bancario.
Una realtà che oggi non può prescindere dall’It al punto da aver costituito una business unit interna totalmente dedicata alla Ricerca e Sviluppo (ReS) in campo tecnologico e all’Open Innovation, come illustra Riccardo Prodam, figura a capo di questa divisione, durante l’Intel Business Summit tenutosi a Milano lo scorso marzo.
Dove va la ricerca di Unicredit
Inizia subito descrivendo gli obiettivi che il suo team è chiamato a perseguire, Prodam, per illustrare come l’area ReS si muova all’interno del gruppo finanziario: “La nostra divisione, nata circa quattro anni fa, lavora con il team IT ma risponde direttamente al business e deve, prima di tutto, sviluppare ‘prototipi funzionanti dirompenti’, il che significa sperimentare, indubbiamente, ma anche fallire rapidamente per ripartire in modo agile e migliorare il processo di innovazione, il quale non può essere fine a se stesso ma produrre valore per l’azienda”.
Who's Who
Riccardo Prodam
Semplificare l’interazione tra la banca e i suoi clienti e tra le funzioni interne ed esterne, promuovere una sinergia sempre maggiore tra le aree tecnologiche e le aree di business, incrementare il valore del patrimonio aziendale tramite la registrazione di brevetti nonché sviluppare soluzioni open source per favorire la diffusione pubblica delle nuove tecnologie sono gli altri quattro obiettivi che Prodam cita durante la sua presentazione. Entrando poi nel merito degli ambiti di focalizzazione, quattro sono le aree di ricerca sulle quali il dipartimento sta concentrando gli sforzi rispetto agli obiettivi descritti:
- Big data analytics: “Estrarre valore dai dati si rivela essenziale per il successo dell’azienda a lungo termine”, evidenzia Prodam; “Abbiamo iniziato ad affrontare questo aspetto nel 2013, lavorando con l’ecosistema Hadoop (MapReduce, H-Base, Spark, Solr e Impala) con una precisa finalità: creare nuove opportunità di business”. Risale a più di tre anni fa la prima presentazione del team al management, nella quale si parlava di “estrazione dell’oro dai dati, ossia ‘recupero’ di informazioni di business da grandi moli di dati non necessariamente interni all’azienda”, descrive il capo della ricerca. “Dopo tre anni di ricerca e sviluppo di soluzioni interne che hanno contribuito di fatto a incrementare le revenue di Unicredit, ci siamo chiesti dove ‘potessimo andare’ per proseguire e migliorare il percorso, così abbiamo deciso di iniziare a collaborare con l’Università di Berkeley sul fronte del Machine learning”.
- Machine learning & Deep learning: “Che cosa hanno in comune l’analisi Big data e il Machine – Deep learning è abbastanza evidente: necessitano di enorme capacità computazionale”, riflette il top manager; “non solo, le moderne organizzazioni devono affrontare la sfida di estrarre informazioni significative da un’enorme mole di dati provenienti da fonti eterogenee, soprattutto da dati non strutturati che possono anche riguardare il linguaggio naturale dell’uomo”. Il team di Ricerca e Sviluppo oggi utilizza infatti approcci derivanti dalla community di apprendimento automatico in ambiti come l’analisi delle reti e l’elaborazione del linguaggio naturale; “andando in questa direzione è diventato fondamentale per noi identificare partner tecnologici come Intel in grado di supportarci ed affiancarci in ‘percorsi non convenzionali’ che non sempre possono trovare risposte in soluzioni presenti sul mercato”, enfatizza Prodam. “Per esempio, proprio grazie alla disponibilità di nuove tecnologie Intel siamo riusciti recentemente nell’ambito del Deep learning a migrare algoritmi piuttosto complessi che richiedono sistemi alla base altamente performanti da una infrastruttura legacy ad una standard x86”.
- FPGA: Field Programmable Gate Array, solitamente abbreviato in FPGA è un circuito integrato le cui funzionalità sono programmabili via software. Tali dispositivi consentono l’implementazione di funzioni logiche anche molto complesse e sono caratterizzati da un’elevata scalabilità. “L’incremento delle prestazioni tecnologiche è uno degli aspetti da sfruttare per favorire l’aumento delle performance aziendali”, fa presente Prodam, proseguendo nella spiegazione degli ambiti di intervento del suo team. “La ReS di Unicredit sta sfruttando questa opportunità e ha iniziato a lavorare internamente anche all’aspetto hardware della tecnologia per poter sfruttare sistemi caratterizzati da una maggiore potenza di elaborazione applicabili nell’ambito degli algoritmi complessi (in partnership con Intel e Altera)”.
- Crittografia: campo ormai consolidato, la crittografia è usata quotidianamente nelle transazioni bancarie, nei protocolli Internet e altro. “Nuovi progressi in questo ambito, come le dimostrazioni a conoscenza zero (zero-knowledge proof: in crittografia per conoscenza zero o protocollo a conoscenza zero si intende il metodo interattivo utilizzato da un soggetto per dimostrare ad un altro soggetto che una affermazione – solitamente matematica – è vera, senza rivelare nient’altro oltre alla veridicità della stessa), la computazione a parti multiple sicure (multi-party computation: può essere definita come il problema in cui un insieme di ‘giocatori’ -attori coinvolti nel problema – vogliono calcolare una certa funzione dei loro input segreti in modo sicuro, dove per sicuro si intende, secondo precise funzioni matematiche, che l’output della funzione deve essere corretto e che la segretezza degli input deve essere preservata anche in uno scenario in cui una parte dei ‘giocatori’ dovesse risultare corrotta) e la crittografia omomorfica [tipo di crittografia basata su tecniche che permettono la manipolazione di dati cifrati – La crittografia omomorfica permette di eseguire elaborazioni sui dati criptati, proprietà molto importante oggi soprattutto in ottica cloud: i dati presenti su una piattaforma di cloud non sono totalmente ‘al sicuro’ quando, per poter effettuare delle operazioni su di essi o manipolarli, c’è bisogno di decifrarli. La crittografia omomorfica risolve tale criticità consentendo di fatto a sistemi ed applicazioni di utilizzare le informazioni memorizzate nel cloud senza doverle decifrare – ndr] aprono la strada a ulteriori applicazioni sulle quali il nostro team sta focalizzando l’attenzione”, aggiunge Prodam.
Babel, la prima piattaforma interna per i Big Data
Dal team guidato da Prodam è nato, solo per citare un esempio concreto di ‘prototipo funzionante dirompente’, Babel, soluzione che oggi rappresenta la piattaforma di riferimento per l’analisi Big data in otto country: “il sistema consente non solo di effettuare analisi di dettaglio sulla clientela ma, per esempio, di estendere tali analisi all’ecosistema di relazioni (parenti, amici, colleghi, partner aziendali, ecc.) di un cliente o di un’azienda dal quale derivare informazioni utili in termini di mitigazione dei rischi (di insolvenza, per esempio) oppure di opportunità di nuovi ‘ingaggi’ – descrive Prodam -; il tutto avviene in real-time e il sistema produce report visuali facilmente comprensibili al business”.
Babel necessita di un’elevata capacità di calcolo che il team ReS garantisce attraverso infrastrutture hardware x86 a 64 bit “sulle quali abbiamo inserito lo strato software sviluppato internamente sfruttando totalmente l’open source – sottolinea Prodam – che a nostra volta rendiamo disponibile alla community di sviluppatori (lasciando il codice aperto e scaricabile direttamente dal sito di Unicredit)”. In particolare, la piattaforma Babel sfrutta un cluster Hadoop di 50 nodi che garantisce oltre 9 PetaByte di dati gestiti, storage Nas sia attivo sia passivo e connettività basata su comunicazione Ethernet fino a 100 GB; lato software il team ha utilizzato soluzioni (Hadoop, Cloudera, Spark, Apache HBase, Docker, Solr, Jupyter, solo per citarne alcuni) e linguaggi di programmazione differenti (Java, Python, C++, Scala, …).
Open source anche la security
Infine, anche i progetti in corso in ambito security basano il loro percorso di innovazione sull’open source. Prodam fa cenno ad un paio di ‘laboratori’ interni che stanno lavorando, come contributori della community open source, al progetto Lethe, “sistema che permette di inviare dati a un server cosiddetto ‘untrusted’ (per esempio perché collocato in cloud) in totale sicurezza grazie al fatto che gli algoritmi di crittografia dei dati consentono di nascondere i pattern di accesso e prevenire attacchi”. Lethe inoltre può eseguire ricerche e query su dati crittografati, accelerando così le analitiche.
“Altro progetto al quale stiamo lavorando – racconta il top manager in chiusura – si chiama Mitra e fa riferimento a un sistema di crittografia interamente omomorfica che richiede un’elevatissima capacità di elaborazione”.