di Irene Di Deo – Ricercatrice Osservatorio Big Data Analytics & BI
L’utilizzo dei Big Data Analytics nell’identificazione e prevenzione delle frodi emerge nel 2018 come una delle next-priority per le grandi aziende italiane: circa un’azienda su cinque ha un’idea progettuale in quest’ambito. Il settore più attivo è il Finance, ma non è l’unico: l’Osservatorio Big Data Analytics & Business Intelligence ha avuto occasione di raccontare progetti di identificazione frodi anche in ambito Telco o Utility, piuttosto che progettualità di contrasto a frodi interne (ad opera degli stessi dipendenti) in vari settori aziendali.
Perché parlare di Big Data e identificazione delle frodi? La motivazione è duplice: da un lato i tentativi di truffe finanziarie e assicurative, così come gli attacchi informatici, sono aumentati esponenzialmente negli ultimi anni, dall’altro il potenziale dei Big Data in quest’ambito è estremamente elevato.
Il concetto di pattern discovery, ovvero l’identificazione di relazioni e comportamenti similari attraverso meccanismi di analisi massiva su grandi moli di dati, ben si lega all’ambito delle frodi. Partire da una serie di variabili per identificare situazioni sospette è esattamente il lavoro svolto dagli esperti antifrode, in contesti tradizionali. Questo lavoro oggi può essere in parte automatizzato e in parte migliorato dall’utilizzo di tecnologie più performanti e algoritmi sempre più intelligenti.
Fraud Detection e tendenze del mercato Analytics: un connubio vincente
Real time Analytics, Machine Learning, utilizzo di nuove fonti dati: questi sono solo alcuni dei trend che investono il mercato Analytics a livello internazionale e che sempre di più si tradurranno in progettualità concrete in Italia. Le progettualità più innovative sviluppate dalle aziende sono accomunate da tecnologie molto performanti – che permettono di analizzare e visualizzare i dati in tempo reale – e dall’utilizzo algoritmi di apprendimento automatico che si basano sull’integrazione di numerose fonti dati, sia tradizionali (dati transazionali) sia semi o destrutturate come dati web, immagini, testi o video.
Nell’ambito dell’identificazione frodi, ciò si traduce, ad esempio, nell’utilizzo di sistemi di analisi delle immagini per riconoscere le truffe assicurative sull’RC Auto o nell’addestramento di algoritmi di Machine Learning di classificazione per distinguere i “veri” frodatori da clienti che stanno subendo dei disservizi. Anche l’utilizzo dei Real Time Analytics, uno dei temi di maggiore attenzione in questo momento, ha un impatto particolarmente elevato nel campo dell’antifrode: minore è il tempo necessario a individuare la truffa, maggiori sono le probabilità di ridurre i danni economici.
I benefici che emergono, per le aziende che sviluppano progettualità con questi obiettivi, sono estremamente trasversali. Prima di tutto, il processo di rilevamento delle frodi risulta notevolmente migliorato e molto più efficiente: si riducono i falsi positivi e si riescono a liberare risorse per attività a maggior valore aggiunto. Queste progettualità hanno anche impatti non quantificabili nell’immediato, ma molto importanti nel medio periodo. Si tratta ad esempio di benefici in termini di brand reputation e di formazione degli operatori. Gli esperti antifrode, tutt’altro che sostituiti, potranno svolgere un ruolo fondamentale nell’addestramento dei modelli e nella valutazione dell’efficacia degli stessi.
Le frodi in ambito Finance: due casi di successo
“Come Mosè divideva le acque, così il nostro sistema antifrode divide le pratiche buone da quelle cattive” – così Luca De Paoli, Responsabile Antifrode di Agos Ducato, apre il suo intervento al Convegno 2018 dell’Osservatorio Big Data Analytics & BI.
Mosè non è nient’altro che un sistema di machine learning, nato con l’obiettivo di intercettare in maniera automatica le truffe presenti nel mondo dei finanziamenti finalizzati. Si tratta di truffe finanziarie e, in sempre più casi, di veri e propri furti d’identità. Se in precedenza ogni richiesta di credito considerata “sospetta” veniva sottoposta all’attenzione dell’ufficio antifrode, che esaminava manualmente il materiale, dal 5 luglio 2018 il sistema in produzione assegna in real-time uno score di probabilità di frode ad ogni pratica analizzata, senza richiedere informazioni aggiuntive al cliente. Ciò permette di effettuare uno screening di tutte le richieste in maniera automatica e l’ufficio antifrode può intervenire a posteriori, per verificare di volta in volta l’accuratezza del modello.
Nel medesimo Convegno, qualche ora prima, si era parlato di antifrode in ambito assicurativo. Alessandra Chiuderi, Head of Group Analytics Solutions Centre di Generali Group, aveva infatti identificato, come una delle principali priorità per il suo team, lo sviluppo di prodotti di Advanced Analytics basati sull’analisi dell’immagini, finalizzati a migliorare e efficientare il lavoro dei liquidatori di sinistri in ambito RC Auto. Stesso danno riproposto in sinistri diversi in tempi diversi, immagini manipolate o danni non conformi alla dinamica descritta: ecco alcuni esempi di situazioni molto complesse da riconoscere per un umano, ma che possono essere identificate facilmente da un algoritmo di Deep Learning ben addestrato.
Non solo Finance: quando il cliente non paga il servizio
Tutte le aziende che vendono servizi in abbonamento si trovano a dover contrastare i mancati pagamenti dei clienti. In quest’ambito, sono molti i progetti in corso che sfruttano il Machine Learning per indirizzare meglio gli sforzi dei propri operatori, ovvero distinguere tra i clienti che in maniera dolosa decidono di non pagare il servizio e quelli che semplicemente dimenticano di pagare la bolletta o non hanno aggiornato i dati della carta di credito.
Partendo da una buona integrazione di tutti i dati di contatto con i clienti e implementando algoritmi di apprendimento automatico di classificazione, è possibile migliorare il sentiment generale dei clienti e predirne il comportamento, agendo in maniera tempestiva e personalizzata. Riduzione delle frodi, dunque, ma anche riduzione del tasso di abbandono e dei rischi reputazionali.
Immagine: www.picpedia.org