Il cognitive bias rappresenta un pregiudizio o distorsione che le persone mettono in atto quando valutano eventi e fatti, distorcendo la realtà. Ecco cosa sono e quali tipi esistono in data science.
Cos’è un cognitive bias
Un bias cognitivo è una distorsione attuata dalle persone in fase di valutazione e giudizio di fatti e accadimenti, in grado di generare distorsioni della realtà.
Il pattern sistematico di deviazione dalla regola o dalla razionalità nei processi mentali di valutazione ricreano una visione soggettiva e personale dei fatti che non ha una fedele corrispondenza con la realtà.
Dunque il bias o distorsione cognitiva è un errore sistematico che si concretizza nel corso del processo in cui si elaborano e si interpretano le informazioni circostanti. Ha un impatto a livello comportamentale, dal momento che influisce sul processo decisionale e quello mentale di giudizio dei soggetti coinvolti.
Poiché ne siamo tutti affetti, è necessario che i data scientist conoscano tutte le tipologie di bias cognitivi, per prevenire errori nel proprio lavoro.
Quanti tipi ne esistono in data science
Secondo il libro The Art of Thinking Clearly di Rolf Dobell, esistono diversi tipi di bias cognitivi di cui non abbiamo mai avuto piena consapevolezza. Alcuni sono talmente profondi e radicati in noi, da non permetterci perfino di percepirli, se non dopo un’attenta analisi.
I cognitive bias possono cambiare il modo in cui i data scientist lavorano con i dati e affrontano il processo di decision-making quotidiano e in generale non nel modo più efficace.
La data science, nonostante debba operare in maniera oggettiva, è più soggettiva di quanto si pensi nell’elaborare i suoi processi. Anche se lavora con gli “hard fact” e i dati, rimane una forte componente interpretativa nella data science.
I data scientist devono dunque prestare molta attenzione a queste distorsioni, poiché tutti gli esseri umani sono molto suscettibili ai bias cognitivi.
Ecco i cinque cognitive bias più diffusi:
- survivorship bias o bias del sopravvissuto;
- la “fallacia dei costi irrecuperabili” o retrospective cost;
- la falsa causalità;
- il bias di disponibilità;
- il confirmation bias.
Il survivorship bias legati alla sopravvivenza
Durante la II Guerra Mondiale, i ricercatori del gruppo Center for Naval Analyses si trovarono a fronteggiare un problema. Avevano bisogno di rafforzare la forza aerea nei punti più deboli. Esaminarono ogni velivolo proveniente da una missione aerea per vedere dove era stato colpito dai proiettili. Sulla base di queste informazioni, irrobustivano i caccia nei punti precisi dell’impatto.
Ma in questo approccio c’era una lacuna: il monitoraggio avveniva solo sugli aerei che effettuavano il ritorno e non su quelli distrutti e che non tornavano alla base. Sapere dove avvenivano i danni fatali, che provocavano la caduta o l’esplosione degli aerei da guerra, sarebbe stato più utile per evitare la catastrofe.
Questo metodo di ricerca soffriva dunque del survivorship bias o della sindrome o pregiudizio del sopravvissuto.
Tale pregiudizio filtra implicitamente i dati sulla base di alcuni criteri arbitrari, poi prova a trarne un senso realizzando di lavorare con dati incompleti.
Per mitigare questo bias bisogna pensare in maniera rigorosa e scientifica ai problemi e quindi fare brainstorming su ogni tipo di dati che potrebbe aiutare a risolvere il problema, invece di limitarsi a partire dai dati. Il secondo metodo, infatti, restringe la propria visione perché non centra l’obiettivo di sapere cosa manca alla ricerca. Invece, adottando il primo approccio, sappiamo quali dati non possiamo avere e dunque mancano, in modo tale da giungere prima alle giuste conclusioni.
La “fallacia dei costi irrecuperabili” o Retrospective cost
Prima o poi ci siamo tutti trovati in quella situazione in cui si getta via tempo prezioso per salvare l’investimento di tempo fatto fino a quel punto: guardare un film o leggere un libro fino in fondo anche se non convince per non ammettere di aver perso già abbastanza tempo ad arrivare a metà film o a metà libro.
Succede ogni volta che si persevera in maniera ottusa a tenere comportamenti dannosi riconosciuti come tali, per non ammettere che bisogna passare ad altro.
Per salvaguardarsi da questo cognitive bias, occorre guardare alle prospettive e ai costi futuri, ignorando i costi già sostenuti.
La falsa causalità
I data scientist sono sempre in cerca di pattern. A volte c’è la tendenza errata a trovare pattern laddove non esistono e dunque a inventarli. Alcune variabile sembrano avere un nesso causale, ma in realtà è solo casualità e non c’è alcun nesso causa-effetto.
Poiché bisogna non cadere nell’errore di creare variabili dei nostri modelli, ad ogni step del processo è importante chiedersi se la variabile indipendente è correlata alla variabile dipendente o meno.
Il bias di disponibilità
Questo pregiudizio è frutto dell’ignoranza: è un errore che commettiamo quando scarseggiano i dati disponibili e vogliamo dare un senso agli avvenimenti senza disporre di dati più accurati. Uno dice: “Non puoi ingrassare bevendo birra, perché Paolo beve molta birra ed è magro”. Si usano cioè dati disponibili senza considerare alternative più utili. Bisogna studiare tanto e leggere ancora di più, a 360 gradi, per allargare i propri orizzonti e non cadere in questo cognitive bias molto comune.
Il confirmation bias
Non serve torturare i dati sufficientemente a lungo per farli confessare. Questa battuta è un po’ datata, ma aiuta sempre a illustrare i confirmation bias. Alcune opinioni appartengono alla nostra condizione umana, ma bisogna sfatare le leggende metropolitane per arrivare alle informazioni corrette.
Spesso interpretiamo le informazioni di cui disponiamo in un modo che sia compatibile con ciò in cui crediamo. Non vediamo le evidenze solo perché ci costringerebbero ad uscire dal nostro immaginario e abbiamo timore di cambiare la nostra visione.
Il confirmation bias entra in gioco nella data science nella fase di analisi costi-benefici di un progetto. In questo stadio le persone non vedono le prove che contraddicono le loro opinioni. Ovviamente questo approccio ha un impatto negativo sul progetto, ma è necessario esserne consapevoli.
Per combattere questo bias, occorre esaminare tutte le opinioni e stravolgere tutte le teorie. Occorre essere open mind: parlare con le persone con cui non si parla mai e esaminare prove che in genere si danno per scontate. Solo con un radicale cambio di paradigma si scoprono i confirmation bias e si corregge la rotta.