Per i dati serve un new deal

Da un ecosistema dei dati personali, sempre più “feudale, frammentato e inefficiente”, si deve passare a un “new deal” fondato su principi quali autodeterminazione, diritti individuali e riconoscimento dei dati come un bene prezioso di proprietà dell’individuo. Elemento fondante di questo possibile futuro ecosistema è la centralità dell’utente

Il ruolo chiave dei dati nell’economia digitale non è più oggetto di dibattito. Secondo l’analisi più recente, il mondo produce qualcosa come 2,5 quintilioni (2,5×1018) di byte di dati ogni giorno [^[1]], mentre sempre più attività umane stanno diventando importanti fonti di dati (anche grazie al ruolo crescente dei dispositivi IoT, anche di natura medica, dagli smartphone alle nuove generazioni di elettrodomestici smart). Non sorprende che la Commissione Europea abbia delineato già da tempo una strategia per consentire la creazione di una fiorente economia dei dati, a beneficio dei cittadini, di una maggiore competitività e del progresso generale della società europea [^[2]].

Questa crescente importanza dei dati è fisiologicamente foriera di tensioni tra attori privati e istituzioni pubbliche, in particolare sul controllo, l’accesso e l’utilizzo dei dati personali – tra la necessità di preservare la privacy e il benessere dei cittadini e la necessità di utilizzare i dati per fornire nuovi prodotti e servizi ad utenti e consumatori. Le grandi aziende IT come Google, Facebook e Amazon, hanno fatto della raccolta e dell’elaborazione dei dati il loro core business. Se adottiamo l’analogia tra dati e petrolio, tutti questi attori privati possono essere visti come “piattaforme di estrazione e raffinamento” per i dati (come sono state rappresentate in una copertina dell’Economist di maggio 2017 dal titolo “La risorsa più preziosa del mondo”, in riferimento all’importanza dei dati). In tal senso, queste piattaforme – per tutelare il loro vantaggio competitivo – finiscono per controllare grandi quantità di dati, anche tramite metodi predatori e pratiche monopolistiche, creando di fatto grandi oligopoli di dati.

Per queste ragioni, si rende sempre più urgente il passaggio da un ecosistema dei dati personali che appare sempre più “feudale, frammentato e inefficiente”, a un “New Deal” dei dati, fondato su principi quali l’autodeterminazione, diritti individuali e il riconoscimento dei dati come un bene prezioso di proprietà dell’individuo [^[3]]. Ciò che appare come un elemento fondante di questo possibile futuro ecosistema è la centralità dell’utente: consentire alle persone di esercitare un controllo effettivo sui propri dati e avere il potere di decidere come, a chi e per quale scopo concedere l’accesso a informazioni personali sensibili. Centralità dei cittadini, coinvolgimento delle istituzioni pubbliche, sicurezza e regole chiare di gestione, trasparenza, sono tutti elementi essenziali dei futuri ecosistemi di dati [^[4]], per una nuova economia dei dati.

Indice degli argomenti

Economia dei dati e data marketplace: come attribuire un “prezzo” ai dati?

Un trend interessante in questo settore è quello che tende alla creazione di un ecosistema per lo scambio trasparente di dati direttamente fra soggetto e utilizzatore di dati, per il tramite di appositi marketplace. Al di là, però, di una formalizzazione di massima di questo modello, è ancora poco chiaro come questo scambio commerciale di dati dovrebbe avvenire in modo da garantire sia la sovranità e il controllo individuale sui dati consentendone allo stesso tempo la valorizzazione e l’utilizzo commerciale [^[5]]. Tale modello stenta ad emergere anche per la natura peculiare del “bene-dato”, che non può essere facilmente assimilato ad altri beni di consumo, date le sue particolari caratteristiche: “non hanno massa, possono essere usati e riutilizzati senza esaurimento (non rivali) a costi marginali molto bassi. I dati generati per un determinato scopo possono essere ridistribuiti in innumerevoli modi per rispondere a nuove domande, sviluppare conoscenza e generare intuizioni. Sono una risorsa di grande valore e un vero fattore di produzione economica”[^[6]].

Basandosi su queste caratteristiche fondamentali, la letteratura di riferimento ha recentemente tentato di definire ulteriori elementi per la commercializzazione dei dati. Di particolare interesse è la definizione c.d. STREAM, che dovrebbe guidare la commercializzazione dei dati. Per essere commerciabili i dati dovrebbero essere: Sovereign (ad esempio, la proprietà trasparente e il controllo dei dati da parte del titolare dei dati), Trusted (vale a dire i dati sono attendibili e verificabili), Reusable (vale a dire i dati sono utilizzabili in contesti diversi e per scopi diversi) , Exchangeable (ovvero i dati possono essere scambiati tra produttori di dati e consumatori, ad es. tramite mercati dedicati), Actionable (ovvero usabilità per decisioni attuabili da prendere da parte dell’utente finale) e Mesurable (cioè i dati dovrebbero essere misurabili sia in termini tecnici – per consentirne la gestione tecnica – sia in termini di prezzo)[5].

Economia dei dati: quanto valgono i dati

Quanto al data pricing, il tema è ancora relativamente poco esplorato in letteratura, ma alcuni elementi iniziano ad emergere da recenti pubblicazioni nel campo. Definire un prezzo per i dati è un passaggio fondamentale e per nulla banale. Ciò è particolarmente vero se si considera che non esiste una modalità standard di confrontare diversi tipi di dati, e anche laddove si trattasse di dati della stessa categoria (p.es., la posizione), due diverse voci di dati possono avere valore diverso. Le modalità attraverso cui i dati vengono raccolti, aggregati, archiviati o descritti attraverso i metadati, possono avere un profondo impatto in termini di usabilità, che si riflette inevitabilmente sul loro valore. Similmente, lo stesso dato avrà un valore se considerato singolarmente, e uno completamente diverso in forma aggregata, considerati gli aspetti di usabilità e utilità dei dati stessi.

Alcuni fattori specifici per la determinazione del prezzo dei dati sono stati esaminati in un recente documento [^[7]], portando all’identificazione di una serie di attributi che potrebbero fungere da criteri per il processo di determinazione del prezzo: parametri basati sul valore (valore dei dati per il consumatore, ad esempio il valore dei dati in termini di risparmio di tempo, sforzi o denaro, esclusività dei dati), parametri qualitativi (attributi o meta-attributi dei set di dati, ad esempio l’età dei dati, la loro credibilità, accuratezza, qualità, forma e struttura), parametri basati sui costi fissi e marginali (costi direttamente misurabili – ad esempio i costi per la raccolta, la conservazione, l’aggiornamento). Tale inquadramento multidimensionale del processo di stima del valore dei dati può aiutare a stabilire alcune regole di base per l’attribuzione sensata di un prezzo ai dati.

Sulla stessa scia, un recente rapporto di E&Y [^[8]] ha proposto due nuovi approcci per la quantificazione del valore dei dati: 1) Un approccio “dall’alto verso il basso” o basato sul mercato, che stima il valore di un insieme di dati in base al suo profilo e al prezzo di mercato osservato di asset di dati comparabili. Il prezzo di mercato è determinato dal confronto tra la disponibilità di un record e la disponibilità di asset di dati comparabili o di società con asset di dati analoghi. 2) Un approccio “dal basso verso l’alto” o basato sul reddito, che quantifica il valore in base al beneficio economico da generare dal set di dati selezionato.

Il caso dei dati sanitari

Anche il settore sanitario, come è noto, sta vivendo un periodo di data explosion. Rapporti recenti hanno indicato una nuova importante tendenza emergente, grazie all’adozione esponenziale di dispositivi mobili e indossabili, che ha portato a una crescita prevista del 300% dei dati sanitari tra il 2017 e il 2020 [^[9]]. Tale esplosione di dati è accompagnata anche da un crescente interesse dei cittadini nel controllo dei propri dati: nel solo 2017, “3,7 miliardi di app per smartphone relative alla salute sono state scaricate a livello globale, rispetto a 1,7 miliardi nel 2013”[6] .

D’altra parte, Ernst & Young [8] ha stimato che i dati detenuti solo dal NHS potrebbero avere un valore di circa 11,5 miliardi di euro all’anno attraverso risparmi operativi, migliori risultati per i pazienti e benefici per l’economia in generale. Lo stesso rapporto osserva che i campioni di DNA potrebbero valere 1.700 di euro a persona, mentre la combinazione con i dati fenotipici tra 1.700 e 5.800 euro per cartella-paziente.

In un tale contesto, le istituzioni sanitarie pubbliche si trovano nella situazione paradossale di essere sia ricche di dati che povere di informazioni, poiché l’immensa ricchezza di dati generati dagli operatori sanitari pubblici non viene utilizzata in maniera sufficientemente sistematica per ottimizzare il consumo di risorse o i percorsi terapeutici. Al contrario, la mancanza di un utilizzo sistematico dei dati porta a risultati scadenti per i pazienti (il 10% dei quali viene danneggiato inutilmente durante l’assistenza) e gli ospedali (che consumano fino al 15% delle loro risorse per far fronte a questi problemi)[6]. Allo stesso tempo, lo scarso utilizzo dei dati è un’enorme opportunità persa in termini di adeguata valutazione del rischio, gestione ottimale dei pazienti cronici, analisi delle prestazioni e riduzione dello spreco di risorse.

La capacità dei cittadini e dei pazienti di esercitare un controllo effettivo sui propri dati è pure essa ancora molto limitata. Secondo il più recente rapporto OCSE, sebbene il 70% dei paesi rispondenti abbia confermato che i cittadini possono accedere alla propria cartella clinica, di fatto solo il 43% di questi è stato effettivamente in grado di interagire direttamente con i propri dati. Altri sottolineano il fatto che la grande maggioranza degli ospedali non consente ai pazienti di accedere ai dati [6].

Se il settore pubblico arranca nell’implementare strategie solide di utilizzo dei dati, le grandi aziende riescono a ottenere accesso e controllo di sempre più dati sanitari, attraverso accordi diretti con operatori sanitari, fornitori di EHR e altri fornitori di sistemi sanitari, ponendo problemi in termini di privacy e rispetto dei diritti dei singoli pazienti. Uno degli esempi più lampanti è il recente caso Google, che con il suo progetto Nightingale è riuscita a raccogliere – attraverso un accordo con l’operatore sanitario Ascension – dati da centinaia di migliaia di pazienti senza avvisare né i pazienti né i medici. Si tratta certamente di un segnale allarmante della progressiva erosione della privacy e del controllo sui dati, guidata da quella che è stata giustamente chiamata una “corsa all’oro” dei dati sanitari [^[10]].

Il modello delle nuove cooperative di dati

Per arginare questi fenomeni e offrire ai cittadini e titolari dei dati maggiore controllo e potere negoziale in questo contesto, il modello delle cooperative di dati ha guadagnato sempre più attenzione all’interno del dibattito accademico negli ultimi anni, proponendosi come soluzione naturale per controbilanciare il potere dei giganti tecnologici, offrendo ai cittadini un modo per esercitare potere negoziale per l’uso di dati, così contrastando l’approccio predatorio attualmente messo in atto dalle grandi aziende tech e non solo. Il punto di partenza è il riconoscimento della situazione attuale, in cui “i dati personali vengono sfruttati senza che venga restituito un valore sufficiente all’individuo” [^[11]], e il riconoscimento della necessità di organizzare istituzioni collettive simili al sindacato, in grado di rappresentare i diritti dei dati delle persone [11].

Le cooperative di dati sono definite come la “raccolta collaborativa volontaria da parte di individui dei propri dati personali a beneficio dell’appartenenza al gruppo o alla comunità”^[12] . È interessante notare che, oltre alla necessità di controbilanciare il potere delle grandi aziende nel settore, una motivazione chiave per gli individui è quella di “condividere intuizioni comuni attraverso dati che sarebbero altrimenti isolati o inaccessibili”. Un recente white paper ha sostenuto che le cooperative di dati potrebbero diventare l’elemento fondamentale per giungere a un modello di controllo dei dati che superi il modello individualistico per andare verso un “sistema collettivo basato su diritti e responsabilità, con standard legali sostenuti da una nuova classe di rappresentanti che agiscono come fiduciari per i loro membri”[12].

Come accennato, una caratteristica chiave di una cooperativa di dati è la presenza di benefici per i membri. Questo non significa necessariamente monetizzazione diretta dei dati (magari sotto forma di dividendi), ma può ben riferirsi alla legittima aspettativa di acquisire vantaggi direttamente dall’aggregazione dei dati, in vista del miglioramento del benessere individuale e collettivo. L’assistenza sanitaria è un chiaro esempio del tipo di vantaggio che i membri potrebbero ottenere dalla condivisione dei dati. Non sorprende, pertanto, che le cooperative di dati siano state indicate come possibile soluzione proprio per migliorare la ricerca medica e gestire in modo equo i dati sanitari sensibili [^[13], ^[14]].

Le attitudini pubbliche verso la donazione e l’accesso ai dati personali

Questo genere di vantaggi indiretti dalla condivisione potrebbe corroborare un approccio alternativo alla commercializzazione e monetizzazione diretta dei dati, in un’ottica maggiormente in linea con le attitudini individuali, così come risultano da recenti analisi che hanno mostrato come esista nella popolazione una tendenza alla condivisione libera dei dati medici piuttosto che a una loro commercializzazione per scopi pecuniari.

Ad esempio, un recente studio [^[15]] condotto a Londra ha mostrato come il pubblico abbia un’opinione non uniforme sulla condivisione dei dati nel contesto sanitario. Mentre una parte della popolazione non è affatto interessata alla raccolta e all’uso delle proprie informazioni personali, un’altra parte sembra non essere disposta a fornire l’accesso anche se direttamente correlata al miglioramento del servizio, mentre la maggior parte della popolazione deciderebbe caso per caso.

Un’altra metanalisi pubblicata dalla Understanding Patient Data Association [^[16]], riassumendo il risultato di diversi studi dal 2015 in poi, mostra una volontà generale della popolazione di condividere le cartelle cliniche per la ricerca, ma non incondizionatamente: la credibilità dell’istituto di ricerca e la motivazione per l’accesso ai dati sono elementi cruciali per la concessione di accesso ai dati. È stata anche trovata una componente motivazionale altruistica, poiché appare come le persone sarebbero felici di fornire l’accesso alla propria cartella clinica per supportare la ricerca (in alcuni casi, anche svolta da soggetti privati), sebbene la trasparenza circa l’uso dei dati rimanga un requisito irrinunciabile. Inoltre, mentre la condivisione iniziale dei dati con i servizi sanitari nazionali per ottenere cure migliori è generalmente percepita come non problematica, l’eventuale successivo accesso da parte di terzi (aziende o centri di ricerca privati) sembra essere motivo di preoccupazione. In generale, è opinione comune che l’accesso ai dati e il successivo utilizzo debbano andare a vantaggio della società in generale, e in particolare dei pazienti. Seguendo la stessa logica, esiste l’aspettativa che l’uso commerciale dei dati dei pazienti (ad esempio, da parte di soggetti privati per lo sviluppo di nuovi prodotti e servizi) risulti in qualche tipo di vantaggio per il servizio sanitario nazionale (ad esempio, accesso a basso costo o gratuito alle nuove tecnologie) [^[17]].

Piattaforme di dati distribuite aperte gestite pubblicamente

Anche alla base di questi recenti studi sulle attitudini individuali, si potrebbe concludere questa breve disamina delle prospettive di creazione di una economia dei dati con l’analisi di un diverso modello fondato sulla creazione di piattaforme di dati distribuite aperte e gestite da enti pubblici in collaborazione con i cittadini, seguendo un approccio già esplorato da enti pubblici sanitari in Italia e all’estero. Tali piattaforme faciliterebbero e migliorerebbero l’accesso ai dati per le attività di ricerca (in particolare quelle finanziate con fondi pubblici), accelerando la ricerca clinica e il successivo trasferimento nella pratica clinica, garantendo che le più recenti soluzioni tecnologiche (in particolare algoritmi basati sull’IA per migliorare diagnosi, trattamento e autogestione delle malattie) siano messe a disposizione del pubblico a un prezzo accessibile, facilitando altresì la gestione dei dati. Tale approccio andrebbe sicuramente a beneficio della società nel suo complesso, offrendo una migliore gestione della salute della popolazione, una migliore gestione dei pazienti cronici, un maggiore controllo sulle epidemie e sulle pandemie (si pensi se una struttura dati simile fosse stata disponibile all’inizio dell’emergenza COVID-19). Infine, la regolamentazione dell’accesso ai dati sarebbe informata da principi di equità, trasparenza e interesse pubblico. Il coinvolgimento dei cittadini e delle organizzazioni dei cittadini sarebbe un importante elemento per la trasparenza e il controllo collettivo.

Molteplici sono le iniziative che vanno verso la creazione di marketplace di dati personali, e molte altre propongono invece soluzioni per facilitare il controllo individuale sui dati. Quali che siano le soluzioni che si andranno poi affermando sul mercato e nel mondo reale, sarà importante vigilare perché quella centralità del cittadino citata all’inizio, specialmente quando si tratta di condivisione di dati sanitari personali, venga garantita in ogni passaggio, senza per questo mortificare le spinte all’innovazione che in quegli stessi dati trovano il loro più importante propellente.

Note

[] IBM (2017), 10 Key Marketing Trends for 2017 and Ideas for Exceeding Customer Expectations, https://www-01.ibm.com/common/ssi/cqi-binissialias?htmlfid=WRL12345USEN (visitator ad agosto 2019). ↑
[] Si veda ad esempio: Communication From The Commission To The European Parliament, The Council, The European Economic And Social Committee And The Committee Of The Regions, Towards a thriving data-driven economy, luglio 2014. ↑
[] Hardjono, Thomas, David L. Shrier, and Alex Pentland, eds. Trusted Data. ↑
[] WEF, Personal Data – A new Asset Class. ↑
[] Demchenko, Y., Los, W., & de Laat, C. (2018). Data as economic goods: definitions, properties, challenges, enabling technologies for future data markets. ↑
[] OECD Report, Health in the 21st Century : Putting Data to Work for Stronger Health Systems, 2019. https://www.oecd-ilibrary.org/sites/e130fcc2-en/index.html?itemId=/content/component/e130fcc2-en ↑
[] Heckman, J. R., Boehmer, E. L., Peters, E. H., Davaloo, M., & Kurup, N. G. (2015). A pricing model for data markets. iConference 2015 Proceedings. ↑
[] Ernst&Young, Realising the value of health care data: a framework for the future, 2019 ↑
[] Future Agenda, The Future of Patient Data, Insight from multiple expert discussions around the world, 2018. ↑
[] I giganti della tecnologia non sono soli, poiché le società specializzate mobilitano e accedono regolarmente a enormi quantità di dati: ad esempio, IQVIA – la più grande organizzazione di ricerca a contratto al mondo – è in grado di fornire ai suoi clienti l’accesso a cartelle cliniche elettroniche, reclami assicurativi, immagini mediche e così via) provenienti da oltre 600 milioni di pazienti provenienti da 100 paesi. IBM ha acquisito Truven Health, ottenendo l’accesso immediato alle registrazioni di 200 milioni di pazienti, mentre Flat Iron (che è stato acquisito da Roche nel 2018) accede regolarmente ai dati medici di 200 tumori in tutta Europa [Rapporto OECD]. ↑
[] Hardjono, Thomas, and Alex Pentland. “Data Cooperatives: Towards a Foundation for Decentralized Personal Data Management.” arXiv preprint arXiv:1905.08819 (2019). ↑
[] Pentland, A., Hardjono, T., (MIT Connection Science), Penn, J., Colclough, C., (UNI Global Union), Ducharme, B., Mandel, L. ( MIT Federal Credit Union), Data Cooperatives: Digital Empowerment of Citizens and Workers, Whitepaper, MIT Connection Science. ↑
[] Hafen, Ernst. “Cooperative di dati personali: un nuovo quadro di governance dei dati per donazioni di dati e salute di precisione”. L’etica della donazione di dati medici. Springer, Cham, 2019. 141-149. ↑
[] Blasimme, A., E. Vayena e E. Hafen. “Democratizzare la ricerca sanitaria attraverso le cooperative di dati”. Filosofia e tecnologia 31.3 (2018): 473-479. ↑
[] CurvedThinking & Understanding Patient data, Understanding public expectations of the use of health and care data, Report commissionato da OneLondon, luglio 2019. ↑
[] Summary of the report Public attitudes to patient data use ↑
[] The Academy Of Medical Science, Our data-driven future in healthcare – People and partnerships at the heart of health related technologies, novembre 2018.