Esiste una correlazione quasi naturale fra le tecnologie dell’Internet of things (IoT) e dei big data. Le prime, infatti, sono produttrici di grandi quantità di dati grezzi, le seconde forniscono gli strumenti per filtrare, ordinare e analizzare questi dati ed estrarne valore. La convergenza di IoT e big data costituisce quindi un potente strumento che può essere messo a disposizione delle aziende per svariati scopi. Ad esempio, nelle smart city, dove i dati raccolti da sensori distribuiti sul territorio costituiscono un prezioso patrimonio dal quale si possono estrarre informazioni di ogni genere, dal traffico all’utilizzo dei parcheggi. La convergenza fra IoT e Big data è ovviamente parte integrante di industria 4.0: gli oggetti connessi installati nelle fabbriche inviano i dati relativi all’ambiente che li circonda e al loro stesso funzionamento, consentendo una serie di possibilità, che vanno dal monitoraggio dei lavoratori al controllo stesso delle macchine.
Cosa sono i big data IoT?
Uno dei pilastri su cui si basa il paradigma di industria 4.0 è, quindi, la convergenza fra IoT e big data, che forma quella che viene definita Cyber-Physical Convergence, concetto che nasce dai Cyber-Physical Production Systems (CPPS). In sostanza, si tratta di una convergenza fra il mondo cyber (ovvero i sistemi ICT) e quello fisico, che si realizza tramite un continuo scambio di dati.
IoT e big data danno vita così a un processo circolare continuo, che si può raffigurare in tre fasi:
- produzione dei dati (da parte di macchine e oggetti connessi)
- analisi dei dati (attraverso strumenti di big data analytics)
- nuova configurazione dei processi produttivi e manutenzione.
I vantaggi dei big data IoT per le aziende
Vi sono differenti ambiti ai quali si può applicare il processo circolare continuo generato dalla convergenza fra IoT e big data, in un crescendo che va dal singolo processo produttivo fino a coinvolgere non solo l’azienda produttrice ma anche i suoi clienti (in ottica servitization ad esempio). Applicato a un processo produttivo, consente di monitorarlo per migliorarlo e adattarlo al mutare delle condizioni esterne. Oppure, il processo può essere adottato da diversi reparti della stessa azienda, al fine di ottenere la migliore integrazione e migliorare i risultati dell’intera azienda. Se, come già anticipato, la convergenza IoT big data e il processo circolare continuo vengono estesi anche ai clienti dell’azienda che adotta tali tecnologie, le informazioni inviate dai prodotti forniscono indicazioni preziose sul loro funzionamento e sulla necessità di manutenzione.
A tale riguardo va sottolineato come la convergenza IoT – big data consente la manutenzione predittiva, ovvero permette di intervenire su macchine e dispositivi prima che questi presentino difetti di funzionamento o interruzioni, sia che si trovino all’interno della fabbrica, sia che siano installati presso il cliente.
Infine, l’interconnessione fra oggetti, dispositivi e macchinari, oltre a ottenere da questi le informazioni, presenta il vantaggio di poterli controllare o configurare da remoto. Una possibilità che può rivelarsi di estrema utilità quando l’oggetto da monitorare, comandare o programmare si trovi in un luogo impervio da raggiungere o sia inserito in un contesto pericoloso o ostile per il lavoratore.
Quali tipi di dati vengono raccolti dai dispositivi IoT?
Grazie alla sempre maggiore miniaturizzazione dei sensori e dei circuiti per le comunicazioni wireless, attualmente è possibile inserire in quasi ogni oggetto un dispositivo atto a raccogliere le informazioni relative all’ambiente e a trasmetterle in rete.
Questi dispositivi sono definiti “sistemi embedded”. A questo si aggiunge la disponibilità di molteplici reti wireless per la connessione di oggetti e macchine. I dati che i dispositivi IoT generano sono differenti a seconda del tipo di oggetto o macchina presi in considerazione. Possono essere:
- dati rilevati da sensori riguardanti l’ambiente esterno (temperatura, umidità, presenza di fumo, agenti inquinanti o sostanze pericolose, ecc.);
- dati relativi al monitoraggio dei lavoratori (presenza in un’area determinata, rispetto degli obblighi in materia di dispositivi di protezione individuale, rispetto delle norme di sicurezza, ecc.)
- dati relativi al proprio funzionamento (utilizzabili dal sistema per effettuare diagnosi in tempo reale e predire le attività di manutenzione)
- dati relativi a informazioni di vario genere, che vengono rilevate e poi processate da sistemi di big data analytics (ad es. smart city, smart mobility, ecc.)
- dati provenienti da dispositivi indossabili (wearable) relativi a parametri vitali della persona, utilizzabili nell’ambito della telemedicina o dello svolgimento di pratiche sportive.
Come vengono elaborati i dati Iot?
I dati rilevati e trasmessi dai dispositivi IoT, per poter essere utilizzabili e costituire un valore devono essere elaborati attraverso programmi di big data analytics. Ecco una lista dei principali:
- Hadoop: framework open di riferimento per la programmazione di sistemi di analisi su big data
- Hive: utilizzabile su sistemi distribuiti compatibili con Hadoop
- HBase e Cassandra: utilizzabili per la gestione di big data su sistemi distribuiti aventi prestazioni elevate
- Spark: tecnologia di riferimento per la programmazione di sistemi paralleli per l’analisi di dati su larga scala.
Tipi di analisi utilizzate sui dati IoT
Esistono diversi modi per archiviare i dati generati dai dispositivi IoT, anche ai fini della loro analisi: on premises (in loco), in cloud o ibridando le due opzioni.
La scelta fra le varie possibilità dipende dal volume dei dati, ma anche dal tipo di connettività, oltre che da altri fattori (ad es. quando esistano problemi di alimentazione dei dispositivi).
Un altro elemento di discrimine è lo scopo cui sono destinati i dati: fa differenza, infatti, se questi sono raccolti a scopo di archiviazione oppure per effettuare l’analisi in tempo reale. In alternativa, l’analisi può essere eseguita in batch.
Esaminiamo alcune metodologie di big data analytics.
- analisi distribuite: sono idonee ad analizzare dati su larga scala. I dati possono essere distribuiti su più database. Per l’elaborazione in batch si possono utilizzare software Hadoop e Spark.
- analisi in tempo reale: servono ad analizzare flussi di dati IoT dipendenti dal fattore tempo. In questo caso, per via della latenza, si esclude l’elaborazione batch.
- edge analytics: metodo di analisi a bassa latenza. Serve a pre-analizzare i dati allo scopo di filtrare eventuali duplicazioni e per riordinare e aggregare i dati prima dell’analisi vera e propria. Questa elaborazione avviene generalmente nel punto di acquisizione dai dati, ossia sui dispositivi IoT stessi o sui gateway, da cui il termine “edge” (margine).
- ibrido: è considerato l’approccio più comune; prevede la pre-analisi edge, prima dell’invio del flusso dei dati al data center in cloud.
- analisi descrittive: ricavano dai big data una sorta di “quadro della situazione”, visualizzabile tramite report e dashboard grafici.
- analisi diagnostiche: forniscono informazioni sulle cause che hanno generato una determinata situazione. L’analisi diagnostica abilita l’analisi predittiva.
- analisi predittiva: permettono di prevedere, appunto, malfunzionamenti o fermi di macchinari e impianti e permettere interventi di manutenzione preventiva.
- analisi prescrittiva: va al di là delle previsioni e a fronte di un problema suggerisce, ed eventualmente mette in atto, le contromisure.
Quali tecnologie vengono sfruttate per i big data IoT?
Alla base della convergenza fra IoT, ovvero oggetti connessi, e big data vi sono le tecnologie di comunicazione wireless, senza le quali non sarebbe possibile lo scambio dei dati, le interfacce hw/sw e i sensori. Ecco un elenco dei principali utilizzati:
Tecnologie hw/sw
- Arduino
Sistema italiano, nato nel 2005, formato da componenti hardware e da software open source. Consente di utilizzare oggetti interattivi e autonomi e interagire con essi in modo semplice tramite applicazioni.
- Raspberry PI
Sistema maggiormente evoluto rispetto ad Arduino, nato nel 2012, dove PI sta per “Python interpreter”, l’interprete integrato per il linguaggio di programmazione Python. Rispetto ad Arduino, i dispositivi Rasberry dispongono di un processore con prestazioni più elevate, una propria RAM e di diverse opzioni per l’uscita video. Funzionano perciò autonomamente, eseguendo applicazioni.
- Libelium
Uno dei principali produttori di sensori e dispositivi IoT fisici, compatibili con standard Lorawan, Sigfox e Zigbee
Tecnologie wireless
Sono soprattutto le tecnologie Low Power Wide Area (LPWA) a consentire l’IoT. Ecco un elenco:
Zigbee
Standard di comunicazione wireless, basato su specifica IEEE 802.15.4, sostenuto dalla ZigBee Alliance. Funziona tramite piccole antenne digitali, a bassa potenza e basso consumo, e permette di creare una Wireless personal area network (WPAN).
- Bluetooth Low Energy
Conosciuto anche come BLE, è una tecnologia WPAN. Rispetto al normale Bluetooth, il Bluetooth Low Energy ha un consumo energetico e costi ridotti, pur mantenendo caratteristiche simili.
- Sigfox
Operatore di rete che propone una soluzione per IoT e le applicazioni M2M a bassa capacità effettiva di trasmissione. Permette di connettere dispositivi utilizzando la tecnologia Ultra Narrow Band (UNB) e utilizza le bande senza licenza (ISM).
- Lora
Acronimo di Long Range. Una tecnica di modulazione di trasmissioni RF inventata nel 2009 dalla Cycleo e adottata dalla IEEE con lo standard 802.15.4 per le reti LR-WPAN.
- Cellular-IoT
Si tratta di un mezzo di connessione a internet per oggetti fisici. Presenta il vantaggio di una infrastruttura semplice e di utilizzare la rete 5G.
Strategie per utilizzare i big data IoT
I big data forniti dall’IoT possono essere utilizzati per migliorare processi di varia natura. In ambito industriale, l’analisi dei dati permette di configurare i parametri dei macchinari per ottimizzare la produzione e il controllo qualità, per la programmazione di eventuali interventi di manutenzione e per anticipare l’insorgenza di guasti (manutenzione preventiva e predittiva). Inoltre, per la sicurezza sul lavoro, con il monitoraggio della posizione e degli spostamenti dei lavoratori all’interno dell’ambiente. L’edge computing abilita quella che viene definita smart manufacturing.
L’analisi dei dati risulta di grande utilità anche nel settore della sostenibilità ambientale. In funzione energy management, consente l’acquisizione continua e l’analisi dei dati per il monitoraggio dei consumi energetici; in funzione energy prediction può valutare quanta energia verrà consumata per la produzione, avvalendosi di algoritmi di intelligenza artificiale.