Gestire l'enorme "mercato" dei dati. Intervista a Diego Calvanese (UniBz) sul progetto europeo CyclOps
Innovazione. La strategia europea per i dati ha recentemente delineato l’obiettivo di creare un mercato unico per i dati, che garantisca la competitività globale dell’Europa e il rispetto delle normative sulla loro gestione. Questa decisione ha portato allo sviluppo dei cosiddetti CEDS – Common European Data Spaces, ossia un insieme di spazi digitali destinati a crescere nel tempo e dedicati a varie tematiche tra cui la salute, la mobilità, l’agricoltura e il patrimonio culturale. Tuttavia, affinché questi “Data Spaces” possano contribuire ad uno scambio equo di informazioni in un’economia basata sui dati, c’è bisogno di tecnologie adatte alla loro gestione, sia all’interno delle organizzazioni pubbliche che di quelle private.
Il progetto CyclOps si inserisce proprio in questo contesto, fornendo una gestione automatica e affidabile dell’intero ciclo di vita dei dati, così da condividere ed utilizzare in maniera intelligente le informazioni contenute all’interno dei Data Spaces. Finanziato dal programma Horizon Europe e affiancato da tre partner altoatesini – più precisamente la Libera Università di Bolzano, l’Istituto di Earth Observation di Eurac Research e Ontopic, primo spinoff di UniBz – CyclOps interviene quindi su grandi quantità di dati generati da fonti eterogenee e distribuite. Abbiamo intervistato il prof. Diego Calvanese, a capo del gruppo di ricerca dell’Università di Bolzano, per indagare sull’obiettivo e sulle possibili applicazioni del progetto, ma anche sul ruolo della condivisione dei dati nella società odierna.
Può spiegare cosa sono esattamente i CEDS (Common European Data Spaces) e per quale motivo la strategia europea per i dati ha voluto investire sul loro sviluppo?
Precisamente, i CEDS sono degli ecosistemi giuridici e organizzativi in cui le informazioni possono fluire ed essere condivise in modo efficiente e sicuro. Il recente sviluppo e soprattutto la diffusione di strumenti di intelligenza artificiale hanno sottolineato l’importanza della presenza di questi Data Spaces, all’interno dei quali i dati provenienti da sorgenti di natura diversa vengono ripuliti, organizzati e presentati in una forma più semplice ed uniforme. In questo modo, le informazioni risultano facilmente accessibili e pronte per essere elaborate dagli algoritmi di intelligenza artificiale. Questo permette di estrarre dai dati nuova conoscenza utile per organizzazioni sia pubbliche che private, che possono quindi aumentare la loro competitività.
Qual è dunque l’obiettivo di CyclOps?
L’obiettivo principale di CyclOps è quello di soddisfare le esigenze delle imprese e della comunità scientifica per quanto riguarda la necessità di gestire l’intero ciclo di vita dei dati, favorendo lo sviluppo di nuovi servizi ad alto valore aggiunto. Nello specifico, si tratta dunque di rendere i dati reperibili, accessibili ed interoperabili attraverso una serie di processi specifici.
Da dove invece il nome?
Il termine CyclOps è semplicemente un acronimo che unisce le parole “cycle”, ossia ciclo, in riferimento al ciclo di vita dei dati, e “ops”, che sta per “operations”, ad indicare tutte le operazioni eseguite sui dati per trasformarli. Inoltre, l’acronimo in sé richiama la figura del ciclope, che attraverso il suo occhio scruta e analizza le informazioni.
Il progetto adotta una struttura a più livelli, ciascuno dei quali dedicato ad automatizzare le diverse fasi del ciclo di vita dei dati. Quali sono e che funzione hanno esattamente?
Il primo livello, chiamato “DataOps”, ha il compito di garantire la qualità dei dati in ingresso; il secondo, soprannominato invece “AIOps”, si occupa di fornire un repertorio decentralizzato di algoritmi di Intelligenza Artificiale. Il livello successivo, infine, mira a supportare e semplificare il più possibile l’analisi dei dati, attraverso una serie di interfacce intelligenti che permettano di visualizzarli e utilizzarli in modo semplice ed efficace. Il tutto sarà poi supervisionato dal cosiddetto “Smart Data Governance and Trust”, un livello semantico trasversale con il compito di orchestrare le componenti dell’intero sistema e garantire la conformità del trattamento dei dati alle normative dell’UE, tra cui anche il recente Artificial Intelligence Act. Tuttavia, questa struttura è ancora in fase di elaborazione, perciò nulla di definitivo.
Tra queste normative è incluso anche il Green Deal?
Assolutamente sì, e siamo proprio noi partner altoatesini ad occuparcene. Più precisamente, il Green Deal, insieme al turismo, agli appalti pubblici e alla produzione industriale, è uno dei quattro casi studio su cui si concentra CyclOps.
Quindi i partner altoatesini si concentrano prevalentemente su dati ambientali. Da dove questa scelta e di che tipo di dati si tratta?
Fin dall’inizio, quando mi sono messo in contatto con le altre realtà europee prendenti parte al progetto, ho capito che UniBz poteva partecipare al progetto come partner che sviluppa soluzioni tecnologiche innovative, ma da sola non avrebbe potuto contribuire in modo sostanziale ai casi di studio, che pure giocano un ruolo importante in un progetto come CyclOps. Dal momento che Eurac può vantare anni di esperienza di ricerca in ambito ambientale ed è specializzata nell’elaborazione di dati satellitari e nell’analisi di rischio climatico, mi è subito sembrata una buona idea coinvolgerli nel progetto. Questo ha permesso di unire le loro ricerche con le conoscenze informatiche del team di UniBz e le tecnologie avanzate sviluppate da Ontopic.
Come funziona raccolta di questo tipo di dati?
Nello specifico, i dati di interesse vengono raccolti sia attraverso rilevazioni satellitari, sia tramite sensori ambientali. Essi includono, ad esempio, informazioni climatiche, ma anche indicatori come la concentrazione di polveri sottili e particolato nell’aria e indicatori chimico-fisici che rivelano lo stato di salute delle acque superficiali (fiumi, laghi, acque potabili). Essi sono fondamentali per gli enti locali nel momento in cui questi devono mitigare gli effetti del cambiamento climatico o pianificare interventi di protezione civile.
Infine, qual è il potenziale dei Data Spaces e che ruolo gioca la condivisione dei dati nel nostro futuro?
L’idea di base è quella di garantire che il controllo dei dati rimanga nelle mani di chi li genera e li fornisce, affinché possa a sua volta condividerli con altri soggetti o altre realtà per fini comuni o anche pubblici. È chiaro, quindi, che ci siano degli aspetti sia legali che commerciali da tenere in considerazione. Tuttavia, promuovendo standard armonizzati e una maggiore trasparenza, il potenziale dei Data Spaces può sicuramente essere sfruttato al massimo. Un esempio positivo di Data Space europeo è quello inerente alla sanità, attualmente in discussione, dove i dati dei pazienti sono condivisi in modo sicuro e protetto tra ospedali, ricercatori e assicurazioni sanitarie per migliorare i trattamenti e accelerare la ricerca medica.
Vittoria Battaiola