In che modo si può trasformare un’infrastruttura cloud in una piattaforma integrata di condivisione della conoscenza? Questa la domanda di partenza dell’online seminar FOSSR tenuto da Mario Ciampi (CNR ICAR) e Sara Zuppiroli (CNR ISTC), lo scorso 29 aprile.
Per il video integrale: https://l.cnr.it/fossr-third-online-seminar-video
Per consultare i materiali: https://l.cnr.it/fossr-third-online-seminar-presentations
Il seminario, moderato da Daniela Luzi (CNR IRPPS) con la curatela di Claudia Pennacchiotti (CNR IRPPS), è stato arricchito dai contributi di Mario Sicuranza (CNR ICAR), Sonia Stefanizzi (Università degli Studi di Milano-Bicocca), Miguel Ceriani (CNR ISTC), Lottie Provost (CNR ILC), Fabrizio Marangio (CNR ICAR), Filippo Accordino (CNR IRPPS) e Giorgia Lodi (CNR ISTC), e ha offerto una vasta gamma di riflessioni sul tema dell’interoperabilità dei dati.
Come ricordato in apertura da Mario Ciampi – Primo Tecnologo all’Istituto di Calcolo e Reti ad Alte Prestazioni (ICAR) del CNR – la mission di FOSSR è quella di “realizzare, entro il 2025, un’infrastruttura di ricerca basata sull’Open Science Cloud, che metta a disposizione, di ricercatori e decision maker, open data di alta qualità, nuovi strumenti di analisi e servizi innovativi nell’ambito della ricerca nelle scienze sociali”. Per raggiungere quest’obiettivo, ha quindi proseguito Ciampi, “stiamo lavorando a un’architettura di rete che utilizzi sistemi interoperabili, per gestire risorse e modelli di dati unificati”. Punto di partenza alcune importanti infrastrutture preesistenti a livello nazionale ed europeo, ovvero CESSDA, RISIS, SHARE. Ma, oltre ai dati provenienti da queste in infrastrutture “FOSSR sta quindi sviluppando dei servizi aggiuntivi, primi tra i quali i panel ORP e IOPP, che permetteranno di avere nuovi dati da mettere a disposizione dei ricercatori”.
L’architettura di ricerca in costruzione, ha quindi spiegato Mario Ciampi, è composta da quattro livelli: “al livello più basso abbiamo una rete di data center, tutti CNR, in fase di potenziamento; al secondo livello abbiamo la piattaforma di cloud computing, che permetterà di realizzare l’open cloud; quindi abbiamo un livello fondamentale di gestione dei dati, che permetterà di garantire un’uniformità di rappresentazione e di accesso a tutti i dati della piattaforma; infine abbiamo i servizi applicativi, che permetteranno di garantire il processing dei dati stessi e di fornire servizi di vario genere agli utenti interessati”.
Dopo la presentazione dei quattro nodi della rete di data center FOSSR (“due nodi di primo livello a Napoli e Palermo e altri due di secondo livello a Torino e Catania”) e quella del cluster del Virtual Research Environment di Pisa (“ambiente virtuale dove i ricercatori potranno condividere risultati, dataset e idee”), Ciampi ha concluso ricordando che la connettività dell’infrastruttura FOSSR si appoggerà alla connettività della rete GARR (Gestione Ampliamento Rete Ricerca, la rete italiana a banda ultralarga dedicata alla comunità dell’istruzione, della ricerca e della cultura) e che l’obiettivo è quello di “mettere a disposizione memoria di archiviazione ma anche funzionalità di calcolo ad alte prestazioni, per ospitare servizi di AI e Deep Learning”.
Si è quindi discusso di accessibilità e interoperabilità, entrando nel dettaglio del modello di servizi cloud basato su IaaS (Infrastructure as a Service), delle soluzioni tecniche di autenticazione, autorizzazione e logging, dei criteri di metadatazione e degli strumenti di anonimizzazione che verranno utilizzati.
Sara Zuppiroli, tecnologa presso L’ Istituto di Scienze e Tecnologie della Cognizione del CNR di Pisa, ha quindi affrontato il tema degli Linked Open Data, che costituiscono una vera e propria sfida quando si intende collegare e integrare dati che provengono da fonti informative diverse.
“Dati che vengono da gruppi di ricerca diversi utilizzano vocabolari diversi – ha sottolineato Zuppiroli -, quindi, per far sì che possano essere effettivamente connessi e collegati, sarà necessario che vengano resi omogenei e che vengano riportati a degli standard condivisi”.
Si è quindi entrati nel dettaglio dei formati (“dovremmo trasformare tutti i dati in formato RDF attraverso un linguaggio dichiarativo, l’RML”), delle ontologie (“che ci permetteranno di creare delle nuove interconnessioni tra i dati stessi”) degli standard e dei protocolli (“lo standard Linked Open Data ci permetterà di interrogare i dati attraverso il protocollo SPARQL, ottenendo un alto valore aggiunto in termini di accessibilità”), anche grazie al vivace contributo dei panellisti presenti, che hanno proposto molti spunti di riflessione sul modello di metadatazione unificato, sui KPI (Key Performance Indicator) individuati per valutare l’impatto di FOSSR e sulla sfide relative alla privacy dei dati oggetto di ricerca.
Per restare aggiornati su tutti gli eventi FOSSR: https://link.cnr.it/fossr-mailing-list