News

Il Virtual Research Environment di FOSSR: luogo di ricerca aperta, collaborativa, riproducibile

VRE

 

Un’idea che nasce da lontano

In principio erano i collaboratories – fusione di collaboration e laboratory – un concetto formalizzato nel 1993 da William Wulf [1] per descrivere “centri senza muri”, in cui ricercatori situati in luoghi diversi potessero lavorare insieme, condividendo dati, strumenti e risultati a distanza. Un’intuizione che anticipava molte delle caratteristiche oggi proprie dei moderni Virtual Research Environments (VREs). In questo percorso evolutivo, il CNR – e in particolare l’Istituto di Scienza e Tecnologie dell’Informazione “Alessandro Faedo” (ISTI) di Pisa – ha avuto un ruolo pionieristico, partecipando attivamente allo sviluppo di ambienti digitali avanzati per la ricerca collaborativa [2]. Oggi questa visione trova una concreta applicazione nel progetto FOSSR, che, seguendo la strada già intrapresa con profitto da altri progetti e infrastrutture di ricerca, mette a disposizione della comunità scientifica un VRE pensato per favorire apertura, condivisione e riproducibilità della ricerca nelle scienze sociali.

Che cos’è un VRE

Ma cos’è esattamente un VRE? Ce lo spiega Biagio Peccerillo (CNR-ISTI): «Un VRE è un ambiente digitale integrato, che raccoglie tutta una serie di servizi utili ai ricercatori nello svolgimento delle loro attività. I componenti chiave sono innanzitutto un workspace, cioè uno spazio remoto e condiviso per archiviare file e prodotti della ricerca; risorse computazionali per condurre esperimenti in modo riproducibile, tramite ambienti come Jupyter Lab e RStudio; una componente social, che funziona come un social network privato e facilita la comunicazione e il coordinamento dei progetti; e infine un catalogo, che consente di pubblicare articoli, dataset, algoritmi e altri artefatti della ricerca così da favorirne accesso e riuso».

Più di un cloud: un ambiente integrato per la ricerca

A prima vista, un VRE (Virtual Research Environment) può sembrare una piattaforma online per lavorare, in modo collaborativo, a distanza. In realtà, il suo ruolo è molto più ampio: è uno spazio digitale co-creato e sviluppato dai propri utenti che accompagna lo specifico team di ricercatori in tutte le fasi del loro lavoro, dalla condivisione delle idee fino alla produzione e alla diffusione dei risultati.

All’interno di un VRE non ci si limita a scambiare file, ma si costruisce un ambiente collaborativo in cui dati, strumenti e attività sono condivisi e collegati tra loro. «Ad esempio, un ricercatore può condividere in modo aperto l’implementazione di un workflow scientifico associandolo a un articolo che lo descrive e che riferisce risultati ottenuti con specifici dataset e configurazioni. I colleghi possono replicare lo studio agevolmente senza occuparsi delle problematiche computazionali, condividere commenti e altri risultati ottenuti applicando lo stesso workflow a dati diversi o una versione rivista del workflow agli stessi dati campione del primo studio. La piattaforma non solo permette di verificare o riprodurre uno studio, rendendo la ricerca più trasparente e affidabile, ma di rendere il processo di produzione scientifica più efficiente favorendo il riuso e la condivisione delle varie componenti, come datasets, codici, osservazioni e idee».

In sintesi, un VRE non è solo uno strumento di collaborazione, ma un vero e proprio ecosistema digitale che facilita il lavoro di ricerca, migliora la condivisione delle conoscenze e favorisce nuove forme di collaborazione.

L’infrastruttura che sostiene il VRE di FOSSR

Dal punto di vista tecnologico, i VRE sono applicazioni web distribuite, ospitate su data-center ad alte prestazioni. Il VRE sviluppato nell’ambito di FOSSR si appoggia all’infrastruttura D4Science, gestita dal CNR [3]. Il nodo principale di D4Science è l’ISTI di Pisa, ma complessivamente l’infrastruttura è distribuita su cinque siti geografici: il data-center D4Science di Pisa, tre sedi della rete GARR e una su Google Cloud Platform. Questa architettura consente di mettere a disposizione risorse computazionali significative: 11.700 core CPU, 82 TB di RAM e 1.720 TB di storage. Attualmente, diverse comunità scientifiche – in settori che spaziano dall’agricoltura alle scienze sociali – utilizzano i VRE di D4Science per condurre progetti innovativi, dimostrando come la condivisione dei dati possa accelerare il progresso scientifico. Per FOSSR, questa base tecnologica è fondamentale: il progetto non si limita infatti a offrire uno spazio digitale, ma punta a costruire un ecosistema in cui dati, strumenti e metodi possano essere condivisi in modo strutturato e duraturo.

Gli obiettivi del VRE FOSSR

Il VRE di FOSSR nasce con ambizioni precise: rafforzare la cultura della scienza aperta e rendere più semplice il riuso dei risultati scientifici. «L’obiettivo – spiega Peccerillo – è incoraggiare i ricercatori a rendere pubblici dataset, algoritmi ed esperimenti, aumentando accessibilità e riproducibilità della ricerca nelle scienze sociali». Il sistema punta anche a creare un patrimonio condiviso di risorse da cui nuovi ricercatori possano partire, migliorando quanto già esiste o applicandolo a nuovi contesti. «Si innesca così un ciclo virtuoso di condivisione: si abbassa la barriera d’ingresso per chi arriva, diventa più semplice comprendere lo stato dell’arte e si migliora la riproducibilità, che spesso oggi è limitata dalla mancanza di accesso agli algoritmi o ai dataset associati alle pubblicazioni scientifiche». La condivisione, inoltre, produce un effetto diretto sull’impatto della ricerca: «Rendere disponibili dati e strumenti significa aumentare uso, diffusione e citabilità dei risultati, con benefici per tutta la comunità scientifica». [4]

[1] Wulf (1993), “The Collaboratory Opportunity” DOI: 10.1126/science.8346438

[2] Candela, Castelli, Pagano (2013), “Virtual research environments: an overview and a research agenda” DOI: 10.2481/dsj.grdi-013

[3] Assante, et al. (2019) “Enacting open science by D4Science” DOI: 10.1016/j.future.2019.05.063

[4] Assante et al. (2023) “Virtual research environments co-creation: The D4Science experience” DOI:10.1002/cpe.6925