Obiettivi del corso
L’obiettivo principale di questo corso è fornire una panoramica delle opportunità di sfruttamento dei dati condivisi all’interno delle Infrastrutture di Ricerca.
In particolare, il corso mira a sensibilizzare su queste opportunità e a incoraggiare l’implementazione di approcci data-driven attraverso l’applicazione di tecniche statistiche avanzate.
L’attenzione si concentra principalmente sull’infrastruttura europea RISIS, che raccoglie dati relativi a Scienza, Tecnologia e Innovazione ed è una delle tre infrastrutture che hanno dato il via al progetto FOSSR, e su alcune tecniche statistiche avanzate che FOSSR sta trattando nei suoi work package di ricerca.
Prendendo spunto dai dati disponibili all’interno di RISIS, il corso esplorerà in modo approfondito gli aspetti di accesso, interoperabilità ed elaborazione dei dati. Dall’esplorazione dei dati all’elaborazione degli stessi, il processo sarà avvalorato dall’applicazione esemplare di tecniche statistiche avanzate, in particolare la Network Science e la Modellizzazione Bayesiana, che saranno trattate in teoria e in pratica.
Al termine di questo corso, i discenti saranno consapevoli delle opportunità legate alle RI in SSH, in particolare all’infrastruttura RISIS, e acquisiranno una conoscenza approfondita delle tecniche sviluppate nell’ambito della ricerca FOSSR.
Descrizione del corso
Il corso guiderà i partecipanti attraverso il processo di coinvolgimento in una Infrastruttura di Ricerca e di utilizzo ragionato delle sue risorse a fini di ricerca. Inoltre, presenterà l’applicazione di tecniche statistiche avanzate sui dati delle infrastrutture, in particolare i modelli di network e la modellizzazione bayesiana.
Da un punto di vista organizzativo, il corso sarà strutturato in quattro moduli di formazione on-line, ognuno dei quali costruito su lezioni frontali e diverse interazioni.
In particolare:
Modulo 1. Infrastrutture di ricerca e scienza aperta
Il modulo delinea i contorni del nuovo paradigma di produzione della conoscenza scientifica, enfatizzando l’apertura, il valore della collaborazione e la disponibilità dei dati. Esplorerà le caratteristiche della scienza ad alta intensità di dati, che sono alla base della creazione e del rafforzamento delle Infrastrutture di Ricerca (RI). Le caratteristiche di queste piattaforme sociotecniche saranno discusse analizzando il contesto italiano ed europeo, con riferimento agli sforzi di FOSSR nello sviluppo dell’Open Cloud italiano per le scienze sociali.
Modulo 2. Accesso e interrogazione dei dati interoperabili delle RI
Il modulo presenterà esempi di accesso e interrogazione dei dati delle infrastrutture di ricerca, evidenziando l’importanza dell’interoperabilità dei dati. Casi specifici illustreranno l’uso dell’infrastruttura RISIS per gli studi su scienza, tecnologia e innovazione. Verranno presentati casi in cui le domande di ricerca vengono affrontate in modo diverso a seconda della natura dei dati, analizzando le modalità di gestione dei dataset e il loro arricchimento con dati esterni all’infrastruttura. I contenuti presentati evidenzieranno il valore dell’accesso condiviso ai database.
Modulo 3. Modelli di network applicati ai dati di RI
Il modulo si propone di illustrare i concetti di base e le misure statistiche della scienza delle reti e di fornire una panoramica dei principali modelli statistici di network. Il modulo si concluderà con due applicazioni in cui le reti vengono analizzate utilizzando i dati delle infrastrutture di ricerca. Le due applicazioni che verranno trattate in questo modulo sono:
- Applicazione 1: Reti complesse e finanziamento di progetti accademici;
- Applicazione 2: Collaborazioni di ricerca e produttività della ricerca.
Modulo 4. Network bayesiani causali applicati ai dati di RI
Il modulo si concentra sulle reti bayesiane come strumento per modellizzare relazioni causali complesse. Viene effettuato un confronto tra i network causali bayesiani e i potenziali outcome per evidenziare come i due approcci possano essere implementati in modo sinergico. Il modulo includerà due applicazioni che impiegano le reti causali bayesiane su dati di infrastrutture di ricerca. Le due applicazioni trattate in questo modulo sono:
- Applicazione 1: Collaborazioni di ricerca e produttività della ricerca;
- Applicazione 2: Lavoro a distanza e ricavi dell’impresa durante il Covid.
I formatori
Il corso è a cura di Andrea Orazio Spinello.
Andrea Orazio Spinello, ricercatore presso il CNR-IRCrES, si occupa di finanziamenti pubblici per la R&S e di organizzazione individuale del lavoro scientifico. È WP Leader nel progetto PNRR – FOSSR ed è tra i gestori del dataset EFIL, un nodo dell’infrastruttura europea RISIS per gli studi sulla ricerca e l’innovazione.
Emanuela Varinetti, ricercatrice presso il CNR-IRCrES, si occupa di raccolta dati, documentazione e attività di preparazione per l’accesso aperto alle banche dati di ricerca su scienza, tecnologia e innovazione. Attualmente è impegnata nell’aggiornamento del dataset EFIL, parte dell’infrastruttura europea RISIS per gli studi su ricerca e innovazione.
Lucio Morettini, ricercatore presso il CNR-IRCrES, si occupa di politica dell’istruzione superiore, valutazione della ricerca e valutazione dell’impatto, effetti della progettazione universitaria sul mercato del lavoro, dinamiche di carriera dei lavoratori altamente qualificati e analisi dell’impatto del capitale umano sull’innovazione delle imprese.
Antonio Zinilli, ricercatore presso il CNR-IRCrES, si occupa di Network Science, processi dinamici sui sistemi di conoscenza e innovazione e Text Mining. È coordinatore della Scuola IRCrES in “Data Science: strumenti e metodi per l’analisi di sistemi complessi di Scienza, Tecnologia e Innovazione (STI)”. È WP Leader nel progetto PNRR – FOSSR ed è tra i gestori del dataset EFIL, parte dell’infrastruttura europea RISIS per gli studi su ricerca e innovazione.
Lorenzo Giammei, ricercatore presso il CNR-IRCrES. I suoi studi si concentrano sull’inferenza causale, applicando approcci sia ai risultati potenziali che alle reti causali bayesiane. Ha applicato i metodi citati a questioni di ricerca microeconomica relative alle imprese, al divario di genere e alla produttività della ricerca.
Audience
Il corso è rivolto a coloro che sono o desiderano essere coinvolti nella creazione, acquisizione, analisi o gestione generale dei dati di ricerca nell’ambito delle discipline delle scienze sociali. Il pubblico di riferimento comprende, ma non si limita a, ricercatori all’inizio della carriera, ricercatori che aspirano a sviluppare il loro percosro, tecnici, amministratori di dati e gestori di dati.