Contestualmente ai dati della ricerca viene consigliata, o talvolta richiesta, la redazione di un Data Management Plan (DMP), cioè di un piano di gestione dei dati.
Attraverso questo strumento i ricercatori pianificano la raccolta, conservazione, descrizione e disseminazione dei propri dati e metadati della ricerca secondo i cosiddetti Principi FAIR.
Consentendone tracciabilità, disponibilità, autenticità, citabilità e una conservazione appropriata, tenendo conto anche degli aspetti etici e legati alla sicurezza, ne assicurano e disciplinano gli usi successivi.
Il DMP è concepito come un living document perché segue l’intero ciclo di vita dei dati, permettendo attraverso la pianificazione di risparmiare tempo e risorse.
É importante che venga redatto in fase di avvio della ricerca e aggiornato, in versioni successive, nelle diverse fasi della ricerca nonché quando intervengano delle modifiche nella natura dei dati o nelle modalità di gestione.
Il DMP aiuta i ricercatori a gestire i propri dati, a soddisfare i requisiti del finanziatore e aiuta gli altri a utilizzare i dati se condivisi.
Solitamente il DMP viene redatto dal principal investigator.
Sono disponibili in internet numerosi modelli per la redazione del DMP, spesso però gli stessi programmi di finanziamento predispongono un template da compilare.
Generalmente si articola in più sezioni, ad esempio:
E’ opportuno archiviare negli archivi o repository di dati istituzionali, laddove esistenti, in quelli disciplinari di riferimento in uso nelle diverse comunità scientifiche, o multidisciplinari come Zenodo gestito dal CERN, Dryad o Figshare.
La maggior parte sono gratuiti fino a una certa dimensione del dataset, e attraverso banche dati come re3data.org e OpenDOAR è possibile individuare facilmente il repository di dati più appropriato.
Occorre però verificare che il repository scelto rispetti alcuni requisiti, in particolare:
Oltre ai dati, è opportuno archiviare anche documentazione e spiegazioni (read-me file) facendo riferimento agli strumenti e ai software utilizzati per generare ed elaborare i dati.
I dati devono essere depositati completi dei seguenti metadati descrittivi:
Sarebbe buona norma depositare anche i software, ad esempio in GitHub, e i protocolli, ad esempio in Protocols.io.
Per i software è necessario utilizzare le licenze appropriate, ad esempio le Licenze GNU o la Licenza MIT
Altre licenze sono disponibili sul sito della Open Source Initiative.