Aller au contenu principal
CY Bibliothèques

Données de la recherche

Données de la recherche : contexte, définition et cycle de vie, gestion, stockage, diffusion et ressources

Du partage à la diffusion des données

Stockage des données : en local

Pour le stockage tout au long d’un projet, souvent il faut trouver une solution locale.

Les pratiques diffèrent encore beaucoup selon les communautés scientifiques et les établissements.

 

Partage des données : des entrepôts

Pour être sauvegardées et partagées, les données sont déposées  dans des entrepôts de données, généralistes tels Zenodo en Europe, Dryad  aux Etats-Unis, spécialisées par disciplines et formats, ou institutionnels, sur le modèle du logiciel https://dataverse.org de Harvard University.

Pour les choisir, des annuaires des entrepôts sont consultables : le Registry of Research Data Repository  et pour les entrepôts en France Cat OPIDoR .

 

Lorsqu’on partage des données, il est important de penser à la façon dont elles pourront être réutilisées par des tiers.

L’application des principes FAIR à la gestion des données constitue une ligne directrice afin de garantir que les données soient :

  • Faciles à trouver (Findable) – s’assurer que les données peuvent être repérées à l’aide de leurs métadonnées et d’un DOI.

  • Accessibles (Accessible) – privilégier l’usage de logiciels open source et de formats universellement reconnus.

  • Interopérables (Interoperable) – utiliser des standards et des formats de données compatibles avec différents systèmes.

  • Réutilisables (Reusable) – s’assurer que les données puissent être utilisées et exploitées par d’autres personnes en les dotant d’une licence appropriée comme la Licence Ouverte ou l’Open Database License (ODbL).

 

Les entrepôts devraient suivre ces lignes directrices autant que possible, notamment pour maintenir l’accessibilité des données. Un bon entrepôt s’engagera à une préservation à long terme du matériel et à l’accès à celui-ci, fournissant un lien permanent afin que les chercheurs n’aient pas à mettre à jour constamment les liens dans leur profil en ligne. Il est toujours préférable de choisir un entrepôt certifié ou en voie de certification par le Core Trust Seal.1 Certains entrepôts facturent des frais de stockage, notamment si le jeu de données est très important. Ce coût doit être anticipé en amont afin d’éviter une mauvaise surprise à la fin du projet.

 

Archiver de façon pérenne

A l'issue d'un projet de recherche, il convient de sélectionner les données que l'on souhaite archiver de façon pérenne.

En France, seul le CINES permet une telle opération, au coût parfois élevé.

 

Déposer vos données avec une publication 

Si vos données ont pour fonction principale de soutenir une publication, et qu’elles ne sont pas d’une taille trop importante, vous pouvez les déposer avec cette publication.

La plupart des archives ouvertes, comme HAL ou ArXiv , permettent de déposer des fichiers annexes (complementary files) à une publication et de les décrire sommairement.

Déposer vos données dans un entrepôt disciplinaire

Si les données ne sont pas rattachées à une publication particulière, ou si la taille ou le format des fichiers ne permettent pas de les déposer dans une archive ouverte, il est possible de les déposer dans un entrepôt de données.

Le répertoire re3data.org permet de rechercher parmi 1500 entrepôts de données, en fonction des types de fichiers à déposer, des disciplines concernées et des politiques de dépôt et de consultation.

Déposer vos données dans un entrepôt généraliste

Si vous souhaitez déposer des données issues de disciplines différentes, vous pouvez choisir un entrepôt comme Zenodo, qui vous permet de déposer n’importe quel type de fichiers, sans limitation de taille.

Un DOI est attribué automatiquement aux données que vous y déposez pour faciliter leur citation. 

Ils permettent aussi de choisir les modalités de diffusion de vos différents fichiers, notamment par la mise en place d’un embargo.

Critères d'un de qualité d'un entrepôt
  • Attribuer un identifiant unique et pérenne à vos données (ex. DOI) et rendre vos données citables.
  • Offrir une description de vos données (métadonnées) d’une qualité suffisante pour que d’autres chercheurs puissent les trouver et les réutiliser.
  • Gérer les accès à vos données selon vos besoins: délai d’embargo, possibilité d’accès restreint…
  • Permettre l’attribution d’une licence appropriée à vos données (ex. Creative commons)
  • Offrir des garanties de pérennité (certificat, institution en charge de l’entrepôt…)
 

Data paper

Le data paper est une publication qui décrit un jeu de données scientifiques brutes, notamment à l’aide d’informations précises, appelées métadonnées. 

Les données décrites doivent être accessibles, soit sous forme de fichiers annexés, soit par un lien pérenne (URL, DOI) vers « l’entrepôt de données » en ligne où elles sont déposées et formatées.

Le data paper informe la communauté scientifique de la disponibilité de ces jeux de données et de leur potentiel pour des utilisations futures. 

Contrairement à un article de recherche classique, le data paper décrit uniquement des données scientifiques et les circonstances et méthodes de leur collecte.

Il ne rend pas compte des hypothèses ni des conclusions issues de l’analyse de ces données. Néanmoins, il présente les analyses techniques et statistiques validant la qualité des données.

Data journal

Le data paper est publié sous la forme d'un article examiné par les pairs dans une revue scientifique classique publiant différentes formes d’articles dont des data papers ou dans un data journal, c’est-à-dire une revue contenant exclusivement des data papers.

Source : https://coop-ist.cirad.fr/gerer-des-donnees/rediger-un-data-paper/1-qu-est-ce-qu-un-data-paper