Aller au contenu principal
CY Bibliothèques

Données de la recherche

Données de la recherche : contexte, définition et cycle de vie, gestion, stockage, diffusion et ressources

Les données de la recherche : qu'est-ce que c'est ?

Les données de la recherche sont définies comme des "enregistrements factuels (chiffres, textes, images et sons) utilisés comme sources principales pour la recherche scientifique et nécessaires à la validation de ses résultats".1

En pratique, le terme recouvre un large éventail d'éléments: séquences de génome, retranscription d’entretien de patients en psychologie, photographies de fouilles archéologiques, tableaux statistiques d’enquêtes en sciences sociales, bases de données textuelles...

L’approche adoptée pour leur gestion variera selon les formats, le travail dont elles sont le produit (données d’observation, expérimentales, de simulation, brutes ou compilées, etc) et des lignes directrices fournies par les bailleurs de fonds.

 

1Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics.

                                                                                 

 

Les données obéissent à un cycle de vie.

Organisation

Une bonne gestion des données débute par l’organisation de l’information.

Les systèmes de gestion doivent prendre en compte les informations physiques et numériques. Ils permettent aux chercheurs de trouver facilement et rapidement ce dont ils ont besoin.

Plus l’équipe est large et dispersée et les données nombreuses, plus les questions d’organisation des dossiers, de nommage des fichiers et de disponibilité de l’information sont des points critiques.

Stockage & Sauvegarde

Il convient de distinguer les besoins de stockage en cours de projet et ceux d’archivage pérenne à son issue.

La méthode et l’infrastructure de stockage pendant le projet, la fréquence des mises à jour, le volume et l’infrastructure des sauvegardes pérennes après le projet doivent être anticipées.

Partage

Les financeurs encouragent fortement le partage des données selon le principe aussi ouvert que possible, aussi fermé que nécessaire, grâce à un entrepôt approprié, en utilisant les métadonnées (descriptions) adéquates et une licence adaptée.

Si toutes les données doivent être gérées, toutes ne peuvent être partagées.

 

Source : librement adapté du guide de l’Office of Scholarly Communication, University of Cambridge

Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions CC BY-NC-SA

 

cycle de vie des données

Source : INIST, cycle de vie des données de la recherche (adapté de UK Data Archive)

 

Contrairement aux publications, l’ouverture en vue d’une réutilisation est le statut juridique par défaut des données publiques y compris produites dans le cadre des activités de recherche (loi Valter de 2015, loi Lemaire de 2016).

Toutefois, de nombreuses données sont protégées par un droit spécifique ou une réglementation particulière. La protection des données personnelles requiert par exemple une attention spécifique.

Il en est de même avec les données sensibles, relevant de la défense nationale, du secret professionnel, des secrets industriels et commerciaux. Dans ces différents cas, tout en étant gérées selon les principes FAIR, les données resteront fermées. Le cadre juridique est complexe. Des guides juridiques permettent une première approche en relation avec les spécificités de chaque projet.1

1https://www.ouvrirlascience.fr/wp-content/uploads/2018/11/Guide_Juridique_V2.pdf