re3données
Données scientifiques volume 10, Numéro d'article : 571 (2023) Citer cet article
119 Accès
4 Altmétrique
Détails des métriques
Depuis plus de dix ans, re3data, un registre mondial de référentiels de données de recherche (RDR), aide les scientifiques, les agences de financement, les bibliothèques et les centres de données à trouver, identifier et référencer les RDR. En tant que plus grand répertoire de RDR au monde, re3data décrit actuellement plus de 3 000 RDR sur la base d'un schéma de métadonnées complet. Le service permet de rechercher des RDR de tout type et de toutes disciplines, et les utilisateurs peuvent filtrer les résultats en fonction d'un large éventail de caractéristiques. Les descriptions RDR de re3data sont disponibles sous forme de données ouvertes accessibles via une API et sont utilisées par de nombreux services Open Science. re3data est engagé dans diverses initiatives et projets concernant la gestion des données et est mentionné dans les politiques de nombreuses institutions scientifiques, organismes de financement et éditeurs. Cet article revient sur dix années d'expérience dans l'exécution de re3data et aborde dix questions clés liées à la gestion d'un service de science ouverte qui s'adresse aux RDR du monde entier.
Dans les années 2010, rendre les données de recherche accessibles au public a pris de l’importance : des termes tels que e-science1 et cyberscience2 ont façonné les discours sur le travail scientifique à l’ère numérique. Diverses discussions au sein de la communauté scientifique3,4,5,6,7,8 ont abouti à une prise de conscience accrue de la valeur d’un accès permanent aux données de recherche. Les recommandations politiques de l’Organisation de coopération et de développement économiques (OCDE)9 ou de la Commission européenne10 reflètent ce changement.
La nécessité d’une gestion professionnelle des données a été de plus en plus soulignée avec la publication des principes FAIR Data, désormais largement reconnus11. Les chercheurs, les établissements universitaires et les bailleurs de fonds ont commencé à aborder cette question dans les politiques12, les initiatives et les réseaux13,14,15 et les infrastructures16,17,18,19. Par exemple, la National Science Foundation (NSF) aux États-Unis a publié une politique de partage de données en 2011, dans laquelle l’agence de financement exigeait des bénéficiaires qu’ils fournissent des informations sur le traitement des données dans un plan de gestion des données20. En Allemagne, la Fondation allemande pour la recherche (DFG) a publié une déclaration similaire concernant l’accès aux données de recherche dans les années 201021,22.
Le traitement des données de recherche a également été discuté dans les communautés des bibliothèques et des centres informatiques : en 2009, l'Initiative allemande pour l'information en réseau (DINI), un réseau de fournisseurs d'infrastructures d'information, a publié un document de position sur la nécessité d'une gestion des données de recherche (RDM) à établissements d’enseignement supérieur23. Grâce aux discussions au sein de la DINI, la nécessité d'un registre des RDR est devenue évidente. À l’époque, le Directory of Open Access Repositories (OpenDOAR)24 s’était déjà imposé comme un annuaire de référentiels thématiques et institutionnels en libre accès. Cependant, il n’existait pas de répertoire comparable pour les RDR, et il restait difficile de savoir combien de référentiels dédiés aux données de recherche existaient.
En 2011, un consortium d'institutions de recherche en Allemagne a soumis une proposition à la Fondation allemande pour la recherche (DFG), demandant un financement pour développer « re3data – Registre des référentiels de données de recherche »25. Les membres du consortium étaient l'Institut de technologie de Karlsruhe (KIT), la Humboldt-Universität zu Berlin et le Helmholtz Open Science Office du Centre de recherche allemand en géosciences GFZ. La DFG a approuvé la proposition la même année. Le projet visait à développer un service qui aiderait les chercheurs à identifier les RDR appropriés pour stocker leurs données de recherche. re3data a été mis en ligne en 2012 et répertoriait déjà 400 RDR un an plus tard26.
Alors qu'elle travaillait sur le registre, l'équipe du projet en Allemagne a pris connaissance d'une initiative similaire aux États-Unis. Avec le soutien de l'Institute of Museum and Library Services, les bibliothèques de Purdue et de l'Université d'État de Pennsylvanie ont développé Databib, un « catalogue en ligne organisé et mondial de référentiels de données de recherche »27. Databib a été mis en ligne la même année28. À l’époque, les RDR étaient indexés et conservés par le personnel des bibliothèques des institutions partenaires de re3data, tandis que Databib avait créé un comité de rédaction international pour conserver les descriptions des RDR27. Databib et re3data ont signé un protocole d'accord en 2012 et, après une excellente coopération, les deux services ont fusionné en 201429. La fusion a rassemblé les idées réussies de chaque service : les schémas de métadonnées ont été combinés, aboutissant à la version 2.2 du schéma de métadonnées re3data30, et les ensembles de descriptions RDR ont été fusionnés. Le comité de rédaction international de Databib a été élargi pour inclure les éditeurs re3data. Le développement de l'infrastructure informatique de re3data s'est poursuivi, combinant l'expertise acquise par les deux services. Pour exploiter le service, un duo de gestion a été mis en place, composé d'un membre issu chacun d'institutions représentant re3data et Databib.