La gestion des données à l’Université de Lorraine

  • | mise à jour le 17/07/2023

Mars 2020

Résumé : A l’Université de Lorraine, la Direction de la Documentation et de l’Édition (DDE) a contribué à la mise en place d’une gouvernance autour de la Science ouverte. Dans ce cadre, un Comité Opérationnel des Données de Recherche est co-piloté par la DDE et la Direction du Numérique, et associe notamment la Direction de la Recherche et l’Inist. Ce comité travaille à la mise en œuvre d’actions d’appui à la gestion des données de recherche avec un projet d’entrepôt de données institutionnel, des ateliers dédiés à la rédaction de plans de gestion des données et des formations.

Laetitia Bracco et Thomas Jouneau ont répondu à nos questions. Ils sont respectivement Data librarian et administrateur adjoint des données de la recherche à l’Université de Lorraine.

Cet entretien a été mené par Elise Lehoux et Romain Féret. Article publié le mercredi 11 mars 2020.

Votre établissement

  • Pluridisciplinaire
  • 54 sites
  • 60 000 étudiants
  • 1 800 doctorants
  • 2 900 chercheurs
  • 60 laboratoires de recherche
  • 42 projets H2020
  • 121 projets ANR

Pourriez-vous présenter votre établissement en quelques mots ?

L’Université de Lorraine (UL) est répartie sur tout le territoire de l’ancienne région Lorraine. Elle est le résultat de la fusion, en 2012, de quatre établissements : l’Université Henri-Poincaré (Nancy-I, sciences exactes), l’Université Nancy-II (sciences humaines et sociales), l’Institut national polytechnique de Lorraine (INP) et l’Université Paul-Verlaine de Metz (pluridisciplinaire).

La recherche est structurée en 10 pôles scientifiques dans lesquels sont rassemblés les 60 laboratoires que compte l’établissement. Près de 1 800 doctorants sont suivis par les 8 écoles doctorales, fédérées au sein du Collège lorrain des écoles doctorales.

Les types de données produites au sein de l’UL sont extrêmement variés. Des enregistrements vidéos en sociologie, aux clichés de diffraction en passant par les codes informatiques et les relevés hygrométriques, tous les types de données sont produits : d’observation, expérimentales, de simulation, dérivées, de référence… C’est ce qui fait la force de la recherche en Lorraine, mais c’est aussi ce qui représente le plus grand défi dans le cadre de notre projet d’entrepôt de données institutionnel.

Depuis quand votre service accompagne la gestion des données ? Comment s’est constitué votre service ?

L’accompagnement à la gestion des données a démarré en 2017 avec le recrutement d’une ingénieure d’étude sur un poste de data librarian. En juillet 2019, Laetitia Bracco, conservatrice, la remplace. Ses missions portent notamment sur la formation des doctorants, enseignants-chercheurs et collègues aux données de la recherche. Elle forme une équipe avec Thomas Jouneau, conservateur, dont les missions d’administrateur adjoint des données portent sur l’animation du Comité Opérationnel des Données de la Recherche de l’Université de Lorraine et sur le pilotage du projet d’entrepôt institutionnel.

Au sein de la Direction de la Documentation et de l’Édition, qui regroupe l’ensemble des bibliothèques universitaires, ces deux postes de conservateur représentent 1,5 ETP consacré aux données de la recherche. Ils sont tous deux rattachés à la Mission Appui Recherche.

Comment avez-vous initié l’accompagnement à la gestion des données ? 

La première démarche mise en œuvre a été la réalisation d’une enquête, au premier semestre 2017, auprès des directeurs de laboratoires afin de disposer d’une image précise et documentée des données produites et des besoins en termes de services. Cette enquête et ses résultats ont conduit, dès début 2018, à la mise en place d’un groupe de travail rassemblant les BU, le vice-président de la Recherche et la vice-présidente du Numérique.

C’est ce groupe de travail qui a élaboré en six mois un schéma de la gouvernance pour l’ensemble de la Science ouverte à l’Université de Lorraine, intégrant les réalisations passées (notamment l’archive ouverte hébergée par HAL) mais y ajoutant un axe fort sur les données de la recherche. Le portage politique du projet est complété par la nomination d’un chargé de mission Science ouverte, Nicolas Fressengeas, directeur du laboratoire LMOPS.

Comment est structurée cette gouvernance à l’Université de Lorraine ? 

L’Université s’est dotée d’un comité de pilotage Science ouverte, dont l’une des émanations est le Comité Opérationnel des Données de la Recherche (CODR). Ce comité est piloté en binôme par un ingénieur de la Direction du Numérique, Julien Brancher, et par Thomas Jouneau, respectivement administrateur et administrateur adjoint des données de la recherche (en référence à l’administrateur au Ministère prévu par le Plan national pour la Science Ouverte).

Outre ces deux pilotes, le comité comprend la data librarian, ainsi que des membres de la Direction de la Recherche et de la Valorisation, de l’Inist, d’un pôle de recherche de l’UL et de la Maison des Sciences de l’Homme Lorraine. La Direction de la Documentation et de l’Édition a été le moteur de l’impulsion initiale, mais le projet aujourd’hui est complètement transversal et partagé dans sa gestion entre des directions opérationnelles mobilisées sur le thème et des structures de recherche (MSH et pôle Otelo).

La structuration du service autour des données et la montée en puissance de ces activités s’expliquent par la volonté de l’Université de Lorraine de s’engager résolument dans la Science ouverte, dont la gestion des données de la recherche fait pleinement partie. Les actions engagées sont le reflet d’un choix politique fort.

Et d’un point de vue opérationnel, justement, le SCD est-il seul chargé de la mise en œuvre des orientations de ce comité ? 

L’accompagnement à la gestion des données est une affaire d’équipe à l’Université de Lorraine. Outre la Direction de la Documentation et de l’Édition, d’autres directions sont sollicitées :

  • La Direction de la Recherche et de la Valorisation, qui en plus d’être un point de contact privilégié auprès des laboratoires, supervise l’ensemble du système d’information recherche de l’Université de Lorraine ;
  • La Direction du Numérique, qui apporte son expertise informatique et l’infrastructure technique nécessaire et gère déjà un certain nombre de services (stockage, collaboration…) autour des données de recherche ;
  • La MSH Lorraine, qui apporte une vision assez complète de la recherche en sciences humaines et sociales ;
  • Le pôle Otelo de l’Université, qui a déjà développé son propre entrepôt, ORDaR, et représente la recherche en sciences exactes ;
  • L’Inist, un acteur incontournable, en particulier par l’apport de son expérience en matière d’accompagnement et de gestion des données.

Comment accompagnez-vous les chercheurs ? 

Les chercheurs disposent d’une adresse générique, donnees-recherche@univ-lorraine.fr, à laquelle ils peuvent adresser toute question relative aux données de la recherche. Les chercheurs ont été avertis de la création de cette adresse via un mail envoyé par le chargé de mission Science ouverte aux directeurs de laboratoire ainsi que lors des ateliers organisés par le CODR.

L’offre de services est actuellement structurée en 3 volets :

  • Le Comité Opérationnel organise des ateliers Plan de gestion des données à destination des porteurs de projet ANR en collaboration avec l’Inist. Ces ateliers ont été particulièrement suivis. Depuis la première session le 14 octobre 2019, nous avons formé 55 chercheurs en 4 sessions de 2h30 chacune. Deux sessions sont encore à venir et une troisième sera probablement programmée.
  • Des modules de formation ont été réalisés à destination des doctorants, des enseignants-chercheurs mais aussi des ingénieurs exerçant dans les laboratoires, qui sont souvent les premiers créateurs de données. Le parcours est composé de deux modules de 3h chacun : un « Kit de survie dans le monde des données de la recherche » et « Produire, gérer, stocker, diffuser les données de la recherche ». Un module de 3h en anglais, « Research Data Management », est également proposé. Plus de 80 personnes auront suivi l’un ou l’autre module en 2019-2020.
  • Enfin, le grand chantier du moment est la commande par le Comité de pilotage d’un entrepôt de données pour l’établissement.

Un entrepôt de données institutionnel ? Où en êtes-vous dans ce projet ? 

Ce projet comprend une phase de tests de solutions logicielles, qui vient de démarrer et inclura un premier galop d’essai pour l’accompagnement sur des jeux et types de données précis. Ces solutions logicielles sont Dataverse, InvenioRDM, Samvera Hyrax (et Hyku, qui en est une variante), ainsi qu’ORDaR (un entrepôt développé et déployé dans l’un des pôles de recherche de l’UL). Sept laboratoires ont été sollicités pour participer à ces tests, qui vont également poser des bases importantes pour la suite, de la phase pilote au passage en production.

Même si l’évaluation logicielle est la finalité première affichée de cette phase de test, les enseignements tirés de ce premier accompagnement à la préparation, structuration et curation de données en vue de leur dépôt seront structurants pour le projet dans son ensemble.

Pourriez-vous nous présenter une action d’accompagnement à la gestion des données particulièrement importante pour votre établissement ?

Pour le moment, l’action la plus importante sur l’accompagnement à l’Université de Lorraine est la mise en place des ateliers Plan de gestion de données.

Elle correspond à la première demande adressée par le comité de pilotage Science Ouverte au Comité Opérationnel des Données de la Recherche, dans un contexte d’urgence. En effet, les projets financés à partir de 2019 par l’ANR devront fournir un plan de gestion de données dans les 6 mois suivant le démarrage du projet. Face à cette obligation, une sensibilisation et un accompagnement des chercheurs se sont avérés plus que nécessaires.

Le premier atelier s’est tenu le 14 octobre 2019 et a consisté en une intervention à deux voix : la Direction de la Documentation et de l’Edition et l’Inist. Cette formule s’est répétée pour les trois ateliers qui ont suivi et semble définitivement adoptée. L’atelier, d’une durée de 2h30, comprend une courte présentation de l’organisation à l’UL, des nouvelles obligations ANR et de l’outil DMP OPIDoR. Cependant, la majeure partie de l’atelier consiste à participer à GopenDoRe, le jeu de plateau autour des données de la recherche créé par l’Inist. Cette formule nous permet d’aborder toutes sortes de thématiques autour des données, en évitant l’aspect trop magistral d’une présentation classique, tout en dédramatisant ce que représente la rédaction d’un plan de gestion de données.

Comme évoqué plus haut, l’actuel chantier d’entrepôt institutionnel sera l’occasion de mettre en place de façon graduée un accompagnement bien plus précis et complet sur les données produites dans les unités de recherche. La formation des collègues et la montée en puissance des formations doctorales permettront de dépasser largement les ambitions de cette première action. Mais la suite est au prochain épisode…

Pour en savoir plus : http://scienceouverte.univ-lorraine.fr/donnees-de-recherche/