Le projet Datacc
Mars 2021
Nos établissements en chiffres
Université Claude Bernard Lyon 1 :
- 47 500 étudiants
- 1 600 doctorants
- 2800 enseignants-chercheurs
- 3 campus et 11 sites d’enseignement
- 66 laboratoires de recherche
- 28 plateformes techniques et scientifiques
- 50 brevets déposés par an en moyenne
Université de Grenoble-Alpes :
- 55 000 étudiants
- 3 200 doctorants
- 3 100 enseignants et chercheurs.
- 6 pôles
- Plus de 100 labos de recherche
- 5 grands instruments
- 30 brevets déposés par an en moyenne
Pourriez-vous présenter vos établissements en quelques mots ?
L’Université Claude Bernard Lyon 1 est spécialisée dans les domaines des sciences et technologies, de la santé, ainsi que quelques domaines des sciences humaines et sociales, le tout se répartissant en 13 composantes. Elle propose 13 licences, 46 masters, 6 filières d’ingénieur, 11 DUT, 58 parcours de licences professionnelles et 10 diplômes d’exercice en santé.
L’Université Grenoble Alpes est une université pluridisciplinaire permettant aux étudiants de construire des parcours riches, facilitant les passerelles. Elle propose plus de 500 diplômes au sein de ses différentes composantes : 8 écoles d’ingénieurs, Science Po Grenoble, une école d’architecture, 3 IUT et plusieurs facultés (sciences, droit, humanités etc.)
Depuis quand votre service accompagne la gestion des données ? Comment s’est constitué votre service ?
L’accompagnement à la gestion des données dans nos deux établissements s’est mis en place dans le cadre de l’évolution des missions confiées aux bibliothèques appartenant auparavant au réseau des Cadist, devenu CollEx. Lauréates de deux appels à projet CollEx-Persée, les BU de Lyon 1 et de l’UGA ont ainsi bénéficié d’un contexte favorable pour mettre en place leur dispositif d’accompagnement baptisé Datacc. Celui-ci s’appuie sur 1.6 ETP à Lyon 1 (1 catégorie A ingénieur d’études et 0.6 catégorie A conservateur) et 1 ETP à Grenoble-Alpes (0.7 catégorie A ingénieur d’études et 0.3 catégorie A conservateur). Les deux ingénieurs d’études ont été recrutés spécifiquement pour faciliter la mise en place du projet. Leur arrivée dans l’équipe s’est faite de manière échelonnée avec un premier recrutement en janvier 2020 puis un second en novembre de la même année.
A l’UGA, l’enjeu a mobilisé avant la mise en place du projet Datacc, à travers l’installation d’une « cellule de datastewardship », pilotée par l’UMS GRICAD et à laquelle la bibliothèque participe activement. Parmi les actions en cours, la constitution d’un réseau de référents données, une enquête sur les pratiques et les besoins, un projet d’entrepôt institutionnel, des formations (stockage, formation doctorale…), des séminaires et des ateliers, un accompagnement personnalisé des chercheurs (par ex, aide à la rédaction de PGD), un projet de site web Science ouverte et une déclinaison du baromètre science ouverte pour l’UGA. Les actions menées localement dans le cadre du projet Datacc s’inscrivent en cohérence et en concertation avec la cellule datastewardship.
Comment accompagnez-vous les chercheurs ?
La particularité du projet Datacc repose sur son approche disciplinaire. Conçu dans le prolongement de CollEx, le dispositif vise à accompagner les chercheurs en chimie et en physique, deux disciplines pour lesquelles la BU Sciences de Lyon 1 et la BU de Grenoble-Alpes ont, au fil des ans, constitué des fonds documentaires d’excellence.
Le volet relatif à la gestion des données s’est décliné selon la progression logique décrite dans la réponse à l’appel à projet. Les actions décrites ci-dessous reflètent la chronologie des réalisations inscrites au bilan de Datacc entre décembre 2019 et décembre 2020 :
- Un travail de coopération avec les chercheurs intéressés par la problématique des cahiers de laboratoire électroniques engagé dès la fin de l’année 2019. Le cahier de laboratoire, qui constitue le premier jalon de documentation des expériences menées « à la paillasse », nous a permis d’enclencher une dynamique sur la gestion des données en s’appuyant en premier lieu sur les propositions et les réflexions des chercheurs en la matière.
- Une plateforme en ligne, Datacc.org, qui propose depuis son lancement le 30 avril 2020 une entrée à 4 niveaux (« Trouver des données », « Documenter ses données », « Valoriser ses données » et « Conserver ses données ») illustrés à chaque fois par des applications propres aux deux disciplines concernées. Il en va ainsi de la sélection des entrepôts signalés ou encore des formats informatiques couramment utilisés et donc recommandés, par exemple. Cette plateforme est également le point d’entrée de chercheurs qui peuvent nous contacter afin de soumettre leurs problématiques relatives à la gestion des données.
- Un bulletin de veille mensuel depuis le lancement du site, complété par une newsletter mensuelle, Datactu, diffusée depuis septembre 2020 auprès de 250 abonnés.
- Un accompagnement et des conseils pour la rédaction de plans de gestion de données, ainsi qu’une aide à la publication de jeux de données, auprès des laboratoires qui le souhaitent. Ces actions ont concerné 5 laboratoires côté Lyon 1 et 7 côté UGA, représentant en tout une vingtaine de chercheurs issus des deux disciplines concernés.
- L’organisation de séminaires à destination des équipes de recherche souhaitant échanger sur les enjeux de science ouverte. Deux séminaires de ce type se sont tenus fin 2020 et début 2021 auprès de laboratoires en chimie et une demi-journée a été organisée à destination des chercheurs en physique à Grenoble en septembre 2020.
- Une réflexion sur l’accès et la diffusion des résultats scientifiques dits « négatifs », qui fait l’objet d’une nouvelle rubrique sur le site depuis novembre 2020.
Présentez une action particulièrement importante pour votre établissement d’accompagnement à la gestion des données.
L’axe emblématique du projet Datacc depuis sa création porte sur les cahiers de laboratoire électroniques, sujet suscitant l’intérêt manifeste de certains chercheurs pour lesquels le support papier n’offre pas les conditions idoines à la description et la réutilisation des expériences menées, en chimie de synthèse notamment. En tout premier lieu, l’objectif a consisté à dresser un état des lieux des pratiques et besoins des chercheurs en chimie. Une quinzaine d’entretiens ont été menés en ce sens, complétés par des interviews vidéos de doctorants diffusées sur le site. Une ressource ludique a aussi été produite grâce au concours de Doranum qui nous a aidés à scénariser cet enjeu à travers un mini « serious game » sur les cahiers de laboratoire.
Suite à ce premier travail de repérage, une rencontre, proposée sous forme de Data lunch, s’est tenue le 17 décembre 2019, faisant intervenir deux chercheurs (ICBMS et INSERM) utilisateurs de solutions électroniques de cahier de laboratoire. Cette édition a rassemblé une trentaine de chercheurs et doctorants.
Un benchmarking de 7 solutions tantôt adaptées à la chimie tantôt généralistes a été lancé début 2020. Quatre d’entre elles ont donné lieu à des tests utilisateurs (Chemotion, eLabFTW, Mbook et LabCollector) avec l’organisation d’ateliers en ligne faisant intervenir les éditeurs des outils.
À l’issue de cette première expérience pilote, la décision a été prise de souscrire à des licences pour le logiciel Mbook, particulièrement adapté à la chimie de synthèse. Une première équipe issue du laboratoire de l’ICBMS bénéficie de cette solution depuis février 2021. Nous espérons que d’autres suivront.
En parallèle, l’équipe-projet de Datacc continue d’animer la communauté autour de cet enjeu avec l’organisation d’un webinaire le 3 février 2021, centré sur la solution française et open source eLabFTW. La rencontre, qui a rassemblé plus d’une centaine de chercheurs, a mis en lumière le retour d’expérience d’un chercheur en biophysique de l’Institut Lumière Matière.
L’équipe Datacc participe également depuis début 2021 à une réflexion sur les cahiers de laboratoire électroniques lancée par le collège des données du Comité pour la Science Ouverte. Cette démarche vise à mettre en synergie les acteurs nationaux sur le sujet, dont l’Inrae et l’Inserm.