Université de Strasbourg
Décembre 2021
Data librarian au sein du service des bibliothèques de l’université de Strasbourg (Unistra), Stéphanie Cheviron a travaillé de 2010 à 2014 à la direction régionale des affaires culturelles sur les bases de données et le repérage géographique des monuments historiques. Auparavant, elle était webmaster et graphiste freelance, avec une spécialisation dans la conception de bases de données. Depuis 2015, elle accompagne les chercheurs de l’Unistra sur toutes les questions liées à la gestion des données. Elle est membre du GTSO-Données de Couperin, du Groupe de travail inter établissements Grand Est (GTigre), du WP6 du projet d’entrepôt national RDG et du groupe de travail de Knowledge Exchange FAIR Data and Software Supporting Reproducibility.
Votre établissement
L’Unistra est une université pluridisciplinaire avec :
- 56 875 étudiants dont 2 157 doctorants inscrits
- 2 814 enseignants et enseignants-chercheurs (titulaires et contractuels)
- 2 388 personnels BIATSS (titulaires et contractuels)
- 35 facultés, écoles, instituts et unités de formation et de recherche (UFR)
- 70 unités de recherche, 1 unité de service et de recherche, 6 unités mixtes de service
- 6 structures fédératives de recherche (dont 3 en partenariat avec le CNRS)
- 10 écoles doctorales au sein d’un collège doctoral de site
5 écoles doctorales co-accréditées et 2 accréditées en délivrance conjointe avec l’Université de Haute-Alsace - H2020 en cours : 36
- ERC en cours : 6
- ANR en cours : 259
Depuis quand votre service accompagne la gestion des données ? Comment s’est constitué votre service ?
Le projet Archives ouvertes de la connaissance (AOC) a débuté en 2013, piloté par le service de la documentation scientifique numérique du service des bibliothèques (SBU) et avec l’appui de la direction du numérique (DNum), avec la volonté de doter l’université et ses partenaires alsaciens d’une archive ouverte pour les publications scientifiques. La plateforme UnivOAK fut officiellement lancée en 2016.
Parallèlement, l’Unistra a mené une réflexion sur le développement de services d’aide à la gestion des données à destination de ses chercheurs. Fin 2015, le volet Données de la recherche du projet AOC a démarré avec mon recrutement sous la forme d’un service expérimental d’accompagnement de projets pilotes de valorisation de données scientifiques portés par des chercheurs en sciences humaines et sociales. L’objectif était d’identifier les besoins récurrents des chercheurs pour savoir quels moyens mettre en place pour y répondre. L’idée était pour la DNum de proposer à terme un catalogue d’applications réutilisables.
Cette expérience a mené, à la faveur d’une réorganisation de la direction du numérique, à la création d’un service dédié aux données de la recherche : le pôle Calcul et Services Avancés à la Recherche (CESAR). Au sein du SBU, le service de la documentation scientifique numérique laissera bientôt la place au pôle d’appui à la diffusion de la recherche. Il sera composé de la documentation électronique, des publications scientifiques et des données de la recherche.
En 2019, l’université de Strasbourg s’est dotée d’une politique de science ouverte, composée de huit piliers dont le deuxième est dédié aux données ouvertes et FAIR. Depuis octobre 2021, un COPIL science ouverte se réunit régulièrement.
Organisation du service : 1,5 ETP, bientôt 2,5 en mars 2022.
Comment accompagnez-vous les chercheurs ?
L’accès se fait via le guichet unique Research Data Helpdesk (RDH) à l’adresse rdh@unistra.fr. Les demandes sont reçues à la fois par le SBU et par CESAR.
L’accompagnement des chercheurs suit plusieurs axes.
- Accompagnement à la gestion des données
Nous proposons aux chercheurs de nous contacter le plus tôt possible, dès le montage de leur projet, pour les aider à définir les coûts engendrés par la gestion FAIR des données, afin d’augmenter leurs chances d’obtention de financement. Cette action est menée conjointement avec CESAR pour estimer les besoins en stockage et en calcul.
Parmi les actions également mises en place :
- Conseils de rédaction du plan de gestion des données, bonnes pratiques et relecture
- Modèle de PGD Unistra disponible sur DMP OPIDOR
- Conseils sur la FAIRisation des données
- Conseils sur le choix d’entrepôts thématiques, sur les schémas de métadonnées
- Attribution de DOI
- Conseils juridiques de premier niveau.
Le cas échéant, nous orientons les chercheurs vers les services référents ou les experts.
- Formations
Des formations à la rédaction du plan de gestion des données et à la prise en main de DMP OPIDOR sont organisées avec l’URFIST de Strasbourg et lors d’ateliers organisés par la Plateforme des Humanités Numériques (PHUN) de la Maison interuniversitaire des Sciences de l’Homme (MISHA). Elles peuvent aussi avoir lieu à la demande des unités de recherche avec une approche plus disciplinaire.
Nous proposons également des formations à la gestion des données, notamment sur les principes FAIR et le stockage et l’archivage des données.
- Développement d’applications web
Conjointement avec la DNum, le SBU travaille avec des chercheurs désirant disposer d’outils scientifiques pour saisir, visualiser et exploiter leurs données. Les porteurs de projet doivent apporter le financement nécessaire pour payer les heures de développement. Le processus de prise en charge de la demande se déroule ainsi :
- Étude du cahier des charges ou rédaction avec les chercheurs
- Étude de faisabilité technique par le pôle Développement, Intégration et Paramétrage (DIP) de la DNum, piloté par CESAR.
- Mise à disposition d’une équipe de trois développeurs par le DIP
- Développement en mode agile et tests de l’application
- Mise en production et maintenance
Le processus itératif des méthodes agiles rend le projet très réactif, mais demande une grande disponibilité des chercheurs. C’est ainsi que le calendrier des développements peut parfois entrer en collision avec celui de la recherche.
Selon les cas, il peut aussi y avoir un travail d’extraction et de structuration des données effectué par le SBU et les porteurs de projet.
Tout au long du projet, nous utilisons le Gitlab de l’Unistra comme outil de gestion de projet principal.
Parmi les projets développés, il y a :
- POUNT, plateforme de description et de visualisation de données
- HDB, base de données de recueils de chants religieux datant de la Réforme à nos jours
- Schimper, l’herbier de l’université
- Oniros, un agenda du sommeil utilisé dans le cadre d’études cliniques
- Entrepôt de données scientifiques
Début 2020, la direction du numérique a fait une étude technique sur les solutions techniques pour mettre en place un entrepôt de données institutionnel pour une ouverture prévue en novembre 2021. Après l’annonce de la création de l’entrepôt national RDG au printemps 2021, le COPIL Entrepôt a décidé d’intégrer cette plateforme qui ouvrira au printemps 2022 pour disposer d’une collection Unistra. Nous sommes aussi entrés dans sa gouvernance et participons activement à sa mise en place dans le cadre de groupes de travail.
Comment est organisé l’accompagnement à la gestion des données dans votre établissement ?
Le Research Data Helpdesk a vocation à aider les chercheurs issus de toutes les communautés scientifiques. Cependant, des expertises disciplinaires se sont développées sur le site strasbourgeois.
Depuis plus de 40 ans, les données astronomiques sont prises en charge par le centre de données astronomiques de Strasbourg (CDS) qui héberge la base de référence mondiale pour l’identification d’objets astronomiques. L’EOST est un Observatoire des sciences de l’Univers (OSU) gèrent des données en sciences de la Terre et qui contribue activement à l’infrastructure de recherche Data Terra.
Deux plateformes ont été créées au sein de la MISHA pour rapprocher les infrastructures de recherche des chercheurs :
- PHUN, relais d’Huma-Num, organise des formations à la gestion des données et propose des solutions techniques simples comme les Huma-Num Box ou HEURIST, outil de gestion de bases de données en ligne.
- la Plateforme universitaire des données (PUD-S), relais de PROGEDO, accompagne et forme les chercheurs en sciences sociales à l’usage des grandes bases de données quantitatives.
Sur le campus CNRS de Cronenbourg se trouve la plateforme SCIGNE de l’institut pluridisciplinaire Hubert Curien (IPHC) qui propose des services de stockage, de calcul et d’accompagnement au DMP pour des disciplines telles que la physique des particules, la physique nucléaire, la chimie et la biologie.
La déléguée à la protection des données (DPD) de l’université prend en charge les questions liées aux données à caractère personnel. Elle est localisée à la Direction du numérique et travaille en étroite collaboration avec le responsable de la sécurité des services d’information (RSSI).
Le pôle unique d’ingénierie (PUI) propose aux chercheurs un accompagnement et une assistance technique en ingénierie de projets lors de leur demande de financements.
Le Centre de Culture Numérique (CCN) propose des ateliers ouverts à tous sur toutes les questions liées au numérique, dont la recherche, avec des formations sur Jupyter Notebook (bloc-note interactif permettant d’écrire et d’exécuter du code), sur le RGPD, etc.
Enfin, la Bibliothèque Nationale et Universitaire (Bnu) dispose de fonds patrimoniaux importants et propose un service de collecte et de création de corpus destinés à la recherche. Elle développe également des formations, par exemple à l’extraction de données depuis Wikidata. L’établissement inaugurera en 2022 un lieu dédié aux données, le DataLab.
Cette offre et ces partenariats se structureront plus étroitement grâce à l’appel à manifestation d’intérêt « Ateliers de la donnée » lancé par le MESRI, si nous sommes retenus.
Présentez une action particulièrement importante pour votre établissement d’accompagnement à la gestion des données.
L’un des projets pilotes consistait à développer une plateforme institutionnelle de modèles 3D produits par l’unité de recherche Archimède (UMR7044). Le projet s’est élargi pour inclure tout type de données de toutes disciplines. Renommée POUNT pour Plateforme Ouverte Numérique Transdisciplinaire, cette application est devenue la colonne vertébrale de plusieurs de nos projets de valorisation des données actuels et à venir.
L’objectif de rationalisation du développement d’applications par la réutilisation du code déjà produit est facilité par cette plateforme. Elle nous permet de proposer une solution couvrant la majorité des besoins identifiés lors de la phase expérimentale du service d’accompagnement aux données. Cette démarche simplifie la maintenance des outils et améliore leur pérennisation.
D’autres projets intégreront complètement ou partiellement POUNT, et financeront des développements complémentaires qui bénéficieront à tous les chercheurs utilisant l’application.
La plateforme permet aux chercheurs de déposer leurs données et de les visualiser, puis de les décrire grâce à des formulaires composés d’un socle de métadonnées obligatoires issues du schéma Datacite et de métadonnées personnalisées. On peut travailler en mode collaboratif sur ses données, les rendre publiques ou non. Par un simple copier/coller d’un bout de code, on peut aussi intégrer et visualiser ses données issues de POUNT dans toute page web ou data paper, par exemple.
Parmi les fonctionnalités à venir :
- Renforcer la gestion FAIR par l’ajout de schémas de métadonnées disciplinaires, de vocabulaires standardisés et de référentiels
- Améliorer et étendre les capacités de visualisation en intégrant le framework IIIF
- Ajouter la cartographie interactive.