Recensement d’enquêtes sur les données de la recherche

  • | mise à jour le 11/12/2023

Le GTSO Données recense les enquêtes sur les données de la recherche menées au sein d’établissements d’enseignement supérieur. Tout établissement peut contribuer et ajouter sa propre enquête en respectant les consignes suivantes :

  • 1200 caractères espaces compris maximum ;
  • Quelques phrases introductives ;
  • Des tirets qui listent les principales conclusions,
  • Éventuellement une phrase d’ouverture sur les perspectives ;
  • Le lien vers l’enquête en ligne.

La contribution est à envoyer à gtso_donnees@listes.couperin.org

Source

2023, Résultats de l’enquête « Vos données de recherche », SCD DAREC Université Polytechnique Hauts-de-France

Goubert Eva, & Defond Mélissa. (2023, April 13). Résultats de l’enquête « Vos données de recherche », SCD DAREC Université Polytechnique Hauts-de-France. Zenodo. https://doi.org/10.5281/zenodo.7824710

L’enquête « Vos données de recherche » avait pour objectif de dresser un état des lieux des pratiques et besoins des chercheurs, d’établir un panorama des données produites et de proposer à la communauté scientifique des services adaptés. Composée d’un questionnaire quantitatif en ligne suivi d’entretiens qualitatifs avec des chercheur.se.s volontaires et menée auprès des laboratoires LAMIH, CERAMATHS, LARSH et IEMN en 2022, elle a reçu 89 réponses (taux de participation de 18%).

Principales conclusions :

  • Les données de recherche sont majoritairement non-documentées : 48% n’utilisent pas de métadonnées et 35% ne savent pas ce que c’est ;
  • Les chercheurs ne connaissent pas les principes FAIR à 85% et 59% ne savent pas ce qu’est un Plan de Gestion des Données ;
  • Des problématiques de stockage et d’archivage sont présentes dans plusieurs laboratoires ;
  • Les principaux freins à la diffusion des données sont le manque de temps et la crainte du plagiat.

Perspectives :

  • Constituer un COPIL afin d’identifier les acteurs et le niveau de décision de chaque service ;
  • Créer un espace institutionnel au sein de Recherche Data Gouv ;
  • Sensibiliser et former la communauté scientifique ;
  • Proposer un modèle de PGD institutionnel sur DMP Opidor ;
  • Accompagner et sensibiliser les porteurs de projets ANR et Horizon Europe ;
  • Initier une réflexion sur le stockage et l’archivage des données internes à l’UPHF.

2023, Gestion et ouverture des données en SHS : une enquête auprès des communautés de Lyon 2, Lyon 3 et la MSH Saint-Etienne

Marie-Emilia Herbet, Aurore Montébran, Alexandra Dugué, Raphaëlle Billy, Mariana Maire, et al.. Gestion et ouverture des données de recherche en SHS : une enquête auprès des communautés de Lyon 2, Lyon 3 et la MSH Lyon St-Étienne. Université Jean Moulin Lyon 3; Université Lumière Lyon 2; MSH Lyon – Saint-Étienne. 2023. https://hal.science/hal-04087568

Cette enquête vise à éclairer les enjeux de la gestion et de l’ouverture des données de recherche dans les disciplines relevant des sciences humaines et sociales en s’inscrivant dans le cadre des plans nationaux pour la science ouverte.

Menée par les Universités de Lyon 3, Lyon 2 et la MSH Lyon St-Etienne, l’étude propose un état des lieux couvrant l’ensemble du cycle de vie de la donnée, depuis la collecte jusqu’à la diffusion, révélant par ailleurs les spécificités des pratiques et des besoins exprimés en SHS. Les résultats, qui s’appuient sur 264 réponses complètes, mettent également en lumière les différences d’approche et de représentation au sein même des disciplines, grâce à un volet qualitatif riche, fondé sur une trentaine d’entretiens menés auprès de chercheurs.

Au terme de cette étude, nous observons que :

  • La pratique de diffusion des données reste minoritaire : 75 % des répondants n’ont jamais partagé leurs données en accès ouvert et seuls 6,5 % disent publier leurs données en accès ouvert régulièrement
  • Pour justifier ce non-partage, les répondants invoquent surtout le fait qu’ils n’en voient pas l’intérêt ou qu’ils n’y ont pas pensé
  • 15% seulement des répondants ont déjà rédigé un plan de gestion des données, une pratique encore peu ancrée dans les activités de recherche mais considérée comme un besoin non prioritaire par les répondants
  • L’offre institutionnelle de stockage est délaissée au profit du disque dur personnel, support le plus fréquemment utilisé
  • Les pratiques d’archivage restent peu développées mais la préservation des données apparaît comme une préoccupation forte
  • Le cadre juridique est complexe à appréhender (données personnelles ou sensibles, droit de la propriété intellectuelle)
  • Des acteurs-clés comme le délégué à la protection des données et le pôle archives sont globalement méconnus
  • Les répondants souhaitent en priorité recevoir des conseils d’ordre général et une aide à la gestion informatique des données

Les enseignements tirés constituent une base de connaissances précieuse pour faciliter la mise en place en local de politiques et services adaptés à la réalité des besoins, dans un contexte de préoccupation croissante pour la question des données de recherche.

Pour en savoir plus :

2023, Enquête sur les recherches participatives et la science ouverte du collège Données de la recherche du CoSO

Kenneth Maussang, Hélène Jouguet, Thomas Jouneau, Jean-François Martin, Nicolas Larrousse. Recherches participatives, innovation ouverte et science ouverte : Résultats de l’enquête nationale. Comité pour la science ouverte. 2023. https://hal-lara.archives-ouvertes.fr/OUVRIR-LA-SCIENCE/hal-04074860v1

Le collège Données de la recherche du Comité pour la science ouverte a mené une enquête, du 28 novembre 2021 au 30 janvier 2022, sur les pratiques de gestion et d’ouverture des données produites dans le cadre de recherches participatives. L’objectif de cette enquête a porté sur la qualité des données et des métadonnées obtenues.

Parmi les répondants qui ont organisé un projet de recherches participatives :

  • 30,7% déclarent avoir utilisé un plan de gestion de données ;
  • 55,2% déclarent avoir une eu une stratégie préalable pour assurer la qualité des données, 60,5% a posteriori, et 27,9% seulement pour assurer la qualité des métadonnées ;
  • la formation des participants (non scientifiques) durant le projet est l’élément qui ressort comme étant le plus important et fréquemment cité ;

Les répondants ont déclaré que les démarches de recherches participatives apportent des bénéfices sur leurs données tels que :

  • augmentation de la quantité de données ;
  • plus large variété géographique de données ;
  • plus large variété sociologique ;
  • plus large variété des conditions expérimentales.

A consulter :

2022, « Enquête quantitative sur les pratiques et les besoins des chercheurs sur la gestion des données de la recherche, algorithmes et codes sources dans les établissements du site toulousain », Université de Toulouse

Danielle Brunet, Soraya Demay, Pierre Diaz, Borbala Goncz, Laure Leclerc, et al.. Enquête quantitative sur les pratiques et les besoins des chercheurs sur la gestion des données de la recherche, algorithmes et codes sources dans les établissements du site toulousain. Université de Toulouse. 2023. https://ut3-toulouseinp.hal.science/hal-04262708

En 2022, le Comité de réflexion pour le partage et la valorisation des données de la recherche et la coordination de la Science Ouverte (CéSO) de l’Université de Toulouse a réalisé une enquête quantitative sur la gestion des données de la recherche, algorithmes et codes sources. Adressée à l’ensemble de la communauté scientifique du site toulousain, son objectif était de produire un état des lieux des pratiques, des connaissances et des besoins des chercheurs en ce qui concerne la gestion des données de la recherche.

Les 547 réponses recueillies montrent que :

  • La rédaction de plan de gestion de données est une pratique encore peu répandue (20%)
  • Presque tous les répondants (86%) sont favorables au partage des données selon les principes de la science ouverte mais en majorité après publication (54%)
  • Les principaux freins au partage sont la charge de travail supplémentaire et le manque de compétences nécessaires
  • Il y a de fortes attentes autour d’outils techniques pour le stockage sécurisé pendant la recherche et l’archivage des données
  • Il est prioritaire ou important de disposer de personnel dédié, d’automatiser la gestion des données et plus généralement de disposer d’informations générales, un « code de la route de la gestion des données »

Ces résultats ont permis de préciser l’offre de services proposée à l’échelle du site dans le cadre de l’Atelier de la Donnée Occitanie Ouest (ADOO). 

2022, « Enquête sur les Données de la Recherche au sein de deux universités françaises », Université Côte d’Azur et Université de Strasbourg

Sandrine Wolff, Gabriel Gallezot, Nicolas Jalabert. Enquête sur les Données de la Recherche au sein de deux universités françaises. 2022. https://hal.science/hal-03997711

L’enquête intitulée « Enquête Données de la Recherche » a été financée par le GIS Réseau Urfist et s’appuie sur une expérience d’enquête antérieure, conduite à l’Université Rennes 2. Cette extension a pour but d’étendre l’étude à deux universités françaises et de prendre en compte l’ensemble des champs disciplinaires.

L’enquête a été adressée en ligne à l’ensemble des doctorants et des personnels ayant des activités de recherche, membres de l’université de Strasbourg (Unistra) et d’Université Côte d’Azur (UniCa). Elle a été diffusée entre novembre 2019 et février 2021 et a obtenu 496 réponses complètes. Elle fournit une synthèse des pratiques des Données de Recherches à un stade amont, avant que les établissements ne mettent en œuvre des politiques de sensibilisation fortes.

  • Le projet propose un référentiel de questions réutilisables dans le but de faciliter les analyses comparatives.
  • Les données anonymisées sont accessibles en ligne et les réponses des deux universités apparaissent très similaires.
  • Les résultats montrent une globale méconnaissance des répondants concernant les politiques de données de recherche dans un contexte de science ouverte.
  • Les pratiques sont marquées par les champs disciplinaires et le partage de données demeure encore peu développé malgré une volonté plutôt favorable sur le principe. Des freins viennent limiter cette concrétisation (nature des données, ressources nécessaires etc.).

Les données de cette enquête sont disponibles sur Recherche Data Gouv : https://doi.org/10.57745/BIC6MB

2022, Résultats de l’enquête « Les données de la recherche à l’université Paris-Saclay, panorama et perspectives », Université Paris-Saclay

Mireille Brenel, Cédric Mercier, Stela Suhan, Adib Kassas, Claire Ménard, et al.. Rapport d’analyse – Enquête : « Les données de la recherche à l’université ParisSaclay, panorama et perspectives ». Université Paris-Saclay. 2022. https://universite-paris-saclay.hal.science/hal-03857804

Cette enquête est proposée par l’ensemble du réseau des bibliothèques et centres de documentation et le Comité de pilotage de la Science Ouverte de l’Université Paris-Saclay en 2021. Elle s’adressait à tous les chercheurs, ingénieurs de recherche et d’études, doctorants ou encore personnels administratifs de l’ensemble de l’université, en somme toutes personnes amenées à créer, manipuler, utiliser des données, et ce dans tous les établissements de l’Université. L’enquête répond à un triple objectif :

  • Établir un panorama des données produites au sein de l’Université
  • Dresser le paysage des pratiques autour des données de la recherche
  • Connaître les besoins des chercheurs autour des données pour adapter et améliorer l’offre de services.

Les 513 réponses et les 24 entretiens qualitatifs mettent en lumière que :

  • 47% des répondants n’ont pas connaissance des directives et recommandations nationales ou internationales en terme d’ouverture des données
  • 66,3% des répondants ne savent pas ce qu’est un DMP. Pour ceux qui en ont déjà rédigé, l’exercice leur a paru majoritairement chronophage
  • Le frein principal à l’ouverture des données est le plagiat
  • S’agissant des besoins, la mise à disposition d’un entrepôt institutionnel est plébiscitée à 81%, suivi par la demande de conseils et accompagnements spécialisés, puis les conseils juridiques et l’assistance technique informatique.

Les résultats de cette enquête ont permis de conclure que les services proposés doivent couvrir l’ensemble des enjeux liés à la gestion des données, tout en s’adaptant aux spécificités des disciplines et des projets de recherche. Les services déployés via l’Atelier de la donnée ont vocation à répondre à ce besoin, et un point d’attention devra être porté à la communication et la connaissance de ces services par nos communautés de recherche.

Les données de cette enquête sont disponibles sur Recherche Data Gouv : https://doi.org/10.57745/TNLKLF

2022, Enquête auprès de chercheurs de l’université Paul-Valéry Montpellier 3

Usages et pratiques en lien avec les données de recherche. Une enquête menée auprès des chercheurs de l’université Paul-Valéry Montpellier 3, Hans Dillaerts  Céline Paganelli  Lise Verlaet Hugo Catherine. https://hal.archives-ouvertes.fr/halshs-02902710

Cette enquête s’inscrit dans le cadre du projet de recherche « Science ouverte et données de la recherche en SHS : entre politiques d’incitation et pratiques de la communication scientifique, quelle place pour les institutions et les bibliothèques ? » qui visait à recueillir les usages et pratiques des chercheurs de l’université en matière des données de recherche et les pratiques institutionnelles, notamment celles des professionnels de l’IST au sein des bibliothèques universitaires. Une enquête quantitative a ainsi été conduite en 2019 sur les pratiques et les usages des chercheurs de l’université Paul-Valéry Montpellier 3 en lien avec les données de recherche.

Les résultats s’appuient sur 81 réponses : une majorité de maître de conférences ; d’enseignants-chercheurs ayant moins de 16 ans d’expérience professionnelle  ; dont un tiers ont déjà porté un projet de recherche financé.

Les résultats montrent :

  • Une méconnaissance des politiques en matière des données de
    recherche ;
  • Une méconnaissance des outils et services préconisés par les
    professionnels de l’information-documentation ;
  • Des freins multiples en matière de
    réutilisation et de mise en libre accès des données de
    recherche ;
  • Le portage de projets financés participe à une meilleure connaissance des politiques et des outils.

2022, Enquête données du CNAM

Bertram Marie-Liesse. Gestion et ouverture des données de la recherche : pratiques, représentations, besoins. Rapport de l’enquête réalisée en 2022 au Conservatoire national des arts et métiers. Octobre 2022. https://doi.org/10.5281/zenodo.7234643

Menée sur l’année universitaire 2021-2022 par la Direction des bibliothèques et de la documentation du Cnam, cette enquête a permis de recueillir les réponses de 152 chercheur·euses et doctorant·es.

Points clés :

  • Une formation générale aux enjeux liés aux données apparait comme le préalable nécessaire à l’expression de besoins plus précis par les communautés de recherche ;
  • Les volumes de données sont hétérogènes entre les laboratoires, mais aussi entre les chercheur·euses au sein d’un même laboratoire ;
  • 39% des répondant·es gèrent des données personnelles ; l’assistance juridique arrive en deuxième place des besoins exprimés par les répondant·es ;
  • 85% des répondant·es n’ont jamais publié de données en libre accès mais 68% des répondant·es indiquent être prêt·es à le faire ;
  • L’aide à la rédaction de PGD arrive en dernière place des besoins exprimés avec 20% des répondant·es considérant cette proposition comme une priorité, et 25% indiquant n’être pas intéressé·es par un tel accompagnement.

Une infographie revenant sur les résultats de l’enquête a également été publiée.

2022, Résultats de l’enquête Données de l’UGA

Cellule Data, Université Grenoble Alpes. Rapport sur l’enquête sur les usages et les besoins pour la gestion des données de la recherche sur le site de l’Université Grenoble Alpes. 2022. https://scienceouverte.univ-grenoble-alpes.fr/wp-content/uploads/2022/05/enquete_donnees_UGA.pdf 

De fin 2020 à début 2021, la Cellule Data Grenoble Alpes (service d’accompagnement à la gestion des données de la recherche) a lancé une enquête au sein de la communauté scientifique de l’Université Grenoble Alpes sur les pratiques autour des données de la recherche. L’objectif était d’identifier les usages et les besoins concernant la gestion des données de la recherche de façon à adapter l’accompagnement, notamment dans le contexte national et international sur la science ouverte qui évolue très rapidement. 877 réponses au total ont été recueillies en quelques mois.

Les résultats ont été publiés courant 2022 et font ressortir les éléments suivants :

  • Les outils institutionnels sont insuffisamment connus, en particulier pour le stockage et le traitement des données, et sont parfois mal adaptés à l’ensemble des usages.
  • Des pratiques restent problématiques concernant les enjeux de souveraineté et de protection des données et du patrimoine scientifique.
  • La réutilisation de données existantes n’est pas simple (pour 80% des répondants), car les principes FAIR ne sont pas assez respectés.
  • L’action de diffuser des données comme un produit de recherche à part entière n’est pas encore intégré dans le processus de recherche (seulement 41% des répondants ont déjà diffusé des données).
  • Les plan de gestion des données (PGD) ne sont pas assez intégrés dans la pratiques de la recherche au quotidien.
  • Les besoins exprimés tournent principalement autour de la formation et de l’aide personnalisée.

Dans le cadre des ateliers de la donnée de Recherche Data Gouv, les résultats de cette enquête permettent d’adapter les actions de la cellule aux pratiques actuelles des scientifiques. Ils conduisent à poursuivre les efforts en ce qui concerne l’information autour des outils et services déjà existants, et confortent également la nécessité de renforcer l’accompagnement, en particulier en direction des doctorants et jeunes chercheurs.

Le rapport complet est à lire ici : https://scienceouverte.univ-grenoble-alpes.fr/donnees/enquete-donnees-uga-2021/

2022, Résultats de l’enquête sur les usages et les besoins pour la gestion des données de la communauté des mathématiques

GT Données inter-réseaux RNBM et Mathrice. Résultats de l’enquête sur les usages et les besoins pour la gestion des données de la communauté des mathématiques. Mars 2022. https://www.rnbm.org/wp-content/uploads/2022/04/EnqueteGTDonnees.pdf

Cette enquête a été proposée par le groupe de travail inter-réseau Mathrice-RNBM entre octobre et novembre 2021. Son objectif était de mieux comprendre les usages et les besoins spécifiques de la communauté des mathématiques concernant les données de la recherche et les codes de recherche. Le rapport propose également des recommandations afin de répondre aux problématiques exprimées.

Points clés :

  • Grande hétérogénéité entre les disciplines des mathématiques sur le fait ou non de manipuler des données. Certaines thématiques ne sont clairement pas concernées.
  • Au sujet des données de recherche, le concept d’entrepôt de données est peu connu, de même que les Plans de Gestion de Données.
  • La problématique des codes de recherche est beaucoup plus partagée, même si elle est souvent associée aux questions des données.
  • L’activité autour des codes de recherche est importante. Un point essentiel concerne l’ancrage dans le logiciel libre qui est extrêmement fort, tant sur l’utilisation des logiciels que sur la production de codes de recherche.
  • Le partage est très intégré dans les pratiques, partage vers sa communauté, mais également plus largement avec une conscience des enjeux d’ouverture bien présente. Si la notion de partage fait partie du processus de recherche, celui-ci n’est pas forcément formalisé et il concerne majoritairement les codes. La question des licences doit être adressée car il est nécessaire de faire évoluer certaines pratiques de partage sans licence.
  • La citation des logiciels utilisés dans les publications, si elle est présente, et encore loin d’être majoritaire.
  • Il existe également dans la communauté une sensibilité forte sur la reproductibilité des résultats de recherche.
  • Les besoins d’accompagnement et de formations sont très généraux, tant sur les données que sur les codes, et concernent l’ensemble des problématiques posées.

2021, Université Claude Bernard Lyon 1 et Université Grenoble Alpes

Marie-Emilia Herbet, Léonard, Jérémie, Santangelo Maria-Grazia, Albaret Lucie. Dissimuler ou disséminer ? Une étude sur le sort réservé aux résultats négatifs. Septembre 2021. https://doi.org/10.5281/ZENODO.5541589.

Cet article est le fruit d’une enquête menée d’avril à juin 2021 sur l’enjeu des résultats dits « négatifs », relatifs aux expériences scientifiques dont les conclusions, infructueuses ou inattendues, sont rarement (voire jamais) publiées. Lancé dans le cadre du projet Datacc porté par les BU de Lyon 1 et Grenoble et soutenu par le GIS CollEx-Persée, ce travail d’analyse vise à mieux cerner le rapport entretenu par les chercheurs vis-à-vis de ce type de données, en vue de la mise en place d’un portail visant à améliorer leur diffusion. L’enquête a un caractère volontairement disciplinaire puisqu’elle s’attarde principalement sur les pratiques des chercheurs en chimie, physique, sciences de l’environnement et sciences de l’ingénieur, domaines pour lesquels l’enjeu des résultats négatifs est particulièrement sous-documenté. 310 réponses complètes ont été reçues, principalement issues de chercheurs affiliés à des établissements français de l’ESR.

Les principaux points-clés à retenir sont :

  1. 81% des chercheurs interrogés estiment avoir déjà produit des résultats ‘négatifs’ pertinents.
  2. Seuls 12,5% des sondés sont parvenus à publier des résultats négatifs dans des revues.
  3. 77% des sondés soutiennent l’idée de création d’un portail permettant de valoriser et de partager des résultats négatifs. Les chimistes, les chercheurs en sciences de l’environnement et les doctorants y sont particulièrement favorables.
  4. 75,2% des sondés adhèrent à l’idée de partager leurs données négatives, 18,7% sont indécis et 6,1% y sont opposés.
  5. Faute de diffusion adéquate, près  de  30% des  répondants  rapportent  avoir  découvert qu’une autre équipe avait effectué les mêmes expériences aboutissant aux mêmes résultats infructueux.
  6. Le manque de temps et la complexité de restitution et d’interprétation des résultats négatifs sont identifiés comme les freins principaux à leur diffusion.

2021, Données de la recherche : pratiques et besoins dans un laboratoire pluridisciplinaire SHS

Anne Bonneville, Ingrid Tucci, Antoine Vion, et Laurent Giglio. 2021. « Données de la recherche : pratiques et besoins dans un laboratoire pluridisciplinaire SHS ». Laboratoire d’Économie et Sociologie du Travail (LEST). https://hal.archives-ouvertes.fr/hal-03265603.

Ce rapport est issu d’une enquête menée au sein du Laboratoire d’Économie et de Sociologie du Travail (LEST) de 2019 à 2020. Elle visait à dresser un état des lieux des pratiques et besoins de sa communauté (chercheur·es, enseignant·es-chercheur·es, doctorant·es). Il s’agissait également, sur la base des résultats, d’engager une réflexion collective sur les ressources et l’accompagnement à mettre en place dans le nouveau contexte de la Science Ouverte et de la réglementation sur les données (RGPD). Pour cela, un questionnaire en ligne a été administré aux membres du laboratoire et des focus groups ont été menés avec deux groupes de chercheur·es en fonction de leur approche méthodologique dominante et indépendamment de leur discipline. Un troisième focus group a été organisé avec les doctorant·es. Cette enquête conduit à un ensemble de préconisations dans une perspective d’élaboration d’une politique des données de recherche pour la communauté pluridisciplinaire du laboratoire.

2020, CIRAD

Deboin Marie-Claude. 2020. Bilan d’enquête sur la pratique de plan de gestion de données (PGD) au Cirad. Montpellier, France : CIRAD, 30 pages + annexe.
https://doi.org/10.18167/agritrop/00574

Cette enquête en ligne visait à dégager des leçons de la pratique des plans de gestion de données (PGD) au Cirad pour orienter ou faire évoluer la stratégie institutionnelle en gestion et valorisation de données.

Sur les 372 réponses complètes :

  • 96% des répondants sont du Cirad, 75% sont dans une UR
  • 52% ne savent pas ce qu’est un PGD (51% dans les unités de recherche)
  • 22% ont participé à la rédaction d’un PGD
  • 64% des répondants ayant participé à la rédaction d’un PGD déclarent que celui-ci a été conservé
  • 72% indiquent que les PGD rédigés n’ont pas été déposés dans une base de données
  • 57% disent avoir partagé avec des collègues certains ou tous les PGD
  • 82% indiquent que leurs PGD ne sont pas accessibles sur internet.
  • Les observations des répondants expriment un besoin d’information, de formation, et la nécessité de ressources humaines, financières et techniques dédiées aux PGD
  • Les questionnements portent sur les données, leur gestion, stockage, archivage et diffusion.

2019, Enquête auprès des enseignants-chercheurs et des professionnels de l’IST à Aix Marseille Université

Caroline Sophie Donati. Données de la recherche : Quelles pratiques ? Quels besoins ? Enquête à Aix-Marseille Université. [Rapport de recherche] Aix Marseille Université. 2019. ⟨hal-02493679⟩ https://hal-amu.archives-ouvertes.fr/hal-02493679 

En 2018, Aix Marseille Université (AMU) investit le champ des données de la recherche et lance le projet d’établissement “données de la recherche”. Piloté par la cellule Science Ouverte du SCD, ce projet entame une réflexion sur la manière de développer une culture de la gestion des données de recherche à l’échelle de l’établissement. 

Première étude du genre à AMU, cette enquête se pose en pilier du plan d’actions lancé au printemps 2019. 

Disponible de mi-juin à mi-septembre 2019, elle est composée de deux formulaires à destination de la communauté scientifique d’Aix-Marseille Université :

  • 36 questions, pour les enseignant-chercheurs (EC) ;
  • 33 questions à l’attention des personnels de l’information scientifique et technique (IST).

L’objectif était, sur un temps très court, de déterminer si les démarches entreprises correspondaient aux attentes et aux questionnements de nos collègues face à ces nouvelles injonctions. 

Quelques mots clés : 

  • Manque de communication et/ou d’intérêt ;
  • Sujet méconnu (rappel : nous sommes en 2019 !) ;
  • Absence d’offre institutionnelle pour le stockage (comblé avec le DataCenter Sud) ;
  • Une communauté plutôt favorable mais inquiète ;
  • Des métiers et compétences IST non reconnus, voire méprisés ;
  • Nécessité d’un cadre, d’un soutien politique ;
  • Besoin d’informations, de communication et d’accompagnement ;
  • En demande des solutions techniques et informatiques (fait avec le Centre de Formation et de Soutien aux Données de la Recherche – CEDRE)

Cette enquête a consolidé le projet et a permis officiellement de lancer les démarches autour de la sensibilisation, l’accompagnement, la reconnaissance des acteurs locaux et nationaux. 

AMU s’est par la suite dotée d’une charte en faveur de la Science Ouverte. Le soutien de la gouvernance a facilité toutes les démarches auprès des partenaires en interne comme en externe.

2019, UMR AAU : Ambiances Architectures Urbanités (Nantes/Grenoble)

Laurence Bizien, Léa Mosnier, Françoise Acquier, Véronique Dom. Les données de la recherche AAU

Cette enquête quantitative menée en 2019 auprès des deux équipes (CRENAU à Nantes, CRESSON à Grenoble) constituant le laboratoire AAU a permis d’amorcer la mise en œuvre d’une politique de sensibilisation et d’accompagnement à la question des données. Elle s’est inspirée des enquêtes de plusieurs universités, en adaptant les questionnaires aux données collectées et traitées dans un laboratoire de recherche architecturale et urbaine, fortement interdisciplinaire. L’unité a publié en mars 2021 son engagement pour la Science ouverte.

Les principaux résultats ont fait l’objet d’une synthèse : https://labedoc.hypotheses.org/5990
Nos engagements pour la Science Ouverte : https://aau.archi.fr/laboratoire-aau/engagement-science-ouverte/

2018, École des Ponts ParisTech

Cette enquête, sous la forme d’un questionnaire en ligne, a été lancée en 2018 auprès des chercheurs, doctorants et ingénieurs des laboratoires de l’École des Ponts ParisTech. Nous avons recueilli les réponses de 218 chercheurs issus de 12 laboratoires. Les objectifs de cette enquête étaient d’obtenir une vue plus globale des pratiques d’Open Science au sein des laboratoires de l’École des Ponts, de mieux identifier (et faire identifier) les données de la recherche disponibles, d’interroger sur la connaissance des DMP et des entrepôts, et de découvrir les habitudes de partage et de valorisation de données.

Les résultats de cette enquête ont notamment été diffusés avec un poster (https://espacechercheurs.enpc.fr/sites/default/files/Poster%20Data.pdf) réalisé à l’occasion de l’Open Access Week 2018 et avec l’envoi d’une newsletter en janvier 2019 (https://ymlp.com/zmkzPJ).

Voici quelques grandes conclusions de cette enquête :

  • il a été impossible de dégager un profil type et des pratiques communes : le Pôle IST développe donc des actions à la carte !
  • le code informatique n’était pas souvent reconnu comme étant une donnée à partager ;
  • en 2018, 20% seulement des répondants savaient ce qu’était un DMP ;
  • 23 % des répondants ont déclaré avoir déjà perdu des données de façon irrémédiable ;
  • à peine 10% des répondants avaient déjà partagé des données via un entrepôt.

Suite à l’enquête, le Pôle IST a organisé des ateliers de formation au dépôt de jeux de données et a accompagné la rédaction de plusieurs DMP.

Le Pôle a ensuite creusé la question du cadre juridique des données de la recherche (https://jnso2018.sciencesconf.org/data/pages/Analyse_synthetique_du_cadre_juridique.pdf)

2018, Université de Lille

Joachim Schöpfel. Vers une culture de la donnée en SHS : Une étude à l’Université de Lille. [Rapport de recherche] Université de Lille. 2018. ⟨hal-01846849⟩ https://hal.archives-ouvertes.fr/hal-01846849

Conduite sous forme d’entretiens avec 51 chercheurs, doctorants, responsables de laboratoires, chefs de projets et ingénieurs en charge de données, l’étude avait trois objectifs : (Re)Mettre les enseignants-chercheurs au cœur de la mise en œuvre de l’écosystème de la science ouverte, identifier des opportunités et verrous pour une politique de données, et déterminer un cadre pour développer la culture de données sur le campus. Menée comme un audit sur le campus SHS de l’Université de Lille, l’étude avait une portée pragmatique: dégager les éléments indispensables pour une politique cohérente de la production, gestion et réutilisation des données de la recherche sur un campus en sciences humaines et sociales, et contribuer ainsi à l’appropriation du concept de la science ouverte par une « mise en culture de la donnée, qui effectue une mise en sens d’usages disséminés et spécialisés de données ouvertes ». Les résultats dessinent un paysage contrasté, avec quelques constats significatifs (une préoccupation de la sécurité des données et des systèmes, une communication compliquée, plusieurs niveaux de gouvernance, un continuum de pratiques, des incitations et des verrous, etc.). L’enquête a abouti à dix recommandations pour la mise en œuvre d’une politique de données sur un campus SHS :

  1. Mettre en place un pilotage scientifique
  2. Investir d’une manière ciblée
  3. Viser les projets, pas les laboratoires
  4. Utiliser les plans de gestion comme levier
  5. Apporter des réponses aux contraintes de sécurité
  6. Apporter des réponses aux besoins de communication
  7. Apporter des réponses aux besoins de curation
  8. Proposer plusieurs solutions pour la conservation des données
  9. Institutionnaliser le lien avec la TGIR Huma-Num
  10. Soutenir les bonnes pratiques

L’essentiel de cette proposition tient en trois points :

  1. Mettre en place un pilotage scientifique, pour une coordination des actions et services de l’ensemble des acteurs (services centraux et communs, structures de recherche, composantes etc.).
  2. Concentrer la politique sur certaines actions ciblées, en tenant compte des priorités des chercheurs et en mettant l’accent sur les projets de recherche (H2020, ANR etc.).
  3. Positionner la démarche clairement au sein des infrastructures nationales et européennes en SHS, en particulier par une institutionnalisation des liens avec la TGIR Huma-Num.

L’étude a été menée par le laboratoire GERiiCO, avec un financement par la MESHS et par le Conseil Régional Hauts-de-France.

2018, Université de Montpellier

Philippe Amiel, Francesca Frontini, Pierre-Yves Lacour et Agnès Robin, Pratiques de gestion des données de la recherche : une nécessaire acculturation des chercheurs aux enjeux de la science ouverte ?, Cahiers Droit, Sciences & Technologies, 2020, doi.org/10.4000/cdst.2061

Cette enquête quantitative a été menée en 2018 auprès de tous les chercheurs et ingénieurs de recherche actifs de laboratoires académiques dans toutes disciplines, au sein du bassin montpelliérain. Elle a pris la forme d’un questionnaire auto-administré en ligne et a recueilli 159 réponses complètes. L’objectif de l’enquête était de documenter les pratiques des chercheurs, de comprendre leurs relations aux données et d’avoir un panorama des compétences des chercheurs à l’égard du droit des données. Les grandes conclusions de cette enquête sont les suivantes :

  • Le stockage des données est avant tout une affaire individuelle ;
  • Une faible minorité utilise des normes et standards pour gérer les données ;
  • Le droit des données est largement méconnu ; 
  • Le sentiment de propriété des auteurs sur leurs données est fort ;
  • Le partage des données diffère beaucoup d’une discipline à une autre ;
  • La stratégie de gestion des données reste globalement impensée.

2018, Université Bordeaux Montaigne

Julie Duprat. Les données de la recherche à l’Université Bordeaux Montaigne : Synthèse d’une enquête qualitative auprès des chercheurs. [Rapport de recherche] Université Bordeaux Montaigne. 2019, hal-02020141

Cette enquête qualitative analyse des entretiens menés en 2018 auprès de 32 enseignants-chercheurs et 4 personnels d’appui à la recherche (personnels ITRF) en Sciences Humaines et Sociales. La quasi-totalité des unités de recherche de l’Université Bordeaux-Montaigne a ainsi pu être rencontrée. L’objectif de l’enquête était de recenser les besoins des chercheurs avant la mise en place d’un service d’accompagnement aux données de la recherche. Les grandes conclusions de cette enquête sont les suivantes :

  • Les documents textuels, les archives, les documents graphiques et les entretiens sont les principales données des chercheurs en SHS ;
  • Le stockage des données est avant tout individuel, mais une gestion collective des données est progressivement mise en place dans les UMR ;
  • Le travail collaboratif sur les données reste globalement impensé ;
  • Le partage des données entre chercheurs existe, mais n’est pas une pratique clairement établie ;
  • Le cadre juridique des données est largement méconnu ;
  • Les chercheurs demandent des référents pour les données de la recherche et des formations.

2017, Université Libre de Bruxelles

Groupe de Travail Gestion des Données de la Recherche, Résultats de l’enquête sur les usages des chercheurs de l’Université Libre de Bruxelles (ULB) en matière de gestion des données de recherche, 2017, http://gdr.ulb.ac.be/stat_survey.html 

Cette enquête quantitative menée en 2017 à l’Université Libre de Bruxelles, par le Groupe de travail des Données de la Recherche, reprend comme modèle l’enquête autrichienne intitulée  “Researchers and Their Data. Results of an Austrian Survey – Report 201510.5281/zenodo.34005. L’enquête de l’ULB avait trois objectifs : préciser les besoins des chercheurs de l’institution ; légitimer les propositions du groupe de travail ; identifier les chercheurs déjà sensibles au sujet. Avec les 161 réponses récoltées, il ressort notamment que :

  • Les chercheurs produisent majoritairement un volume de données inférieur à  50 Go ;
  • 46 % des répondants ont déjà subi une perte de leurs données ;
  • Les deux premiers moyens de sauvegarde sont les disques locaux et les services de cloud. 

Les résultats ont aussi permis d’identifier 3 piliers centraux pour le développement de la gestion des données de la recherche dans l’Université : la définition d’une politique institutionnelle, la mise en place d’infrastructures et la mise en place de services à destination des chercheurs.

2017, Université de Rennes 2

Alexandre Serres, Marie-Laure Malingre, Morgane Mignon, Cécile Pierre, Didier Collet. Données de la recherche en SHS. Pratiques, représentations et attentes des chercheurs : une enquête à l’Université Rennes 2 : Rapport ; Annexe 1 : Résultats de l’enquête statistique ; Annexe 2 : Croisements statistiques ; Annexe 3 : Extraits des entretiens ; Synthèse des résultats.. [Rapport de recherche] Université Rennes 2. 2017, 159 p., 47 p., 114 p., 26 p., 23 p. ⟨hal-01635186v2⟩

Cette enquête quantitative et qualitative menée en 2017 auprès des enseignants-chercheurs en SHS de l’université Rennes 2 avait pour objectif de dresser l’état des lieux des pratiques, représentations et attentes liées aux données de la recherche afin d’élaborer une offre de services et de proposer une réflexion sur les pratiques informationnelles des chercheurs.

L’analyse des réponses a permis d’établir  :

  • la spécificité et la diversité des données en SHS
  • des solutions de stockage et d’archivage encore insatisfaisantes
  • de nouveaux besoins d’accompagnement pour les chercheurs face à la complexité croissante des questions juridiques liées aux données
  • l’écart entre les déclarations d’intention, les représentations et les pratiques de gestion des données, notamment pour leur partage
  • l’importance du facteur disciplinaire

Les résultats ont permis de dégager 6 recommandations :

  • Créer un groupe de travail chargé de la réflexion sur une politique des données de recherche
  • Développer des services mutualisés pour la sensibilisation et la formation
  • Proposer un service juridique spécialisé
  • Mieux adapter les espaces internes de stockage des données de recherche aux besoins individuels et collectifs des chercheurs
  • Sensibiliser à la description des jeux de données et à la rédaction des PGD
  • Sensibiliser aux solutions institutionnelles de partage et d’archivage des jeux de données

2015, Université de Lausanne

Carmen Jambé. La gestion des données de recherche à l’Université de Lausanne : enjeux transdisciplinaires. [Mémoire de Bachelor] Haute école de gestion de Genève. 2015, doc.rero.ch/record/258023

Cette enquête quantitative menée en 2015 à l’Université de Lausanne (Suisse) est spécialisée dans les sciences humaines et sociales. L’objectif de l’enquête était de dresser un état des lieux global sur les pratiques des chercheurs en matière de gestion de données de la recherche. Les 315 réponses récoltées permettent de relever notamment que :

  • Seuls 12 % des répondants ont déjà réalisé un plan de gestion de données ;
  • Les deux premiers moyens de stockage sont des solutions locales (ordinateur puis disque dur externe) ;
  • 60 % des producteurs de données sont favorables à leur partage ;
  • 90 % des répondants n’ont pas suivi de formation. 

Suite à l’enquête, un projet pilote a été monté autour des “gestion des données de la recherche”, qui a lui-même contribué à établir la stratégie science ouverte de l’université.

2015, Université de Lille 3

Hélène Prost, Joachim Schöpfel. Les données de la recherche en SHS. Une enquête à l’Université de Lille 3 : Rapport final. [Rapport de recherche] Lille 3. 2015. ⟨hal-01198379⟩ https://hal.univ-lille.fr/hal-01198379

L’Université de Lille 3 a réalisé en 2015 une étude sur les pratiques, besoins et attentes en matière de gestion des données de la recherche auprès de son personnel scientifique. L’étude a été pilotée par le laboratoire GERiiCO et le SCD de Lille 3. Elle faisait partie d’une démarche concertée en faveur de la gestion et du partage des données de la recherche mise en œuvre à partir de 2013, avec plusieurs analyses, séminaires et publications. L’enquête avait été préparée avec l’Université Humboldt de Berlin. Le questionnaire contenait 22 questions et a été mis en ligne en avril et mai 2015. Il a reçu 270 réponses (taux de réponse 15%). Toutes les disciplines étaient représentées, ainsi que toutes les catégories des personnels scientifiques. Quelques résultats :

  • Les personnes interrogées décrivent un large éventail de données sources et de données produites (surtout des corpus et données textuels).
  • Le stockage en local (ordinateur personnel ou professionnel) est de loin le mode de sauvegarde privilégié.
  • 36% des répondants ont déjà pratiqué, d’une manière ou d’une autre, le partage des données.
  • 5-10% indiquent qu’ils n’ont pas l’intention de partager leurs données à l’avenir ; 30% manquent d’information et de connaissance concernant le partage des données de la recherche.
  • En tête de la liste des besoins figure l’espace d’archivage sécurisé et fiable pour ses propres données, suivi des conseils pour la gestion, des conseils techniques (normes, métadonnées etc.) et des conseils juridiques (autour de 50%).

Les résultats ont été analysés par rapport aux disciplines et statuts des personnes interrogées. Ils ont été également comparés avec les résultats de trois autres enquêtes (Berlin, Strasbourg, LIBER Europe). A l’issue de l’enquête, nous avons mené des interviews avec un échantillon restreint d’enseignants-chercheurs, de doctorants et d’ingénieurs pour mieux connaître certains pratiques et besoins et aussi, pour valider les résultats de l’enquête et faire quelques recommandations pour une politique de données sur un campus SHS (cf. enquête 2018).