Huma-Num
Février 2024
Votre unité d’appui à la recherche
L’IR* Huma-Num est une infrastructure qui accompagne les pratiques numériques des différentes disciplines des SHS. Son organisation repose sur la mise en œuvre d’un dispositif technologique qui s’appuie sur un réseau de partenaires et d’opérateurs scientifiques à l’échelle nationale et européenne.
Ce dispositif repose sur un ensemble de technologies d’infrastructures et de services informatiques pour mutualiser, diffuser, signaler et stabiliser l’accès aux données et documents numériques produits par les équipes de recherche.
Les services d’Huma-Num sont accessibles aux projets de recherche scientifique en SHS. Ils sont ouverts à l’ensemble de la communauté universitaire nationale en France et à l’étranger. Aujourd’hui, Huma-Num gère 22 000 comptes utilisateurs, héberge 961 projets, 1200 bases de données et 440 machines virtuelles. Le service de stockage sécurisé contient 1500 To de données. L’entrepôt NAKALA contient 700 000 jeux de données déposés par 2290 chercheurs.
D’où vient le besoin de créer une infrastructure spécialisée sur les données de la recherche ?
Huma-Num a été créée en 2013 en tant que très grande infrastructure de recherche (TGIR, labellisée IR* en 2022). Son objectif initial était d’accompagner les communautés scientifiques dans la création, la gestion, le partage, le signalement des données en SHS. Les besoins couverts découlent de la reconnaissance croissante des méthodes numériques et des technologies de l’information dans la recherche en SHS, ainsi que de la place centrale des données dans la production scientifique.
Huma-Num propose une infrastructure technique fournissant des services associés à des formations et du conseil afin d’aider les chercheurs à traiter leurs données et documents de manière efficace, tout en respectant les normes documentaires, éthiques et les bonnes pratiques de leurs communautés de recherche.
Initialement, le besoin principal était de sécuriser des données souvent stockées sur des supports non pérennes, voire fragiles, et rarement accessibles ou signalées. Cela a conduit à la création de l’entrepôt NAKALA. Puis, il est apparu rapidement que préserver simplement les données brutes n’était pas suffisant. Il convient d’apporter un écosystème de services numériques tout au long du cycle de vie des données et de leurs traitements.
Pour développer ces services, Huma-Num bénéficie des retours d’expériences de communautés scientifiques, les Consortiums-HN, associés à l’expertise de ses partenaires comme le Centre informatique national de l’enseignement supérieur (CINES) pour la préservation pérenne. En outre, l’Huma-Num Lab organise la réflexion prospective sur les dynamiques et les évolutions des pratiques afin de pouvoir anticiper la création de nouveaux services numériques et d’adapter ceux existants pour des usages futurs.
Aujourd’hui, Huma-Num propose un ensemble de services dont l’élément central est l’entrepôt NAKALA, conçu pour permettre de publier des données documentées, d’en assurer la lisibilité dans le temps et de les partager en vue de leur réutilisation. Ces caractéristiques ont permis de faciliter la mise en œuvre des principes FAIR en SHS, constituants principaux de la science ouverte.
Depuis quand votre centre accompagne la gestion des données ? Comment s’est constitué ce service ?
En mettant en place des services utiles tout au long du cycle de vie des données, les équipes d’Huma-Num ont naturellement toujours proposé de l’accompagnement, du support et du conseil pour l’utilisation de leurs services, mais aussi pour l’utilisation des principaux standards de l’information scientifique et technique (IST) tel que notamment l’OAI-PMH, les vocabulaires de métadonnées et les ontologies. La nécessité de structurer et de mieux identifier des fonctions métiers dédiées à l’accompagnement dans l’unité sont nées de la volonté d’améliorer la qualité des données produites et hébergées dans les différents services. L’émergence du concept de FAIRisation des données encourageait également ce développement.
En 2020, un pôle d’accompagnement a donc été créé au sein de l’infrastructure. Il permet d’orienter les choix de formats, de référentiels et d’organisation en vue de la publication de jeux de données qui respectent des critères de qualité permettant d’en assurer la traçabilité, la citation, le signalement et donc la découvrabilité.
Plus récemment, les enjeux de l’accompagnement ont donné lieu au déploiement de l’initiative Recherche Data Gouv. Depuis, de nouveaux interlocuteurs et de nouveaux enjeux sont apparus pour Huma-Num. Aujourd’hui les quatre ingénieurs du pôle interviennent sur l’accompagnement, la formation des utilisateurs, mais aussi sur l’amélioration de la qualité des données et des services fournis par Huma-Num.
Comment accompagnez-vous les chercheurs ?
Chaque semaine les différents pôles d’Huma-Num analysent les demandes de besoins de services de manière collégiale sur les aspects scientifiques, institutionnels, documentaires et informatiques afin d’apporter une réponse adaptée tout en permettant de rationaliser et mutualiser les moyens mis en œuvre.
Les réponses peuvent inclure une redirection vers un support et un service plus local (en région, ou au sein d’universités). Généralement, un simple échange de message avec les porteurs de projets permet de préciser la demande, et en cas de besoin, une réunion est organisée pour éclaircir certains points.
Pour répondre plus largement aux principaux besoins des communautés, une documentation de chacun des services est en ligne et des formations sont proposées tout au long de l’année. Du point de vue de Huma-Num, il est indispensable d’associer les projets de recherche à la gestion de leurs propres données pour en maximiser l’efficacité dans le contexte spécifique des SHS. C’est la raison pour laquelle Huma-Num privilégie les échanges directs et les formations qui sont particulièrement importantes pour relever ce défi. Ils permettent également de répondre au mieux aux enjeux de la maîtrise des coûts et de l’empreinte carbone des pratiques numériques.
Quel lien avec les services support en local ?
Historiquement Huma-Num travaille avec les maisons des Sciences de l’Homme (MSH) afin de rencontrer régulièrement, avec un partenaire, les projets de recherche locaux. Depuis 2020, nous structurons un réseau de correspondants Huma-Num et de déploiement de l’infrastructure en région avec des personnels ingénieurs en humanité numériques qui travaillent en relais, au plus près des équipes et bien sûr en lien avec l’équipe d’Huma-Num.
Plus récemment avec le développement de Recherche Data Gouv, nous travaillons avec les ateliers de la donnée et nous développons des contacts avec les autres Centres de référence thématiques pour échanger sur nos pratiques mais aussi orienter plus efficacement des besoins de projets de recherche qui sont à l’intersection de plusieurs domaines.
Que représente le label “centre de référence thématique” de Recherche Data Gouv pour vous ?
Les « Centres de référence thématiques » de Recherche Data Gouv sont des structures spécialisées dans la gestion, la valorisation et la diffusion des données de recherche dans des domaines spécifiques.
L’expérience et les services fournis par Huma-Num contribuent à l’expertise nécessaire dans le domaine des SHS en associant une infrastructure informatique, des services numériques et des communautés. Ces communautés sont structurées en consortiums et réunissent différentes catégories de personnels d’unités et équipes de recherche françaises aux métiers variés (chercheurs, ingénieurs, archivistes, documentalistes, etc.), autour de thématiques et/ou d’objets scientifiques communs pour lesquels ils définissent des procédures et standards numériques partagés (eg. méthodes, outils, formation, partages d’expériences).
Aujourd’hui les 10 consortiums actifs couvrent un large panel de domaines d’expertise comme la science des textes, la spatialisation des données sonores en éco-acoustique, le traitement des données de géo-histoire spatialisées, les bonnes pratiques numériques pour les communautés archéologiques, la transition numérique des études moyen-orientales, africaines et asiatiques en France, l’outillage des recherches en SHS autour de corpus vidéo, la musicologie, les corpus de langage, la coordination des initiatives autour des usages de la 3D au sein du paysage scientifique SHS.
Présentez une action particulièrement importante du centre en matière d’accompagnement à la gestion des données.
Au cours de cette année 2023 plusieurs actions ont été réalisées à destination du réseau des Ateliers de la donnée de Recherche Data Gouv. En effet, la structuration de ce réseau a apporté à Huma-Num de nouvelles interactions avec des personnels d’appui à la recherche dans les établissements de l’ESR qui sont en situation d’aider à la gestion des données et notamment au dépôt et au signalement de données dans des entrepôts disciplinaires ou dédiés. Dans ce cadre de nouveaux besoins d’accompagnement de niveau intermédiaire ont été repérés : par exemple savoir identifier les services et bonnes pratiques du domaine ou mieux connaître les services d’Huma-Num.
Huma-Num a ainsi formé des personnels issus de 15 ateliers de la donnée à ses services et plus particulièrement à l’utilisation de l’entrepôt NAKALA lors de 2 séances de formation en ligne (« NAKALA découverte » et « NAKALA maîtrise »). Une fiche synthétique de description de NAKALA a été mise à disposition permettant ainsi de situer NAKALA dans le paysage des entrepôts de données de recherche en SHS. Enfin en collaboration avec le centre de ressource Doranum un annuaire descriptif de ressources pour les SHS a été créé.