MENU

Les métadonnées: quésaco

Littéralement, une métadonnée est une «donnée sur une donnée» ou encore une «information sur une donnée». Le préfixe ‘méta’ provenant du grec indique ici l’auto-référence. En pratique, une métadonnée contient des informations signifiantes qui permettent de faciliter l’accès au contenu d’une ressource (au sens le plus large, donnée spatialisée, protocole, site d’étude ..). Leur  potentiel est important, car lorsqu’elles sont structurées suivant des normes, elles peuvent faire interopérer les IDG entre-elles, ce qui a pour effet d’améliorer l’efficacité des recherches d’information.

A quoi servent les métadonnées ?

  • renseigner une ressource de façon précise, incluant par exemple les protocoles d’acquisition ou de traitement;
  • permettre son indexation et sa recherche de façon interopérable sur Internet;
  • indirectement, via les outils adaptés (type MapFisApp ou GeoCMS) de visualiser une ressource, en relation avec d’autres ressources venant d’Internet,
  • permettre aux personnes cherchant une ressource de savoir qui possède quoi et où;
  • après autorisation de partager la ressource, par exemple via un téléchargement.

Qu’y trouve-t-on ?

Suivant la norme choisie, certains éléments sont obligatoires, d’autres facultatifs ou même non-utilisés.
Une métadonnée est compatible avec une norme si les éléments obligatoires de cette norme sont fournis. Différentes normes ont été définies, par exemple la très générale Dublin Core, ou des normes spécialisées pour les données géographiques telles que les ISO 19115, 19139 ou INSPIRE.
Le cas des données spatialisées en recherche apporte des complexité supplémentaires n’existant pas dans les autres types de données. Schématiquement, mais de façon non-exhaustive, les attributs suivants sont attendus

  • contenu : titre, sujet, description, source, langue,
  • propriété intellectuelle : créateur, éditeur, contributeur, tutelles, droits,
  • la définition la plus précise de la ressource, via des mots-clés,
  • la chronologie (date, version),
  • les échelles d’espace et de temps (précision, fréquence d’acquisition),
  • la qualité de la ressource,
  • les publications à citer,
  • le processus d’acquisition et de transformation qui a été mis en œuvre,
  • matérialisation : date, type, format, emprise, systèmes de coordonnées.

Structuration des métadonnées

Pour un projet d’envergure, le gros volume de données différentes nécessite de structurer les métadonnées en les reliant entre elles. On pourra par exemple avoir à définir:

  • une métadonnées de projet/site;
  • des métadonnées pour chaque donnée;
  • des métadonnées pour chaque chronique temporelle;
  • des métadonnées pour chaque protocole d’acquisition, appareillage, ou traitement utilisé;
  • des métadonnées différentes entre donnée brute et donnée interprétée.

Cela peut paraitre lourd à gérer, mais on notera que, d’une part, cela fait partie de la gestion d’un projet, et d’autre part, cela rassemble des informations fondamentale classiquement exigées dans toute publication scientifique.

Problèmes rencontrés

Un des problèmes est de définir un noyau d’informations standards (norme utilisée, thésaurus, langues), l’ensemble des données possibles étant vaste. De plus, les métadonnées peuvent être subjectives et dépendantes du contexte, ce qui rend difficile leur exploitation. Pour les documents multilingues, il faut assurer la traduction des métadonnées, ce qui accroît la complexité et les risques. La création des métadonnées peut donc être dans certains cas décourager un utilisateur de par la complexité de la tâche et le temps que cela peut requérir. Cependant, ces problèmes sont surtout rencontrés au démarrage de l’entrée des métadonnées. Avec la pratique, et notamment la mise en place de templates propres à un projet donné, le travail devient beaucoup plus simple et plus rapide.