Langage de définition de documents - Spé Systèmes d'Information de Gestion - Terminale STMG

Langage de définition de documents - Spé Systèmes d'Information de Gestion - Terminale STMG

Nous vous proposons un cours de Spécialité Systèmes d'Information de Gestion pour la Terminale STMG, rédigé par notre professeur, sur le chapitre "Langage de définition de documents" issu de la partie "La numérisation suffit-elle à valoriser l'information ?".

Vous étudierez tout d'abord les métadonnées, puis le registre Dublin Core. Vous vous intéresserez également à l'utilisation des métadonnées et au stockage des métadonnées à travers le HTML, le XML et le langage RDF. Enfin, vous verrez ce qu'est l'interoperabilité et le rôle du XML.

Téléchargez gratuitement ci-dessous ce cours de Spécialité SIG sur le langage de définition de documents pour le Bac STMG.

Document rédigé par un prof Langage de définition de documents - Spé Systèmes d'Information de Gestion - Terminale STMG

Le contenu du document


INTRODUCTION

La production d’informations à partir du contenu d’une base de données passe par une maîtrise du modèle de représentation choisi.

Il s’agit d’abord de donner du sens à un ensemble de données structurées avant de pouvoir produire de nouvelles informations.

Les langages de définition des documents servent à structurer ou formater des documents. Ils permettent un travail automatisé de présentation des contenus qui en facilitent l’exploitation. Ils participent donc au processus de valorisation de l’information numérique. 


LES METADONNEES (DESCRIPTION DU CONTENU)

Une métadonnée est une donnée qui caractérise une autre donnée (le préfixe grec « méta » signifie « à propos »).

Par exemple : la notice d’un document comporte des métadonnées le caractérisant (auteur, date, …). Pour un document numérique, les métadonnées sont contenues dans le fichier du document (par exemple dans les propriétés de nombreux documents bureautiques sont en parties accessibles par l’explorateur de fichier et de façon plus complète à partir du logiciel dans le menu « propriétés ».

Un registre de métadonnées, établi par une autorité, recense les métadonnées utilisables dans un domaine. Une telle normalisation est essentielle pour harmoniser les pratiques et assurer l’interopérabilité entre des systèmes d’information (respectant ainsi les mêmes règles et facilitant ainsi les échanges.


LE REGISTRE DUBLIN CORE

Ce groupe de travail avait pour but en 1995, de définir des métadonnées de description des ressources numériques. Il s’agit aujourd’hui d’un des principaux registres de métadonnées (reconnu par le W3C, utilisé par le moteur de recherche Google…). IL existe plusieurs normes ISO concernant d’autres registres.

Le Dublin Core comporte 15 éléments de description d’un document répartis en trois domaines : 

  • Contenu : titre, sujet, description (résumé, table des matières), source (s’il dérive d’une ressource principale), relation (avec d’autres ressources), langue, couverture (spatiale ou temporelle).
     
  • Propriété intellectuelle : créateur, contributeur, éditeur, droits de propriété intellectuelle
     
  • Matérialisation : date, type de ressource (périodique, …) format (de fichier ou support physique), identifiant du document (URL, ISBN, …).


Dublin Core


L’UTILISATION DES METADONNEES

Citons les principales utilisations de métadonnées : 

  • La caractérisation et le classement de contenus (les métadonnées sur les fichiers de musique permettent par exemple de les classer par interprète, album…)
     
  • L’exploitation par les moteurs de recherche dans leur indexation
     
  • La facilitation de l’interopérabilité
     
  • La gestion du cycle de vie des documents
     
  • L’authentification (signature électronique) et la gestion des droits de propriété intellectuelle et d’accès.


Pour les documents textuels, le moteur de recherche s’appuie principalement sur le texte e lui-même (mode plein texte ou full text) pour l’indexer sans lui attribuer de sens et sans hiérarchie (stockage « à plat » des mots-clés) : « il » ne sait pas ce que veut dire le mot mais renvoie vers des sites censés le dire. 

L’ajout de métadonnées sur les mots eux-mêmes (et pas seulement le document dans son ensemble) permet de leur attribuer du sens.

Exemple : lorsqu’on saisit « jaguar » dans un moteur de recherche on reçoit des sites concernant l’animal et d’autres la marque automobile, ce n’est qu’une valeur d’index ; on peut certes préciser les mots-clés (jaguar + animal) pour aider la recherche (non que le moteur sache que le jaguar est un animal, il cherchera simplement ces mots associés) alors qu’une métadonnées (jaguar par exemple) attribuerait à la source un sens aux mots.

Les métadonnées sont encore plus pertinentes pour les données non textuelles car il faut associer des mots-clés signifiants pour permettre leur recherche par un moteur basé sur un index textuel (notons qu’il existe d’autres technologies telle Shazam basé sur la reconnaissance de sons). Par exemple, une carte géographique doit être associée à de multiples métadonnées (noms de ville, rue, voies, …) pour pouvoir faire l’objet de recherches.


LE STOCKAGE DES METADONNEES

Les principaux formats de stockage des métadonnées sont : 

- Le HTML qui propose plusieurs solutions (complémentaires) : 

  • Les balises de la section (toutefois Google ne tient plus compte des métadonnées keywords trop soumises à des manipulations)
  • Les attributs rel des balises , et ,
  • Les balises (HTML5) structurantes de pages
  •  ou de texte
  • Les microdonnées à l’aide des attributs itemscope, itemtype, itemid, itemprop, itemref (HTML5)

- Le XML (ainsi un fichier word .docx compresse différents fichiers, dont XML décrivent le document). Le XML (Extensible Markup Language) est un langage de balisage extensible, ouvert et normalisé par le W3C.

- La langage RDF (Ressource Description Framework).


Fichier HTML

Fichier HTML

Fichier XML

Fichier XML

Langage RDF

Langage RDF


L’INTEROPERABILITE

Les logiciels produisent généralement des fichiers dans un format (manière d’organiser le stockage des données et de leurs attributs : structure, forme, …). L’interopérabilité est la capacité de deux systèmes informatiques à échanger entre eux : un format non interopérable ne peut être lu que par le logiciel qui l’a créé.

Or dans et entre les systèmes d’information, divers logiciels peuvent être conduits à échanger des données (évitant ainsi d’avoir à les ressaisir). Si les logiciels ont des formats différents, il faut alors programmer un convertisseur (et autant de convertisseurs que de combinaisons de formats logiciels).


LE ROLE DU XML

Le XML est un langage de description de données conçu principalement pour créer des fichiers porteurs de données et de métadonnées et d’échange entre applications dans un format intermédiaire. 

Exemple : 

Deux logiciels A et B ont besoin d’échanger des informations (on raisonne ici au niveau logiciel mais ce « besoin » d’échange résulte d’un besoin organisationnel et de processus).

Ces deux logiciels ne stockent pas les données de la même manière ; il serait donc nécessaire que le logiciel A « connaisse » l’utilisation des données par le logiciel B pour les lui transmettre sous le format utilisé par B (le travail de conversion serait réalisé par A) ou à l’inverse que B effectue la conversion à partir de sa connaissance du format utilisé par A.

En réalité, il est peu concevable que chaque logiciel ait connaissance de tous les logiciels avec lesquels il peut échanger (d’autant que chaque logiciel évolue), on passe donc par un format d‘échange XML, qui s’est imposé comme un standard « connu » de tous les logiciels.

A convertit ses données en un fichier XML. B sait lire les fichiers XML et convertit les données vers son format. Le fichier XML ne « vit » que le temps de l’échange.

Le XML s’apparent à l’anglais utilisé par un français et un russe qui veulent dialoguer ensemble : le français traduit sa pensée du français à l’anglais et le russe entend l’anglais et pense en russe.

Fin de l'extrait

Vous devez être connecté pour pouvoir lire la suite

Télécharger ce document gratuitement

Donne ton avis !

Rédige ton avis

Votre commentaire est en attente de validation. Il s'affichera dès qu'un membre de Bac STMG le validera.
Attention, les commentaires doivent avoir un minimum de 50 caractères !
Vous devez donner une note pour valider votre avis.

Nos infos récentes du Bac STMG

Communauté au top !

Vous devez être membre de digiSchool bac STMG

Pas encore inscrit ?

Ou identifiez-vous :

Mot de passe oublié ?