Approfondissement sur XML
1. XML est une méthode pour placer des données structurelles dans un
fichier de texte plat
Les données structurées sont celles qui peuvent être organisées en champs (par exemple, un annuaire, un tableau, une base de données, un réseau sémantique ou carte conceptuelle, une base de connaissance ou une base de données). Ces données sont souvent gérées de manière binaire, sans que la personne puisse intervenir, car il faut le logiciel d’origine (ou un semblable pour le décodage) pour pouvoir accéder aux contenus. XML est un format textuel et "marqué", c’est-à-dire qu’il peut être "lu" et contrôlé par une personne, même si ce n’est pas son objectif. XML est constitué d’un ensemble de règles, de directives, de conventions qui permettent de concevoir des formats textuels pour ces données, afin de produire des fichiers qui sont faciles à créer et à lire (sur ordinateur), sans équivoques, sans limitations, comme le manque d’extensibilité ou d’internationalisation.
2. XML ressemble un peu à HTML mais ce n’est pas HTML
Comme HTML, XML utilise des balises (tags) (mots délimités par '<' et '>') et des
attributs (de forme nome="valore"), mais tandis que HTML spécifie ce que signifie chaque balise et attribut (et souvent l’apparence du texte dans le navigateur), XML utilise les balises pour délimiter les éléments de données, et il laisse complètement l’interprétation des données à l’application qui les lit. En d’autres termes, si nous voyons "<p>" dans un fichier XML, il n’est pas nécessaire d’imaginer qu’il s’agit d’un paragraphe. Selon le contexte, cela peut être un prix, une personne, et il n’a peut-être rien à faire avec un mot qui commence par 'p'".
3. XML est un texte, mais il n’est pas conçu pour la "lecture"
Les fichiers XML sont des fichiers de texte, mais encore moins que HTML ils sont destinés à la lecture de la part des personnes. Ce sont des fichiers de texte, parce qu’ils permettent aux experts (par exemple les programmateurs et les "travailleurs de la connaissance"), de contrôler les applications, et en situation d’urgence, utiliser un éditeur de textes pour réparer une erreur. Mais les règles pour les fichiers XML sont plus rigoureuses que pour HTML. Une balise oubliée ou simplement une erreur de guillemet (") rendent inutilisables le fichier. Au contraire de ce qui se passe avec les fichiers HTML, quand une application trouve une erreur dans un fichier XML, il émet un message d’erreur et arrête la "lecture" ou l'importation.
4.
XML est une famille de technologies
Il existe
XML 1.0, la spécification
qui définit ce que sont et comment sont les balises (tags) et les
attributs, mais autour de XML 1.0 il y a aussi un ensemble de modules
optionnels qui offrent des balises et des attributs ou directives pour des
activités spécifications. Il existe aussi
Xlink, XPointer
et Xfragments; CSS, le langage de
feuilles de style, il peut s’appliquer aussi à XML comme il l’est à HTML. XSL est le langage avancé
pour les feuilles de style. RDF
(Resource Definition Framework), le standard pour
les métadonnées du WWW, offre une grammaire et syntaxe pour rendre commune la
description des ressources pour faciliter l'interopérativité entre
applications. Il y a beaucoup d’autres
développements, mais il résulte particulièrement intéressant le dérivé
XTM ("topic maps" ou mieux "carte
des contenus",
voir),
orienté spécialement à la description et à l’échange d’information
associative (comme les cartes conceptuelles, les réseaux sémantiques, etc.).
C’est le format spécifique pour l’échange des
contenus entre applications qui gèrent la connaissance ou des organisations
semblables.
5. XML est verbeux, mais ce n’est pas "un problème"
XML étant un format textuel qui utilise des
balises pour délimiter les données, les fichiers XML tendent habituellement à
être grands. Les disques ont cette même tendance, mais il existe des
logiciels pour comprimer ces fichiers. Les modem aussi sont équipés pour la compression
en-ligne, tout comme les protocoles pour la transmission de données dans le
web.
|