XML est un langage informatique qui permet de transmettre des informations et de dialoguer avec d’autres langages. Il est utilisé dans la conception des sites Web et dans les échanges de données sur le réseau Internet. XML tient actuellement une place prépondérante sur le Web.

Qu’est-ce qu’un fichier XML ?

Le langage XML sert à décrire et à structurer les données selon des règles et contraintes définies, et dont la syntaxe permet de définir d’autres langages comme XHTML, XSLT, RSS, SVG, JAVA qui ont chacun leur propre vocabulaire et grammaire.

En plus d’assurer l’interopérabilité, les instructions de traitement XML ont été créées dans le but de définir une syntaxe de codage de documents qui se veut être à la fois compréhensible par l’homme et la machine ainsi que de faciliter l’échange de données entre les systèmes d’informations. Sa réussite en tant que syntaxe très générique de balisage s’exprime par les implémentations concurrentes de nombreuses interfaces de programmation ou API spécifiées. Il va permettre d’afficher un même document sur des applications ou des périphériques différents sans avoir à créer plusieurs versions. Souvent utilisé pour la conception des pages web comme l’HTML, le code XML décrit l’agencement et l’organisation d’un site web pour faciliter son exploration par les robots d’indexation des moteurs de recherche. Mais l’élargissement de l’utilisation des chevrons ont permis à d’autres utilisations dans la programmation. Comme le RDF ou cadre de description de ressource, ce modèle vise à définir un réseau de métadonnées adapté au web, ou le XSLT qui utilise une syntaxe XML pour transformer du contenu XML en HTML ou en XSL-FO par exemple.

Un document XML est un fichier texte comportant des balises qui sont les éléments de base d’un fichier XML. Séparant deux niveaux, le texte est destiné aux humains et les balises à la machine. Le document XML présente une structure arborescente articulant différents types de nœuds comme le texte, les éléments, les attributs et les commentaires. L’organisation de ce texte par les balises produit un modèle informatique.

Selon les besoins, pour extraire les données du document, XML dispose d’un outil appelé analyseur ou « parser » en anglais. Le parseur permet de définir un format d’échange et offre des systèmes pour vérifier la validité du document produit.

Reconnaissable par les noms entourés de chevrons, les balises XML peuvent être par paires ou uniques et peuvent être personnalisées pour structurer de manière hiérarchisée et organisée les données d’un document. En effet, la balise XML a pour rôle de définir la disposition, l’organisation ainsi que la manière dont les données doivent être stockées ou transférées.

Comment formater un fichier XML ?

XML formater

Un fichier XML étant un document sous format texte, tout éditeur de texte comme Notepad ou même les navigateurs internet peuvent être utilisés pour éditer un script XML. Cependant, l’utilisation des outils spécialisés peut faciliter la conception et permet d’être plus productif. Ces outils peuvent aider à l’indentation, la coloration des caractères spéciaux ou encore la validation de documents.

En effet, le fichier XML formatter doit suivre scrupuleusement les conventions de notation XML et suivre  des règles syntaxiques comme le respect des casses, les guillemets simples ou doubles sur les valeurs des attributs. Un fichier XML est bien formé s’il suit les règles XML formatter, et valide s’il est conforme avec au XML schéma.

Un document XML est constitué d’une hiérarchie de balises comportant éventuellement des attributs, il peut être découpé en deux parties, le prologue et le corps.

Le prologue correspond à la première ligne et donne les informations de traitement. Notamment, la version de la norme XML utilisée qui est devenue obligatoire avec la version XML 1.1, ainsi que l’attribut facultatif indiquant l’encodage par défaut utilisé qui est UTF-8. Cette première partie peut comporter aussi une information facultative qui indique le document comme autonome ou rattaché à un autre document.

Ensuite, le corps du document. Il est constitué de l’ensemble des balises qui décrivent les données. Cependant, une règle très importante doit être respectée dans la constitution du corps : la balise en paires unique appelée élément racine du corps doit contenir tous les autres.

Etant un format de description des données, non de leur représentation, la mise en page des données est assurée par un langage tiers. Notamment, le CSS ou le XSL ou le XSLT.