Profundización acerca de XML
1. XML es un método para colocar datos estructurados en archivos de texto "plano"
Datos estructurados son aquellos que pueden ser organizados en campos, por ejemplo, una agenda, una tabla, una base de datos, una red semántica o mapa conceptual, una base de conocimiento o una base de datos. A menudo estos datos son utilizados en modo binario, no tratables por las personas, lo que hace necesario disponer del programa que lo ha creado (o uno similar para la decodificación) para poder acceder a los contenidos. XML es un formato textual "marcado", o sea, que aunque este no sea su objetivo, puede ser "leído" y controlado por una persona. XML es un conjunto de reglas, directivas, convenciones para proyectar formatos textuales para estos datos, de modo que se hace posible producir archivos que son fáciles de leer (por la computadora) de modo inequívoco y que evitan trampas como la falta de extensibilidad o de internacionalización.
2. XML se parece aun poco a HTML pero no es HTML
Como HTML, XML utiliza marcas (tags) (palabras delimitadas por '<' y '>') y atributos (de la forma nombre="valor"), pero mientras HTML especifica qué significa cada marca o atributo (y frecuentemente la apariencia del texto en el navegador), XML utiliza las marcas para delimitar elementos de datos, y deja totalmente la interpretación de los datos a las aplicaciones que lo leen. En otras palabras, si vemos ", no es necesario asumir que se trata de "bold" (negrita). En dependencia del contexto, puede ser un bono, una base, y quizás non tenga nada que ver con una palabra que inicie con "b".
3. XML es un texto, pero no está proyectado para la "lectura"
Los archivos XML son archivos de texto, pero aún menos que HTML han sido o file di testo, pero aún menos que HTML son destinados para la lectura directa por parte de las personas. Son archivos de texto, porque permiten a los expertos (por ejemplo los programadores o los "trabajadores del conocimiento"), controlar las aplicaciones, y en una emergencia usar un editor de texto para reparar un error. Pero las reglas para los archivos XML son más rigurosas que para el HTML. Una marca olvidada o simplemente una comilla (") errada hacen el file inutilizable. Al contrario de como sucede con el archivo HTML, cuando una aplicación encuentra un error en un file XML, emite un mensaje de error o detiene la "lectura" o la importación.
4.
XML es una familia de tecnologías
Esiste XML 1.0, la especificación que define qué cosa son y como son las marcas (tags) y atributos, pero alrededor de XML 1.0, existe también un conjunto de módulos opcionales que ofrecen marcas y atributos o directivas para actividades específicas. Existen también
Xlink, XPointer y XFragments; CSS, el lenguaje de las hojas de estilo, es aplicable también a XML como lo es a HTML.
XSL es el lenguaje avanzado para las hojas de estilo. RDF (Resource
Definition Framework), el estándar para los metadatos del WWW, ofrece una gramática y sintaxis para poder compartir la descripción de los recursos con el objetivo de facilitar la interoperabilidad entre aplicaciones. Hay muchos otros desarrollos, pero resulta especialmente interesante el derivado XTM ("topic maps" o mejor "mapas de contenido", ver), orientado especialmente a la descripción e intercambio de información asociativa, como los mapas conceptuales, redes semánticas, etc.
Este es el formato específico para el intercambio de contenidos entre aplicaciones que
gestionan conocimiento u organizaciones análogas.
5. XML es verboso, pero esto es un problema
Siendo XML un formato textual que utiliza marcas para delimitar los datos, los ficheros XML tienden a ser usualmente grandes. Al mismo tiempo los discos también tienen esta tendencia y existen de todos modos programas para comprimir estos archivos. También los modem están equipados para la compresión en línea, así como los protocolos para la trasmisión de datos en el web.
|