Lenguajes hipertextuales

María Jesús Lamarca Lapuente. Hipertexto: El nuevo concepto de documento en la cultura de la imagen.

Los lenguajes de marcas, también denominados lenguajes de marcado o lenguajes de descripción de documentos, construyen un conjunto de reglas que definen todo aquello que es parte de un documento digital, pero que no pertenece al texto del mismo. Los lenguajes de marcas no son lenguajes de formato similares a los lenguajes que se usan en Internet como los de descripción de páginas (archivos PostScript, archivos .pdf, etc.) ni son lenguajes de  programación (Java, Perl, C++...), sino que se trata de lenguajes orientados a definir la estructura y la semántica de un documento. En realidad, más que de lenguajes, podríamos hablar de metalenguajes o sistemas formales mediante los cuales se añade información o codificación a la forma digital de un documento bien para controlar su procesamiento, bien para representar su significado.

En un documento existen distintos niveles de información: por un lado, los datos que conforman el contenido de un documento (caracteres de contenido), y por otro, una información superpuesta al contenido, que es lo que constituye el etiquetado, marcado o "markup" (caracteres de etiquetado).

Un lenguaje de marcado cumple con dos objetivos esenciales a la hora de Lenguajes principalesdiseñar y procesar un documento digital

  •  Especifica las operaciones tipográficas y las funciones que debe ejecutar el programa navegador/visualizador sobre dichos elementos. Las operaciones tipográficas son instrucciones de formato que se aplican a cada uno de los elementos de un documento digital como, por ejemplo, imprimir un título en negrita y a un determinado tamaño.

  •  Separa un texto en los elementos de los que se compone, como por ejemplo un párrafo, un capítulo, un encabezamiento, etc. 

Así, pues, hay 2 tipos de marcación:

  •  específica: describe cómo ha de formatearse el documento: fuente, tamaño, color, etc.

  •  estructural: describe la estructura del documento: titular, párrafo, etc.

En general los lenguajes de marcado siguen una sintaxis basada en el uso de marcas o etiquetas: una etiqueta que indica el principio de un elemento y otra el final del mismo. 

Por regla general, la mayor parte de autores distinguen 2 tipos básicos de lenguajes de marcado:

  •  Lenguaje de marcado de procedimiento o procesado: Las anotaciones o marcas de los lenguajes de procedimiento describen la forma y el significado de las operaciones tipográficas que van a ser aplicadas a cada uno de los elementos del documento. Por ejemplo, una regla de un lenguaje de procedimiento indicaría que el título de la sección de un texto debe ser impreso en una sola línea con una fuente de seis puntos más grande que el resto del texto, con objeto de que los lectores puedan inferir que es el título. Se refiere, pues, a la apariencia física o formato (fuente, estilo de letra, tamaño, etc.) tanto del documento en pantalla como del documento impreso.

  •  Lenguaje de marcado estructural o descriptivo: En los lenguajes estructurales las marcas o anotaciones únicamente describen la estructura lógica del documento digital y/o la descripción del contenido, no su tipografía.

Aunque lo cierto es que existen 3 utilizaciones básicas de los lenguajes de marcas: los que sirven principalmente para describir el contenido (por ejemplo, las bases de datos), los que sirven para definir el formato (por ejemplo, los procesadores de textos) y los que realizan las dos funciones indistintamente (por ejemplo, el lenguaje HTML).

¿Cómo surgen los lenguajes de marcado?

Dada la gran variedad de formatos existentes a la hora de archivar documentos y de los problemas que se planteaban cuando se intercambiaban archivos con las consiguientes pérdidas de formato y otras características, todos estos problemas se intentaron solucionar editando los textos en código ASCII  (American Standard Code for Information Interchange)  el código de 7 bits que puede representar un máximo de 128 caracteres, muchos de ellos no imprimibles. Sin embargo, con la utilización de este código, no se podía definir el formato de un texto (por ejemplo, el uso de negrita o cursiva, o el uso de tipos de letra más grandes para los encabezamientos), ni se podían definir otras características relativas a la posición del texto, por lo que se intentó buscar un sistema de marcas con las que se pudieran determinar éstas y otras particularidades. 

Se acordó, pues, que las marcas deberían constar de unos caracteres ASCII especialmente reservados para ello y que deberían seguirse unas reglas sintácticas especiales. Así nació un lenguaje especial normalizado internacional para la formulación de este tipo de reglas llamado Standard Generalized Markup Language o SGML. SGML no es pues, un lenguaje en sí mismo, sino un metalenguaje y de él se deriva el lenguaje HTML o lenguaje de marcas de hipertexto, y otros muchos lenguajes.

SGML

SGML (Standard Generalized Markup Language) o Lenguaje de Etiquetado Generalizado Estándar es una norma ISO que permite que la estructura de un documento pueda ser definida en base a la relación lógica de sus partes. Esta estructura puede ser validada por una Definición de Tipo de Documento (DTD - Document Type Definition). La norma SGML define la sintaxis del documento y la sintaxis y semántica de DTD.

En 1969 IBM ideó el lenguaje GML o Generalized Markup Language con el objetivo de crear un sistema general que permitiera la compatibilidad entre los documentos. En 1978, el Instituto Nacional Americano de Normalización (ANSI) comenzó a trabajar en las especificaciones para los procesadores de textos y el resultado fue el lenguaje SGML, que se convirtió en la Norma ISO 8879 en 1986. 

En SGML, el marcado de un fragmento de texto se realiza a través de las etiquetas o marcas (tag). Estas marcas se diferencian del propio texto porque aparecen entre paréntesis angulares  < > en caracteres ASCII que, por tanto, se convierten en signos reservados para la sintaxis SGML.) 

Una pareja de marcas o etiquetas encierran el texto al que afectan. Veamos un ejemplo: 

<p>En este texto, algunas palabras aparecen en <b>negrita</b>, otras en <i>cursiva</i>
 y otras en
<b><i>negrita y cursiva</i><b> 

que daría el siguiente resultado:

En este texto, algunas palabras aparecen en negrita, otras en cursiva y otras en negrita y cursiva 

Con la sintaxis del lenguaje SGML se pretende poder identificar la estructura lógica de un documento a través de estas marcas. Las etiquetas marcan los distintos elementos de un texto, como por ejemplo, los encabezamientos o los párrafos, representando de la misma forma los elementos de la misma categoría. La presentación final de estos elementos viene determinada por las especificaciones de estilo especiales. 

La función principal del SGML es describir los tipos de documentos de forma que puedan determinarse mediante marcas las particularidades de cada tipo, en lo que se refiere a su estructura y a su visualización en pantalla y con una sintaxis única para definir las distintas partes del texto. Esto se realiza definiendo todas las etiquetas válidas para cada tipo de documento, incluyendo también las reglas relativas a la estructura lógica. 

Con estas reglas se puede exigir, por ejemplo, que un texto que debe asignarse a un tipo de documento definido se inicie generalmente con un encabezamiento, pero nunca que acabe con un encabezamiento. Una definición del tipo de documento o DTD (Document Type Definition) se guarda en un archivo especial con una extensión .dtd. Consta de una sucesión de comandos SGML enmarcados por los signos "<" y "", estos comandos son, fundamentalmente, ELEMENT, ENTITY y ATTLIST

El comando ELEMENT sirve para definir una etiqueta, ENTITY para indicar ciertos elementos del texto en forma de sucesiones de caracteres ASCII y para utilizar dentro del texto los caracteres reservados para la sintaxis de SGML, como los signos “menor que” o “mayor que”. El comando ATTLIST permite establecer atributos complementarios para determinados elementos concretos. Todos los atributos pertenecientes a un elemento se resumen aquí en una sola lista en la que se establecen los nombres de los atributos, así como los valores autorizados de cada atributo.  

Otro concepto importante dentro del SGML y del DTD es el de secciones marcadas. Una sección marcada se inicia con la secuencia de caracteres "<![", seguida de una o más claves que informan sobre la manera de interpretar la información que se encuentra dentro de la sección. A continuación va el carácter "[" y detrás el contenido en sí de la sección marcada, que puede ser todo lo extenso que se desee. Finalmente se cierra la sección mediante la secuencia de caracteres "]]". Las claves para la especificación de las secciones marcadas son INCLUDE, IGNORE, CDATA, RCDATA o TEMP

Otros comandos importantes del SGML son USEMAP y SHORTREF, que sirven para establecer abreviaturas, el comando NOTATION, que sirve para fijar anotaciones en la llamada hoja de estilo y el comando DOCTYPE que sirve para incluir un DTD o para llamar a un archivo con la extensión .dtd que lo contiene. 

Los lenguajes HTML y XML son, simplemente, dialectos y simplificaciones de SGML, ya que éste es demasiado complejo.  XML se diferencia en que es un lenguaje extensible. El término extensibilidad (extensibility) se entiende, aquí, como la facultad de flexibilidad para el cambio que posee un lenguaje, programa o aplicación determinada, para soportar nuevas funcionalidades cuando se produzcan cambios o se incorporen nuevos elementos, sin que se alteren los elementos o bases existentes (o alterando mínimamente los existentes).

HTML

HTML (Hipertext Markup Language) o lenguaje de marcas de hipertexto es el lenguaje que permite la generación de hipertextos en la World Wide Web. Este lenguaje deriva de la existencia de otros lenguajes de marcados previos y, a su vez, ha tenido unos desarrollos posteriores. HTML (HyperText Markup Language) es un lenguaje muy sencillo que permite describir hipertexto. La descripción se basa en especificar en el texto la estructura lógica del contenido (títulos, párrafos de texto normal, enumeraciones, definiciones, citas, etc.) así como los diferentes efectos que se quieren dar (especificar los lugares del documento donde se debe poner cursiva, negrita, o un gráfico determinado) y dejar que luego la presentación final de dicho hipertexto se realice por medio del navegador.

El lenguaje HTML está basado en la definición de SGML. HTML nació en 1990, y su entorno se basa en comandos concretos que han sido sometidos a constantes cambios y a un crecimiento vertiginoso. La tarea de determinar la sintaxis de estos comandos recae en primer lugar en el Consorcio World Wide Web (W3C). Su objetivo es la creación de documentos que puedan difundirse sin problemas por la red y que puedan ser interpretados por los diferentes navegadores o "browsers".  Se trata de un lenguaje muy sencillo que permite estructurar textos y establecer enlaces con otros documentos y que se ha convertido en la Norma ISO 15445:2000. Para todo lo relacionado con el lenguaje HTML hay que consultar el sitio web del W3 Consortium ( (http://www.w3.org/TR/REC-html40/) donde se publican las Recomendaciones y especificaciones sobre este lenguaje, así como las distintas versiones normalizadas.

Básicamente, HTML utiliza los mismos elementos que el lenguaje SGML, las etiquetas, instrucciones o marcas (tags, en inglés) que igualmente están compuestas de códigos enmarcados por signos.

Cualquier documento HTML comienza con una etiqueta y termina con la misma etiqueta precedida de una barra /. Dentro existen dos zonas bien identificadas, el encabezamiento, que se identifica con la etiqueta y sirve para definir valores válidos en todo el documento y el cuerpo del documento, cuya etiqueta es y que muestra la información del documento. 

Dentro del encabezamiento, la etiqueta fundamental es la del título o TITLE. En el cuerpo del documento BODY se pueden establecer categorías utilizando diversos tamaños de fuentes, estableciendo así la estructura básica del documento. 

También podemos determinar el estilo y tipo de letra mediante determinados atributos, como son los de final de línea "br" y final de párrafo "p", los de presentación de texto preformateado, es decir, manteniendo espacios y retornos de carro (etiqueta "pre") o los de negrita "b", cursiva "i" o centrar "center". Además se pueden definir listas numeradas y no numeradas, glosarios, marcar líneas horizontales para separar textos o insertar comentarios, etc. 

Pero, sin duda, los elementos más característicos del lenguaje HTML son las etiquetas <A> que marcan los anclajes o anclas utilizados para establecer un enlace con texto o gráficos de otros documentos. La directiva ancla debe incluir el parámetro href="URL" para apuntar a la dirección o URL y el texto para pulsar. En cuanto a los gráficos, se pueden insertar mediante la directiva IMG con el parámetro src="URL". Pero no existe compatibilidad entre los distintos formatos gráficos, el más extendido es el GIF, aunque existen otros muchos. En cualquier caso, para dotar al documento de una mayor accesibilidad, se puede añadir el parámetro alt="texto sustitutivo" por si el gráfico no puede ser visualizado. También podemos hacer que un gráfico se convierta en enlace

Por último, los caracteres reservados, como los signos <  >, las vocales acentuadas o la ñ, pueden ser utilizados dentro del texto del documento mediante la sustitución de estos signos por una cadena de caracteres. Es cierto que la mayor parte de los navegadores admiten la escritura directa de los signos en cuestión dentro del documento, pero en otro tipo de programas, como en los de correo electrónico, pueden surgir problemas, por lo que se precisa un pequeño programa de conversión.

Existe un lenguaje HTML dinámico llamado DHTML (Dinamic HyperText Markup Language) que ha creado nuevas etiquetas para el lenguaje HTML con nuevas opciones de estilo y programación que permiten webs con animaciones y una mayor interactividad. En realidad no se trata de un nuevo lenguaje, sino de nuevas posibilidades que pueden integrarse en las páginas web construidas con HTML.

En conjunción con HTML, se han desarrollado las llamadas Hojas de estilo (Style Sheets). Una hoja de estilo es una colección de reglas que afecta a la apariencia de un documento. Actualmente el tipo más común de hoja de estilo es la llamada Hoja de estilo en cascada (Cascading Style Sheets ó CSS). Estas normas se refieren al modo en que aparecerá un documento en pantalla cuando el usuario utilice un navegador gráfico, controlando por ejemplo el color, el fondo, tipo de fuente, apariencia del borde, márgenes, alineación, espacio entre caracteres, etc.

Las últimas versiones de HTML como HTML 4.0 han desplazado muchas de las funciones realizadas por las anteriores versiones hacia las hojas de estilo, reservando el lenguaje HTML para cuestiones menos formales, relativas a la propia organización del contenido.

XML

XML o eXtensible Markup Language, es un lenguaje de marcado derivado del lenguaje SGML que proporciona una sintaxis superficial para documentos estructurados, pero que no impone restricciones semánticas sobre el significado de los mismos. XML permite suministrar, recibir y procesar información en la Web y puede interoperar tanto con SGML como con HTML. 

XML es un estándar desarrollado por el Consorcio World Wide Web (W3C). Se trata de una versión reducida y especializada en la Web de la norma SGML. Su caracterización como "extensible" se deriva de la no limitación en el número de marcas o etiquetas, pues permite crear todas aquéllas que sean necesarias. Otra de sus características principales es que permite enlaces multidireccionales (esto es, que apuntan a varios documentos).

XML no es una nueva versión de HTML y, aunque ambos proceden de un mismo metalenguaje, el SGML, el origen y enfoque que se ha seguido en ambos es muy distinto.

HTML no es un lenguaje de programación, es un lenguaje de especificación de contenidos para un tipo específico de documentos SGML. Es decir, mediante HTML podemos especificar, usando un conjunto de marcas o etiquetas, cómo va a representarse la información en un navegador. El lenguaje HTML permite insertar menús, tablas, imágenes o bases de datos en los documentos, pero no permite al usuario que maneje estos elementos como mejor le convenga. Esa es la gran novedad que aporta XML.

XML conserva todas las propiedades importantes de SGML. Es decir, XML es también un metalenguaje, dado que con él podemos definir nuestro propio lenguaje de presentación y, a diferencia del HTML, que se centra en la representación en la pantalla de la información, XML se centra en la información en sí misma. El objetivo del desarrollo del XML es ser un estándar que sustituya a todo el conjunto de tecnologías que permiten hoy acceder a información a través del Web (applets, scripts,…).

Las diferencias fundamentales de XML con respecto a HTML son:

  •  No requiere DTD o Document Type Definition, ya que XML apunta a la estructura de los datos, lo que ahorra tiempo y simplifica el software de aplicación.

  •  XML no dispone de soporte para excepciones, por lo que cada etiqueta realiza siempre la misma función

  •  No existen modelos de contenido AND, los elementos deben nombrarse siempre en un orden preestablecido

  •  Tampoco dispone de las entidades internas Sdata, que en SGML permiten la inclusión de información específica, por ejemplo símbolos matemáticos

  •  Es un código más reducido y menos complejo que el SGML y, por lo tanto, muchos más fácil de usar

  •  Posee independencia de los navegadores, porque en lugar de añadir las etiquetas de presentación al documento se remitirá una hoja de estilo realizada en XSL (Extensible Style Language)

XML posee una serie de especificaciones como XLL (que incluye XLink, XPointer), XSL (que incluye XSLT, XPATH y FO) y XML Schema que permite restringir la estructura de los documentos XML, DOM un analizador de éste, o los lenguajes Topics Map, XFML, RDF y OWL que le dotan de una estructura semántica.  XML también es una fuente creciente para el desarrollo y puesta en marcha de otros lenguajes sectoriales y una serie de herramientas y aplicaciones que lo complementan.

María Isabel García Arenas en su Curso XML establece un cuadro-resumen con algunas de las diferencias significativas entre los distintos lenguajes mencionados:

 

HTML/DHTML

XML

SGML

Gramática

Fija y no ampliable

Extensible

Extensible

Estructura

Monolítica

Jerárquica

Jerárquica

Nº de marcas

Fijas

Sin límite

Sin límite

Complejidad

Baja

Mediana

Alta

Diseño de páginas

Fijado por tags. Etiquetas con atributos CSS en DHTML

CSS o XSL

DSSSL

Enlaces

Simples enlaces

Poderosos enlaces (XLL)

HyTime

Exportabilidad (formatos/aplicaciones)

No

Validación

Sin validación

Pueden validarse

Obligatorio DTD

Búsquedas

Simple y a veces resuelta por scripts o CGI

Potente búsqueda. Con capacidad para personalizarla.

Son posibles potentes búsquedas.

Indización/Catalogación de páginas web

Sólo lo permiten los atributos de la etiqueta <META>, e implementaciones como DC.

Una descripción abierta y personalizable con el RDF.

Proyectos como TEI, DLI, etc.

Adaptación de la Tabla de: María Isabel García Arenas. Curso XML 1ª Edición. Curso XML
http://geneura.ugr.es/~maribel/xml/introduccion/index.shtml

Esta misma autora aporta el siguiente diagrama que permite aclarar las relaciones entre los distintos lenguajes citados anteriormente:

esquema de relaciones entre lenguajes

Esquema de relaciones entre lenguajes. Fuente: María Isabel García Arenas.
Curso XML 1ª Edición. Curso XML
http://geneura.ugr.es/~maribel/xml/introduccion/index.shtml

Pero existen otros muchos lenguajes que abarcan diferentes aspectos. Unos se refieren a aspectos semánticos (RDF, Topic Maps, DAML+OIL, OWL, XFML, etc. ) otros son vocabularios específicos para tratar diferentes aspectos dentro de XML (VoiceXML), y otros tienen que ver con la posibilidad de añadir objetos no textuales, como gráficos u objetos en 3 dimensiones (VRML) o diagramas orientados a objetos (UML).

Veamos con detalle algunos de ellos.

LENGUAJES SEMÁNTICOS:

Un gran bloque en creciente y notable desarrollo corresponde a los lenguajes orientados a la semántica. Entre los que cabe destacar el lenguaje RDF (Resource Description Framework); la especificación Topic Maps, un modelo abstracto que usa la gramática del lenguaje XML para el intercambio de mapas temáticos basados en la Web; el lenguaje XFML que permite definir, distribuir e intercambiar metadatos en forma de taxonomías o clasificaciones facetadas, o el potente lenguaje OWL Web Ontology Language. (http://www.w3.org/TR/owl-ref/)

RDF y OWL se han convertido en estándares semánticos de la Web para proveer un marco de trabajo que asegure la gestión y la integración de iniciativas para compartir y reutilizar los datos sobre la Web. Estos formatos estándar para datos comparten aplicaciones para que los diferentes tipos de usuarios pueden compartir la misma información, aunque no compartan el mismo software.

RDF

El Resource Description Framework (RDF) es un lenguaje para representar información sobre los recursos de la World Wide Web y las relaciones entre ellos. Está particularmente diseñado para representar metadatos tales como título, autor, fechas de las páginas web, copyright e información sobre autoría y licencias de los documentos, o para  disponer de los listados o catálogos de algunos recursos compartidos. Sin embargo, al generalizarse el concepto de recurso web, RDF puede usarse también para representar información sobre cosas que son identificadas (identified) en la Web, cuando no pueden ser directamente recuperadas en ella. Esto incluye información sobre productos facilitados por las tiendas online (información sobre especificaciones, precios, etc.) o la descripción de las preferencias de los usuarios de la Web para distribuir la información.

El World Wide Consortium desarrolla este lenguaje en 6 bloques o especificaciones distintas:

El RDF (Resource Description Framework) es un estándar para descripciones simples. Mientras que el lenguaje XML sirve para la sintaxis, RDF vale para la semántica, porque ofrece de manera clara una serie de reglas para proveer información descriptiva. Por su parte, RDFS (RDF Schema) ofrece una forma de que estas descripciones puedan combinarse dentro de vocabularios simples. RDF integra una gran variedad de aplicaciones, como pueden ser catálogos de bibliotecas, directorios web, colecciones particulares de música, fotos, eventos, etc. Se puede usar XML como una sintaxis de intercambio. Las recomendaciones RDF ofrecen una estructura muy potente para soportar el intercambio de conocimiento en la Web. RDF ha supuesto uno de los mayores avances en la Web.

El RDFCore Working Group ha adoptado las recomendaciones RDF que, junto con OWL, podrá hacer realidad la Web Semántica.

Topic Maps

La especificación XML Topic Maps (XTM) 1.0. http://www.topicmaps.org/xtm/1.0/ provee un modelo y una gramática para representar la estructura de los recursos de información usados para definir tópicos (topics), y las asociaciones (relaciones) entre los tópicos. Nombres, recursos y las relaciones entre ellos se establecen mediante una serie de características de contenidos abstractos, que son llamados "topics". A su vez, los topics se caracterizan por una serie de elementos como los scopes, esto es, los ámbitos, campos o contextos limitados en los cuales se consideran. Cuando uno o más documentos interrelacionados emplean esta gramática, constituyen lo que se denomina un mapa temático o "topic map".

Un Topic Map (TM) tiene como fin normalizar los elementos y la notación utilizada para estructurar la información mediante la construcción de una red de enlaces semánticos que relacionen diferentes recursos informativos.

Los Topic Maps son, pues, un estándar que se está implantando con gran éxito en la World Wide Web y que posibilita la navegación entre conceptos y la inferencia, lo que constituye un paso adelante en lo que se ha denominado la Web semántica. Además, poco a poco aumenta la  la utilización de los Topic Maps en la Web como una forma de representación gráfica que permite el acceso y navegación por los recursos de un mismo campo del conocimiento mediante los llamados mapas temáticos que no son sino un mapa conceptual aplicado a la World Wide Web.

La implementación de los Mapas Temáticos (TM) se diseñó para el lenguaje SGML, sin embargo, la aparición y auge del lenguaje XML junto con la universalización de la utilización de los URIs para la identificación de las referencias externas,  ha conducido al desarrollo del estándar "Topic Maps para XML" y las URIs, lo que se ha denominado XTM (XML Topic Maps). En cualquier caso, actualmente se pueden encontrar ejemplos de ambos lenguajes en la Web y, además, la ISO ha incluido en la segunda edición de la norma 13250, junto a la antigua sintaxis para HyTime, la nueva sintaxis XML: (http://www.y12.doe.gov/sgml/sc34/document/0322_files/iso13250-2nd-ed-v2.pdf).

XFML

XFML o eXchangeable Faceted Metadata Language. http://www.xfml.org/ Se trata de un vocabulario para definir definir, distribuir e intercambiar metadatos en forma de taxonomías o clasificaciones facetadas.

La XFML Specification se encuentra en: http://www.xfml.org/spec/ y consta de 2 partes:

  •  XFML Core: es la versión actual XFML 1.0. Se trata de un formato abierto para publicar y compartir metadatos facetados de forma jerárquica  y productos para la indización. http://www.xfml.org/spec/1.0.html

  •  XFML 2.0 En el futuro, será publicado XFML 2.0 que posiblemente soportará vocabularios controlados y características de tesauros, namespaces y similares.

DAML+OIL

El uso de ontologías es una manera muy poderosa para describir objetos y sus relaciones con otros objetos. Así pues, el lenguaje DAML del programa DARPA Agent Markup Language (DAML) se desarrolló como una extensión del lenguaje XML y del lenguaje Resource Description Framework (RDF) para establecer ontologías sobre la Web.

Similar al lenguaje DAML es el lenguaje OIL u Ontology Inference Layer OIL. Se trata de una propuesta para una representación logotipo OILbasada en la Web y las leyes de inferencia para ontologías, que combina el uso de primitivas de modelado desde lenguajes basados en frames (clases) con la semántica formal y los servicios de razonamiento provistos por descripciones lógicas. OIL es compatible con RDF Schema (RDFS) e incluye una semántica precisa para describir el significado de términos y también para describir información implicada.

Estos dos lenguajes se fusionaron en uno y la última revisión del lenguaje (DAML+OIL) http://www.daml.org/2001/03/daml+oil-index ofrece ya un rico conjunto de elementos con los cuales se pueden crear ontologías y marcar la información para que sea legible y comprensible por máquina.

OWL

El OWL (Web Ontology Language) o Lenguaje de Ontologías para la Web, se ha convertido en recomendación del W3C el 10 de febrero de 2004 (http://www.w3.org/TR/owl-ref/).

El reciente desarrollo de numerosas ontologías y la puesta en práctica de la Web Semántica, se ha convertido en el objetivo de este lenguaje. Las ontologías son metadatos ofrecidos por un vocabulario controlado de términos definidos de forma explícita y semánticamente procesables por máquina. Para definir de forma compartida y común los dominios teóricos, las ontologías ayudan a las personas y a las máquinas a comunicarse de forma más efectiva. Esto es algo crucial para el acceso al contenido, la interoperabilidad y la comunicación dentro de la World Wide Web. Ejemplos del uso de ontologías que están basadas en el acceso al contenido y la interoperabilidad ha sido, por ejemplo, el proyecto norteamericano SHOE o Simple HTML Ontology Extensions (con el que HTML ha sido extendido con una ontología basada en códigos de etiquetas semánticos) o el proyecto europeo IST-project ON-TO-KNOWLEDGE (en el que usan ontologías para facilitar el acceso a intranets). El lenguaje SHOE fue abandonado poco a poco a medida que se desarrollaron DAML y OIL, conjugándose en el lenguaje DAML+OIL y hoy, sin duda alguna, la especificación del W3C del Web Ontology Languaje OWL se está convirtiendo en el lenguaje de ontologías más utilizado.

La Web Semántica ofrecerá un desarrollo crucial para las aplicaciones de la Web ya que permitirá que  los usuarios realicen búsquedas más sofisticadas a través de mayores capacidades de los buscadores, robots y agentes inteligentes.

La importancia de las ontologías en la Web Semántica ha impulsado el desarrollado de "schemas" para los diferentes lenguajes. Por ejemplo, XML ha sido extendido hasta dar XML-Schema (XMLS), mientras que RDF se ha extendido hacia RDF-Schema (RDFS). Sin embargo, los primitivos lenguajes que proveen estos estándares son muy básicos cuando los comparamos con los nuevos desarrollos de los lenguajes de ontologías.

Otros lenguajes:

Pero existen otros lenguajes con diferentes aplicaciones, entre los que cabe destacar el antiguo Virtual Reality Modeling Language (para modelado de realidad virtual) del que también se habla en esta tesis al tratar, dentro de la morfología de la imagen, las imágenes tridimensionales; o lenguajes tan completos como el lenguaje de modelado de sistemas UML, y toda la gama de lenguajes sectoriales nacidos al amparo del potente y versátil XML para crear vocabularios estandarizados específicos, tales como SMIL o Synchronized Multimedia Integration Language (para tratamiento de la documentación multimedia), SSML o Speech Synthesis Markup Language (para acceso a la Web por medio del habla), VoiceXML oVoice Extensible Markup Language para aplicaciones de voz interactivas, SRGS o Speech Recognition Grammar Specification que es una Gramática de Reconocimiento de habla, CCXML o Voice Browser Control Call, esto es, Control de Llamadas para Navegadores de Voz, MathML o Mathematical Markup Language (para describir la estructura y el contenido de notaciones matemáticas), SVG o Scalable Vector Graphics (para la descripción de gráficos en dos dimensiones), XForms para formularios, VML o Vector Markup Language (para describir cómo debe disponerse y editarse la información vectorial), WML o Wireless Modeling Language (para teléfonos móviles), etc.

VRML

El VRML o Virtual Reality Modeling Language, permite construir objetos en tres dimensiones. Dicho lenguaje tiene una especificación del Web 3D Consortium: http://www.vrml.org/VRML1.0/vrml10c.html

Gracias a este lenguaje, se pueden construir objetos y mundos tridimensionales. Esto ha dado origen a comunidades virtuales denominadas MUDs o Multi-user dungeons (mazmorras o dominios multi-usuario) y sus variantes posteriores como  MOOs (o Multi-user object oriented), que se trata de un MUD orientado a objetos donde los usuarios interactúan en tiempo real y forman una comunidad que sólo existe online.

El estándar VRML o Lenguaje de Modelado para Realidad Virtual se ha constituido también en una norma  ISO y fue desarrollado gracias al esfuerzo combinado de un grupos de empresas, diseñadores y programadores con el fin de describir animaciones, escenas en 3 dimensiones y mundos virtuales sobre la Web.

Para más información sobre VRML, se puede consultar: http://www.ocnus.com/models/models.html

UML

El lenguaje UML Modelado de Sistemas con UML que ya hemos estudiado al hablar de la arquitectura de un sistema hipertextual pues, aunque no se trata de un modelo en sí mismo, sino de un sistema para modelar distintos tipos de sistemas, se trata de un sistema que pretende unificar todas las notaciones y diagramas estándar para modelar sistemas orientados a objetos, por lo que se ha preferido incluirlo junto con todas esas notaciones y modelos precedentes. (http://es.tldp.org/Tutoriales/doc-modelado-sistemas-UML/multiple-html/index.html)

Estándares para protocolos y lenguajes

Los estándares y protocolos para Internet los establece el Consorcio para la Web (W3C). En sus páginas se encuentran las especificaciones de lenguajes y protocolos que suponen el avance tecnológico de la Red.

Extreme es una conferencia técnica que se celebra anualmente en Canadá y que tiene como fin analizar el marcado y los lenguajes de marcado, sistemas, aplicaciones y software para manipular y explotar las etiquetas o marcas.


Bibliografía:

BERNERS-LEE, Tim. Metadata Architecture: Document, Metadata and Links. http://www.w3.org/DesignIssues/Metadata.html

BURNARD, Lou. "What is SGML and How does it help?". Computers and the Humanities, 1995, vol 29.

CLARK, James. Comparison of SGML and XML. World Wide Web Consortium Note 15-December-1997. W3C- http://www.w3.org/TR/NOTE-sgml-xml.html

COOMBS, James H;  RENEAR, Allen H; De ROSE, Steven, J. "Markup Systems and the Future of Scholarly Text Processing", Communications of the ACM, 1987, vol. 30, nº11. http://www.oasis-open.org/cover/coombs.html

Cover Pages. SGML/XML Special Topics. http://www.oasis-open.org/cover/topics.html

DAML Language.  http://www.daml.org/language/

Extensible Modeling Language Resource Center. Popkin Software. http://www.popkin.com/customers/customer_service_center/enterprise_architecture_resource_center/xml.htm

GARCÍA ARENAS, María Isabel. Curso XML. http://geneura.ugr.es/~maribel/xml/introduccion/index.shtml  [Volver]

GAYNOR, Edward. From MARC to Markup: SGML and Online Library Systemas. Charlottesville, University of Virginia Library, Special Collections. http://xml.coverpages.org/gaynorMARC96.html

 HOFFMAN, Michael. Rapid Navigation in Online Documents. http://www.hypertextnavigation.com

IDEAlliance. Extreme Markup Languages. http://www.extrememarkup.com/extreme/

MALER, EVE. EL ANDALOUSSI, Jeanne. Developing SGML DTDs: Fron text to model to markup. New Jersey, Prentice Hall, 1996.

MÉNDEZ RODRÍGUEZ, Eva. Metadatos y recuperación de información: Estándares, problemas y aplicabilidad en bibliotecas digitales. Gijón, Ediciones Trea, 2002.

OMG (Object Management Group). http://www.omg.org/

PEIS, Eduardo. MOYA, Félix de. "Sgml y servicios de información". El profesional de la información, junio 2000, vol. 9, nº 6.

PRICE, Roger. "Beyond SGML". ACM Conference on Digital Libraries, ACM, 1998.

SPERBERG-McQUEEEN, C. M. HUITFELDT, Claus.  RENEAR, Allen. Meaning and Interpretation of Markup. http://www.w3.org/People/cmsmcq/2000/mim.html

Unificied Modeling Language Resource Center (UML). Popkin Software.
 
http://www.popkin.com/customers/customer_service_center/enterprise_architecture_resource_center/uml.htm

W3C. Comparison of SGML and XML. W3C Note. http://www.w3.org/TR/NOTE-sgml-xml.html

W3C. DAM+OIL Reference Description. http://www.w3.org/TR/daml+oil-reference

W3C. Especificación HTML. http://www.w3.org/TR/html4/

W3C.Extensible Markup Language XML W3C Recommendation. http://www.w3.org/TR/REC-xml/

W3C. Resource Description Framework (RDF). http://www.w3.org/RDF/

W3C. The Extensible Stylesheet Language Family (XSL). http://www.w3.org/Style/XSL/

W3C. XML Linking Language (XLink). W3C Recommendation. http://www.w3.org/TR/xlink/.

W3C. OWL Web Ontology Language Reference. http://www.w3.org/TR/owl-ref/

W3C. XHTML. The Extensible HyperText Markup Language: A reformulation of HTML en XML. http://www.w3.org/TR/html/

W3C. XML Pointer Language (XPointer). http://www.w3.org/TR/xptr/

W3C. W3C Web Internationalization FAQs. http://www.w3.org/International/questions/

     Arriba 



SGML
HTML
DHTML
Hojas de Estilo (CSS)
XML
XHTML
RDF
RSS
DAML-OIL
OWL
 

 Título: Hipertexto, el nuevo concepto de documento en la cultura de la imagen
 Autora: María Jesús Lamarca Lapuente (currículo personal)

 Contacta

 Tesis doctoral. Universidad Complutense de Madrid

 URL: http://www.hipertexto.info

 Fecha de Actualización: 08/12/2013   

 184 páginas web. 2.627 archivos. 2.208 imágenes. Tamaño: 52.406Kb.
 34.389 enlaces (10.436 externos y 23.953 internos)
  

Ver el perfil de María Jesús Lamarca Lapuente en LinkedIn

Esta obra está licenciada bajo las siguientes condiciones: 
Creative Commons License
Creative Commons Reconocimiento-NoComercial-NoDerivados-Licencia España 2.5.

 


OTRAS PÁGINAS DE LA AUTORA
 

           Blog El Cultural a la PuertaBlog El Cultural a la Puerta:: http://puertadetoledo.blogspot.com/ 

                                                                                                                AGETECA. Base de Datos de Gestión Cultural
                                                                                                                 Ageteca. Base de Datos de Gestión Cultural:
      
                                                                                                    http://www.agetec.org/ageteca

Fundación Ricardo Lamarca, ajedrez y cultura

Fundación Ricardo Lamarca, Ajedrez y cultura http://www.fundacionlamarca.es

 

 

La artesa digital

Blog La artesa digital
http://artesadigital.blogspot.com.es

Especial Poesía: Hasta allí hemos llegado

Blog La artesa digital Flickr La artes@ digital: Galería de fotos mundo
 digital y mundo analógico: http://www.flickr.com/photos/artesadigital/

Blog miembras

Blog Miembras: usos lingüísticos, políticos y sociales del lenguajeBlog Miembras: Usos lingüísticos, políticos
 y sociales del lenguaje http://miembras.blogspot.com

 

Mapa de navegación / Tabla de contenido / Mapa conceptual / Tabla de documentos / Buscador / Bibliografía utilizada / Glosario de Términos / Índice Temático / Índice de Autores