Se realiza una búsqueda en Dialnet con la siguiente ecuación de búsqueda: Normalización AND Web y los resultados recuperados han sido 36 documentos, de entre los que se ha seleccionado el siguiente como artículo que describe la asignatura: Localización, identicación y descripción de recursos web: tentativas hacia la normalización Comunicación publicada en las Jornadas Españolas de Documentación (7. 2000. Bilbao). Bilbao: Universidad del País Vasco, FESABID, 2000, p. 221-231.
Eva María Méndez Rodríguez (Universidad Carlos III de Madrid)
José Antonio Merlo Vega (Universidad de Salamanca)
Resumen:
La normalización en el ámbito de la documentación y la biblioteconomía queda justificada por dotar de calidad y consistencia a la información, por compatibilizar estructuras de datos y por facilitar la recuperación y el intercambio de información.
En este artículo se analizan distintos estándares de normalización de la información en el ámbito de la Web, para la identificación de los recursos, su descripción, acceso y referencia, puesto que Internet es un medio dinámico en el que la información no está organizada en torno a ningún criterio de gestión documental, y son múltiples las tipologías y materias que se pueden encontrar.
Estas características propias de la documentación en un entorno Web suponen una problemática en torno a la ubicación, a la descripción interna y a la descripción formal de todas estas tipologías documentales, de forma que se hace un repaso a las distintas normas que se han desarrollado para cada uno de estos problemas.
Para la identificación y localización documentos Web los estándares que existen son:
- Uniform Resource Identifiers (URI): es una cadena compacta de caracteres con sintaxis controlada para identificar de forma única un recurso físico o abstracto.
- Uniform Resource Name (URN): Su sintaxis se estructura en tres bloques separados por dos puntos: el identificador URN es el código que indica el tipo de localizador, el NID o nombre de la categoría en la que se incluye el documento que se pretende identificar y el NSS o cadena que específica la ruta y el documento en cuestión. Cabe destacar que este sistema trabaja a la par de Uniform Resource Characteristics (URC), esquema para la descripción de metadatos.
- Uniform Resource Locator (URL): es el sistema de acceso a los documentos común en la World Wide Web e indica el protocolo a través del que se localiza el documento, el servidor en el que está alojado, el directorio en el que se encuentra y el nombre y la extensión del archivo.
- Persistent Uniform Resource Locator (PURL): es un URL con redireccionamiento automático cuando un documento cambia de dirección. Tiene la misma estructura que un URL aunque funciona como intermediario entre la dirección antigua de un documento web y la nueva dirección.
- Digital Object Identifier (DOI): es un código de identificación única y persistente de carácter comercial que se forma de un prefijo que identifica el directorio en el que se encuentra el documento y un sufijo en que se expresa el código del objeto digital.
Para la descripción de contenidos web:
-
Dublin Core (
DC): es un estándar de metadatos para describir el contenido de documentos digitales para facilitar la interoperabilidad semántica en la web. Son quince elementos opcionales y repetibles: siete elementos de contenido (title, subject, description, source, language, relation, coverage), cuatro elementos con la información relativa a la propiedad intelectual (creator, Publisher, contributor, rights), y cuatro elementos de identificación (data, type, format, identifier). Este estándar es el más utilizado en para la catalogación de recursos web en bibliotecas digitales ya que permite la inteoperabilidad.
- Text Encoding Initiative (TEI): cuyo propósito originario era la codificación de textos literarios. Se trata de una definición del tipo de documento DTD formada de SGML, lenguaje de marcado para la indización y el intercambio de información textual. En la cabecera de su esquema (TEIH) permite definir una descripción bibliográfica detallada.
-
Resource Description Framework (
RDF): es el estándar más importante para la descripción de contenidos web. Es un lenguaje para la definición de ontologías y metadatos en la web, para expresar los objetos y sus relaciones. La construcción de este lenguaje es en sentencia SUJETO-PREDICADO-OBJETO.
En el que sujeto es el recurso, el predicado es un arco que representa las propiedades o la relación. El objeto es el valor de la propiedad o el otro recurso con el que se establece la relación. Utiliza XML para proporcionar un marco estándar para la interoperabilidad entre distintos modelos de metadatos.
- CIMI (Computer Interchange of Museum Information) para la información de museos digitales
- Federal Geographic Data Committee (FGDC) el estándar de contenido para la información digital geoespacial
Relación entre el artículo seleccionado y el contenido de la asignatura:
Este artículo está estrechamente relacionado con la asignatura de descripción normalizada de la información porque en ésta se pone en conocimiento del alumno la importancia y la necesidad de utilizar estándares para permitir la interoperabilidad entre distintos sistemas tecnológicos para la transmisión de información, para su almacenamiento y muy importante, para su recuperación.
También, tanto el artículo como la asignatura, señalan los estándares y normativas nacionales e internacionales para la descripción de documentos digitales así como las instituciones y organismos de los que emanan.
Otro aspecto común en la asignatura y el artículo es que la normalización dota a la información de calidad y consistencia.