viernes, 22 de abril de 2011

Descripción normalizada de la información en Internet


Se realiza una búsqueda en Dialnet con la siguiente ecuación de búsqueda: Normalización AND Web  y los resultados recuperados han sido 36 documentos, de entre los que se ha seleccionado el siguiente como artículo que describe la asignatura: Localización, identicación y descripción de recursos web: tentativas hacia la normalización Comunicación publicada en las Jornadas Españolas de Documentación (7. 2000. Bilbao). Bilbao: Universidad del País Vasco, FESABID, 2000, p. 221-231.
Eva María Méndez Rodríguez (Universidad Carlos III de Madrid)
José Antonio Merlo Vega (Universidad de Salamanca)

Resumen:
La normalización en el ámbito de la documentación y la biblioteconomía queda justificada por dotar de calidad y consistencia a la información, por compatibilizar estructuras de datos y por facilitar la recuperación y el intercambio de información.

En este artículo se analizan distintos estándares de normalización de la información en el ámbito de la Web, para la identificación de los recursos, su descripción, acceso y referencia, puesto que Internet es un medio dinámico en el que la información no está organizada en torno a ningún criterio de gestión documental, y son múltiples las tipologías y materias que se pueden encontrar.

Estas características propias de la documentación en un entorno Web suponen una problemática en torno a la ubicación, a la descripción interna y a la descripción formal de todas estas tipologías documentales, de forma que se hace un repaso a las distintas normas que se han desarrollado para cada uno de estos problemas.

Para la identificación y localización documentos Web los estándares que existen son:

-          Uniform Resource Identifiers (URI): es una cadena compacta de caracteres con sintaxis controlada para identificar de forma única un recurso físico o abstracto.

-          Uniform Resource Name (URN): Su sintaxis se estructura en tres bloques separados por dos puntos: el identificador URN es el código que indica el tipo de localizador, el NID o nombre de la categoría en la que se incluye el documento que se pretende identificar y el NSS o cadena que específica la ruta y el documento en cuestión. Cabe destacar que este sistema trabaja a la par de Uniform Resource Characteristics (URC), esquema para la descripción de metadatos.

-          Uniform Resource Locator (URL): es el sistema de acceso a los documentos común en la World Wide Web e indica el protocolo a través del que se localiza el documento, el servidor en el que está alojado, el directorio en el que se encuentra  y el nombre y la extensión del archivo.

-          Persistent Uniform Resource Locator (PURL): es un URL con redireccionamiento automático cuando un documento cambia de dirección. Tiene la misma estructura que un URL aunque funciona como intermediario entre la dirección antigua de un documento web y la nueva dirección.

-          Digital Object Identifier (DOI): es un código de identificación única y persistente de carácter comercial que se forma de un prefijo que identifica el directorio en el que se encuentra el documento y un sufijo en que se expresa el código del objeto digital.


Para la descripción de contenidos web:

-          Dublin Core (DC): es un estándar de metadatos para describir el contenido de  documentos digitales para facilitar la interoperabilidad semántica en la web. Son quince elementos opcionales y repetibles: siete elementos de contenido (title, subject, description, source, language, relation, coverage), cuatro elementos con la información relativa a la propiedad intelectual (creator, Publisher, contributor, rights), y cuatro elementos de identificación (data, type, format, identifier). Este estándar es el más utilizado en para la catalogación de recursos web en bibliotecas digitales ya que permite la inteoperabilidad.

-          Text Encoding Initiative (TEI): cuyo propósito originario era la codificación de textos literarios. Se trata de una definición del tipo de documento DTD formada de SGML, lenguaje de marcado para la indización y el intercambio de información textual. En la cabecera de su esquema (TEIH) permite definir una descripción bibliográfica detallada.

-          Resource Description Framework (RDF): es el estándar más importante para la descripción de contenidos web. Es un lenguaje para la definición de ontologías y metadatos en la web, para expresar los objetos y sus relaciones. La construcción de este lenguaje es en sentencia SUJETO-PREDICADO-OBJETO.
 
    En el que sujeto es el recurso, el predicado es un arco que representa las propiedades o la relación. El objeto es el valor de la propiedad o el otro recurso con el que se establece la relación. Utiliza XML para proporcionar un marco estándar para la interoperabilidad entre distintos modelos de metadatos.

-          CIMI (Computer Interchange of Museum Information) para la información de museos digitales
-          Federal Geographic Data Committee (FGDC) el estándar de contenido para la información digital geoespacial
-          EAD (Encoded Archival Description) para la información archivística


Relación entre el artículo seleccionado y el contenido de la asignatura:

Este artículo está estrechamente relacionado con la asignatura de descripción normalizada de la información porque en ésta se pone en conocimiento del alumno la importancia y la necesidad de  utilizar estándares para permitir la interoperabilidad entre distintos sistemas tecnológicos para la transmisión de información, para su almacenamiento y muy importante, para su recuperación.
También, tanto el artículo como la asignatura, señalan los estándares y normativas nacionales e internacionales para la descripción de documentos digitales así como las instituciones y organismos de los que emanan.
Otro aspecto común en la asignatura y el artículo es que la normalización dota a la información de calidad y consistencia.

No hay comentarios:

Publicar un comentario

Deja tu comentario