22 de octubre de 2011

Produccion y estructuración de documentos digitales

Se habla de estructuración de documentos digitales, ya que, la información contenida en ellos debe llevar una estructura previa, con el fin de que puedan ser leidos por los computadores, de tal manera que se puedan recuperar, en este sentido se habla de estructura y sintaxis que es determinada por el programa o por la persona quie lo crea, de esta manera se identifica si el documento es estructurado, no estructurado o semiestructurado,
Pòr otro lado la estructuración de los documentos digitales la define sus metadatos que son aquellos que se relacionan con el contenido del texto de un documento y se expresan por medio de lenguajes de marcado, que son la herramienta fundamental para la estructuración de documentos y su asociación con metadatos, es esencial entenderlos especificamente el XML, en este sentido, los mismos expresan un grado de orden en la estructura del documento y permite clasificarlos por su estructura.
Los documentos que no tienen una estructura definida no pueden ser diferenciados por partes dentro de una interfaz de software, de tal manera que el contenido del texto es interpretado como un solo elemento, en este sentido; al ser clasificado es necesario agregarle alguna información que sea característica del texto con el fin de que pueda ser encontrada por su texto o fecha, esta forma de marcar los documentos y dividir sus datos se conoce como documentos semiestructurados, las marcas dentro del documento deben ser definidas de tal manera que no se confunda con la información original y que no se pierdan elementos del lenguaje que ayudan a inferir cierta información.

Los documentos semiestructurados carecen de un esquema explicito, la estructura de marcado no es del todo rígida, posee distinción difusa entre la estructura de información y los datos, el esquema puede ser posterior a la estructuración del documento; actualmente en los repositorios documentales el documento más utilizado es aquel que no posee una estructura definida para lo cual se hace necesario definir esquemas que hagan recuperable y accesible la información para necesidades especificas.

Los metadatos se pueden definir como aquellos datos que son característicos del documento y que lo definen pueden ser título, autor etc., proporcionan una información básica del documento. Existen tres aspectos principales para el desarrollo de los metadatos que son: descripción de recursos, producción de metadatos y uso de los metadatos.

El formato de metadatos MARC que utiliza diferentes campos para definir atributos de una entrada bibliográfica, funciona como una serie de datos descriptivos en le material bibliográfico; además del anterior han surgido diferentes iniciativas de manejo de metadatos como DUBLIN CORE y estándares de definición de la información como el RDF que consiste en una descripción de nodos en la red.

Existen varias clasificaciones de metadatos como lo son administrativos o factuales, descriptivos, independientes de contenido, dependientes del contenido, basados en el contenido directo, descriptivos del contenido, independientes del dominio y de un dominio especifico.

El manejo de los metadatos trae consigo ventajas para satisfacer las necesidades de información ya que le permite recuperar o descubrir las fuentes de información, puede obtener una descripción de la información y saber si esta le sirve o no, identificar la propiedad intelectual del documento; en concreto la utilización de los metadatos debe ser suficiente para satisfacer todas las necesidades de información que se resumen en el acceso a la información y la utilidad en la información.

No hay comentarios:

Publicar un comentario