Memorias de clase Universidad de Lasalle, Sistemas de Información y Documentación
27 de octubre de 2011
CALIDAD DE DOCUMENTOS TEXTO PLANO, DIGITALIZADOS EN FORMATO TIFF JPG PDF
LA BASE DE INTEROPERABILIDAD EN LOS SISTEMAS DE INFORMACION DOCUMENTAL.
26 de octubre de 2011
TRANSFORMACIONES DE DOCUMENTOS DIGITALIZADOS A FORMATO OCR
EL ARCHIVISTA FRENTE A DOCUMENTOS ELECTRONICOS
LA GESTION DE CONTENIDOS
LEY 1341 DEL 30 DE JULIO DE 2009
CRITERIOS DE DIGITALIZACION DE DOCUMENTOS
- El almacenamiento de los documentos se debe general en dos tipos de archivo, uno de conservación y otro de consulta, para tal caso se utilizará el formato JPG o TIFF como archivo de conservación ya que, garantiza el almacenamiento y menor perdida de caracteres y como archivo de consulta se utilizara el formato PDF que garantiza el acceso y descarga de los documentos.
- Inicialmente todos los documentos serán digitalizados en formato JPG y/o TIFF con el fin de garantizar el contenido de los documentos en su totalidad, posteriormente serán convertidos en formato PDF para accesibilidad.
- Los documentos serán digitalizados en tres resoluciones que son 100 DPI, 200 DPI y 300 DPI, con el fin de analizar e identificar las diferencias, sin embargo la resolución idónea es a 200 DPI ya que es un pixel de buena calidad y es almacenable.
- Los documentos serán digitalizados a color de 24 BITS, porque se tiene en cuenta el RGB que son 8 BITS por canal de color, en este caso tres, el resultado es 24 BITS; posteriormente serán convertidos a Bitonal y escala de grises
- La fuente de papel utilizada será el cristal de escáner ya que se van a digitalizar documentos en varias aplicaciones y la bandeja alimentadora no garantiza la integridad del documento y todos los documentos son hojas sueltas.
- Los archivos serán almacenados en todos los formatos comprimido y no comprimidos con el fin de analizar calidad y peso en el archivo
DOCUMENTOS EN XML
XML Lenguaje Extensible de Marcas
Este lenguaje es utilizado para estructurar documentos en forma de árbol, dicho lenguaje se puede comparar con el sistema de clasificación Dewey utilizado en bibliotecas, ya que su función es normalizar los formatos, las estructuras y los contenidos de los documentos, este lenguaje permite el uso eficiente de la información a nivel sintáctico.
XML es considerado como base de la interoperabilidad, utilizando meta lenguaje basado en marcas y etiquetas que sean entendidas por maquinas y por el humano.
Los objetivos de XML Hacer utilizable Internet.
Dar soporte a todo tipo de aplicaciones.
Compatibilidad con SGML
Documentos legibles por humanos.
Diseño de los documentos preparado pero rápido.
Diseño formal y conciso.
Documentos fáciles de crear.
Marcación breve.
XML SE CARACTERIZA POR:
Ofrecer independencia respecto a las aplicaciones (además codifica información Unicode)
Contextualización de la información (Semántica y estructura)
Elementos del documento describen su estructura (modular y lógica).
Garantiza la estructura organizada del documento.
Garantiza validez del documento (Utilización de plantillas)
Posee campos de información y control para las aplicaciones.
Permite enlaces a datos relacionados (Hiperdocumento).
Permite la libertad de formato y medio.
El documento XML posee una anatomía con dos componentes:
EL PROLOGO
Que se divide en:
Declaración XML
Que hace referencia a los aplicativos, la versión, los caracteres y la codificación.
Declaración de procesamiento
Que hace referencia a como validar la información del documento, la instrucciones para su procesamiento y para que se incluyan los comentarios de cada documento.
2. EL CUERPO
Que se divide en:
Estructura
Donde se encuentran
los elementos o etiquetas
Los atributos.
Entidades
Contenidos asociados.
EL DOCUMENTO XML
Existen 2 modalidades
El documento bien formado
El documento valido.
--------------------------------------------------------------------
GÓMEZ DUEÑAS, Laureano Felipe. XML la base de la interoperabilidad en los sistemas de información documental. En: CODICE : Publicación de la Universidad de Lasalle. Programa Sistemas de Información, Jul- Dic 2007, Vol.3, no 002, p. 105-127
CONCEPTOS BASICOS DE DIGITALIZACIÓN
Qué es un Pixel?
Es un mapa de la imagen digital, en forma de cuadricula de puntos o elementos de la figura. A cada pixel se le asigna un valor tonal: negro, blanco, escala de grises o color, y está representado en código binario, es decir por ceros y unos.[1]
Qué es la Resolución?
Es el detalle que puede observarse en una imagen, sirve para ver que tan nítida es una imagen, cuan mayor es la resolución, mayor es el detalle o calidad visual de la imagen.[2]
Qué es la Dimensión de píxel?
La dimensión del pixel, es la medida horizontal y vertical de una imagen, expresada en pixeles, se calcula multiplicando el ancho, la altura por el dpi.[3]
Qué es un DPI?
Pixels-per-inch (píxeles por pulgada), es la unidad de medida de la resolución de una imagen, hace referencia a la cantidad de puntos que entran en una pulgada.[4]
Qué es la Profundidad de Bits?
Es la cantidad de bits que se utilizan en cada pixel, la profundidad de bits se da en blanco y negro o bitonal, escala de grises y color, para cada uno varía la cantidad de bits que usa.[5]
Qué es RGB?
En ingles es Red, Green, Blue (Rojo, Verde, Azul), se refiere a los colores primarios, por el cual es posible representar un color mediante la mezcla de los tres colores luz primarios por adición.[1]
Para la mezcla de estos colores se usa la síntesis aditiva de color, que consiste en la emisión luz directamente de una fuente de iluminación de algún tipo, en este proceso por lo general se usa luz roja, verde y azul, para la reproducción de mas colores.[2]
Cuántos colores se pueden establecer con RGB?
El conjunto de todos los colores se puede representar en forma de cubo. Cada color es un punto de la superficie o del interior de éste. La escala de grises estaría situada en la diagonal que une al color blanco con el negro.[1]
Qué es y cómo se calcula el tamaño de un archivo de Imagen?
el tamaño hace referencia al tamaño digital de un archivo de imagen, se calcula en kilobytes (K), megabytes (MB) o gigabytes (GB), es proporcional a las dimensiones en pixeles de la imagen, es decir las imágenes con mas pixeles muestran mejor los detalles en un tamaño de impresión determinado.[1]
El tamaño de la imagen se calcula de dos maneras:
Se calcula multiplicando el área de superficie (altura x ancho) de un documento a ser escaneado, por la profundidad de bits y el dpi2. Debido a que el archivo de imagen se representa en bytes, que están formados por 8 bits, se divide esta cifra por 8.
Fórmula 1: (altura x ancho x profundidad de bits x dpi2) / 8 |
Si se proporcionan las dimensiones de píxel, se multiplican entre sí y por la profundidad de bit para determinar la cantidad de bits presentes en un archivo de imagen.[2]
Fórmula 2: (dimensiones de píxel x profundidad de bits) / 8 |
Qué es y para qué sirve la compresión de imágenes?
La compresión de imágenes es la reducción del volumen de información, con el objetivo de transportar la información en la menor cantidad de espacio posible.[1]
Las imágenes digitales tienden a ser muy pesadas, lo que hacen que ocupen una mayor cantidad de espacio en el disco, la compresión se usa para facilitar el almacenamiento, procesamiento y transmisión de la información.[2]
[1] http://es.wikipedia.org. En línea [ Termino de búsqueda: Que es la compresión de imágenes], [Fecha de Consulta: Noviembre 17 de 2010]
[2] www.library.cornell.edu/preservation/tutorial-spanish/intro/intro-09.html. En línea [Termino de Búsqueda: Compresión de imágenes], [Fecha de Consulta: Noviembre 17 de 2010]
[1] http://es.wikipedia.org. En línea [ Termino de búsqueda: Que es la compresión de imágenes], [Fecha de Consulta: Noviembre 17 de 2010]
[2] www.library.cornell.edu/preservation/tutorial-spanish/intro/intro-09.html. En línea [Termino de Búsqueda: Compresión de imágenes], [Fecha de Consulta: Noviembre 17 de 2010]
[1] http://help.adobe.com. En línea: [Termino de búsqueda: Que es el tamaño de un archivo de imagen], [Fecha de Consulta: Noviembre 17 de 2010].
[2] www.library.cornell.edu/preservation/tutorial-spanish/intro/intro-09.html. En línea [Termino de Búsqueda: Tamaño de archivo], [Fecha de Consulta: Noviembre 17 de 2010]
[1] www.wikipedia.com. En línea: [Termino de búsqueda: Que es RGB], [Fecha de Consulta: Noviembre 17 de 2010].
[1] www.wikipedia.com. En línea: [Termino de búsqueda: Que es RGB], [Fecha de Consulta: Noviembre 17 de 2010]
[2] www.wikipedia.com. En línea: [Termino de búsqueda: Síntesis aditiva de color], [Fecha de Consulta: Noviembre 17 de 2010].
[1] www.alegsa.com.ar/Dic. En línea [Término de Búsqueda: Que es un Dpi]. [Fecha de consulta: Noviembre 16 de 21010]
[2] www.library.cornell.edu/preservation/tutorial-spanish/intro/intro-09.html. En línea [Termino de Búsqueda: Profundidad de bits], [Fecha de Consulta: Noviembre 16 de 2010]
[1] www.library.cornell.edu/preservation/tutorial-spanish/intro/intro-09.html. En línea [Termino de Búsqueda: Pixeles], [Fecha de Consulta: Noviembre 16 de 2010].
[2] www.wikipedia.com. En línea: [Termino de búsqueda: Resolución de una Imagen], [Fecha de Consulta: Noviembre 16 de 2010].
[3] www.library.cornell.edu/preservation/tutorial-spanish/intro/intro-09.html. En línea [Termino de Búsqueda: Dimensión de Pixeles], [Fecha de Consulta: Noviembre 16 de 2010]