Autor/s: Juanes, P. C.
DIGIBIS
Títol: Colecciones cartográficas y enriquecimiento semántico de datos geográficos en DIGIBIB
Temàtica: Cartografia històrica
Publicat a: Revista Catalana de Geografia
IV època / volum XIX / núm. 50 / novembre 2014
Font: -
URL: http://www.rcg.cat/articles.php?id=320

 

COLECCIONES CARTOGRÁFICAS Y ENRIQUECIMIENTO SEMÁNTICO DE DATOS GEOGRÁFICOS EN DIGIBIB 

Paulo César Juanes
DIGIBIS



Introducción

La consolidación de proyectos como Hispana1, Europeana2 y la DPLA (Digital Public Library of America)3, que dan acceso a millones de recursos digitales dispersos en diferentes áreas geográficas y con una amplia diversidad lingüística y documental, inciden en la necesidad de proporcionar más y mejores datos que faciliten nuevas estructuras de navegación y permitan vertebrar la gran cantidad de información que proporcionan estas bases de datos.

El incremento sustancial en el número de proyectos de digitalización que se ha experimentado en los últimos años y la creación de repositorios digitales está favoreciendo la consolidación de LOD (Linked Open Data), una tecnología y una práctica global que va más allá de las bibliotecas, archivos y museos, que se centra en la necesidad de vincular recursos y ofrecer información contextual que permita estructurar los datos para mejorar las capacidades semánticas de la información accesible en la Web.

Ante esta situación, las colecciones cartográficas se enfrentan a un doble reto. Por un lado, proporcionar un acceso a la producción digital que atesoran, utilizando protocolos de intercambio fiables y que se integren en el flujo de las actividades de gestión de la colección. Por otro, proporcionar datos geográficos de alto valor informativo que permitan identificar un lugar a través de un nombre y a través de unas coordenadas que posibiliten ubicar geográficamente recursos.

Esta comunicación detalla, en definitiva, la creación de recursos digitales y la administración de colecciones cartográficas a través del Sistema de Gestión DIGIBIB, que permite la catalogación de registros bibliográficos, ejemplares y autoridades en formato MARC 21 Update 18 (abril 2014) adecuados a RDA, la georreferenciación a partir de la asignación de coordenadas geográficas a las descripciones, y el enriquecimiento semántico y sistemático de los datos geográficos, a través del campo 024 del formato MARC, mediante el uso de fuentes Linked Open Data como el Getty Thesaurus of Geographic Names, GeoLinkedData, GeoNames o los encabezamientos topográficos de la Lista de Encabezamientos de Materia para las Bibliotecas Públicas en SKOS.


1. La importancia de un modelo de gestión estandarizado

Los pilares sobre los que se sustentan la gestión y la administración de las colecciones cartográficas digitales son la adopción de diferentes esquemas de metadatos, la adecuación y actualización del software utilizado en la gestión de la colección digital, así como el posterior almacenamiento en repositorios adaptados al protocolo OAI-PMH (Open Archives Initiative-Protocol Metadata Harvesting).

Parece claro que el punto de partida para la construcción de una colección cartográfica digital y el núcleo sobre el que se basa la gestión de la propia colección reside en los objetos digitales. En este sentido, es imprescindible deshacer el equívoco que puede existir a la hora de considerar que la digitalización se limita únicamente a convertir un documento original en un objeto digital, a través de procedimientos de captura de imagen y almacenamiento posterior en un soporte externo. Se trata de mucho más. Se trata de proporcionar los metadatos que permiten la descripción detallada de las copias digitales y de sus originales, de mostrar los metadatos relacionados con la captura de las imágenes o generación de textos y el almacenamiento de los mismos, así como la descripción de todos y cada uno de los procesos que dan lugar a los objetos digitales definitivos (Hernando de Larramendi et al., 2009).

La aplicación de diferentes esquemas de metadatos, con diferentes funciones, como los descriptivos, estructurales, de preservación o administrativos, dentro de los que podríamos destacar los propios de las imágenes y los textos o los relativos a la propiedad de los objetos, proporcionan a la colección digital la visibilidad y accesibilidad necesaria que garantizan su reutilización a largo plazo.

Si bien la creación de los objetos digitales es el punto de partida en la gestión de las colecciones cartográficas digitales, la adopción del protocolo OAI-PMH ha contribuido enormemente al desarrollo y aumento de este tipo de colecciones. Los repositorios permiten mostrar el contenido digital de las instituciones de una forma rápida y sencilla. Su estructura se basa en la adaptación de un servidor accesible a través de la Web, que es capaz de interpretar y responder las preguntas que formula un recolector y, de esta forma, la colección digital que antes era difícilmente consultable, pasa a disponer de un importante protagonismo.

El éxito del protocolo OAI-PMH queda reflejado en el importante aumento de visibilidad experimentado por algunas colecciones cartográficas como, por ejemplo, las Colecciones del Departamento de Cartografía y Artes Gráficas de la Biblioteca Digital de la Real Academia de la Historia4, el apartado de Mapas, Planos y Dibujos del Archivo General de Simancas del Catálogo Colectivo de las Bibliotecas de Archivos Estatales5, la Colección de Cartografía Antigua de la Biblioteca de Galicia6 o la Cartografía de la Guerra de la Independencia accesible a través de la Biblioteca Virtual del Patrimonio Bibliográfico7, que han agregado sus colecciones digitales a los principales servicios de recolección de contenidos, nacionales e internacionales, como Hispana o Europeana a través del repositorio OAI-PMH implementado con el Sistema de Gestión DIGIBIB.

Sin duda, la falta, o la insuficiencia, de un sistema de gestión optimizado que incluya un procedimiento integrado en la catalogación de recursos y que verdaderamente pueda poner en valor el contenido de la colección cartográfica, puede provocar que el esfuerzo en la descripción y análisis documental de los materiales que lo constituyen tenga un efecto muy limitado.


1.1 La necesidad de una digitalización enriquecida

La digitalización de material cartográfico presenta unas dificultades derivadas fundamentalmente de su tamaño. No es infrecuente que supere el tamaño A0 y tampoco resulta raro que se encuentre plegado una o varias veces (o en estuches o encuadernaciones) en los depósitos. Además de su gran tamaño, presenta características formales muy significativas, como:

  • La altimetría representada por líneas.
  • La división política o geográfica, que supone una segmentación de la imagen.
  • La proliferación de nombres topográficos escritos muy frecuentemente a mano, especialmente en mapas de grandes dimensiones.

 

La creación de estos objetos digitales debe ir acompañada de metadatos que aseguren la calidad final del proyecto y la interoperabilidad de los resultados. Por este motivo el Sistema de Gestión DIGIBIB se ha desarrollado bajo una premisa fundamental, no sólo generar los metadatos necesarios que garanticen la calidad de la colección cartográfica, sino además disponer de mecanismos de integración que permitan reutilizar toda la información asociada a los objetos digitales.

Existe una amplia variedad de esquemas de metadatos. Si atendemos a las categorías establecidas por Gilliland (2008) encontraremos esta tipología:

  • Metadatos administrativos: usados en la gestión y administración de recursos de información.
  • Metadatos descriptivos: utilizados para representar los recursos de información.
  • Metadatos de preservación: para salvaguardar los recursos.
  • Metadatos técnicos: relativos a cómo funcionan los sistemas o el comportamiento de los metadatos.
  • Metadatos de uso: relativos al nivel y tipo de uso que se hace con los recursos.

 

Otros tutoriales, como el de digitalización de imágenes de la Cornell University Library (2003) o la más reciente actualización de las Directrices prácticas en materia de digitalización de la Fundación Alemana de Investigación Científica (Deutsche Forschungsgemeinschaft, 2013), hacen uso de tres amplias categorías de metadatos: descriptivos, estructurales y administrativos.

El objetivo de estos metadatos no es otro que proporcionar toda la información referente a la descripción bibliográfica y a los ejemplares digitalizados y a cada uno de los procesos que han dado lugar al objeto digital definitivo. Este conglomerado de metadatos se codifica en un fichero METS8 (Metadata Encoding & Transmission Standard) definido como un empaquetador de metadatos que permite describir y transmitir objetos digitales entre diferentes sistemas de información y que conforman un SIP (Submission Information Package), un fichero de entrada en un sistema de preservación digital basado en OAIS (Open Archival Information System).

De esta forma, la colecciones cartográficas administradas con el Sistema de Gestión DIGIBIB, además de proporcionar acceso a la imagen propiamente dicha, proporcionan por cada uno de los objetos digitalizados un fichero METS en el que se incluyen extensiones de:

  • Metadatos descriptivos, codificados en DC (Dublin Core), MODS (Metadata Object Description Schema) o MARCXML para describir el recurso de información y permitir su búsqueda y recuperación.
  • Metadatos estructurales, con la relación de ficheros que componen el objeto digital. 
  • Metadatos administrativos, con metadatos de preservación siguiendo el esquema PREMIS 2.3, metadatos técnicos en los que se refleja el tipo y modelo de escáner, la resolución o la profundidad de bits siguiendo el esquema MIX (Metadata for Images in XML) y de derechos de autor y propiedad intelectual según METSRights.

 

figura_1_04

Figura 1. Extracto de fichero METS generado a través de DIGIBIB.
Fuente: Sistema de Gestión DIGIBIB. Elaboración propia.


1.2 Descripciones cartográficas adecuadas a las nuevas reglas de catalogación: RDA

El nuevo código de catalogación RDA (Resource Description and Access) supone un avance respecto a las AACR2 (Anglo-American Cataloguing Rules). Según la Biblioteca Nacional de España (2010), las RDA suponen un considerable cambio en la estructura de las reglas con respecto a los códigos actuales de catalogación, puesto que son consideradas las primeras reglas con posibilidades reales de universalidad, pensadas para el mundo digital, capaces de trabajar en un entorno web y en ámbitos más amplios que las propias bibliotecas. Para ello, RDA tiene entre sus objetivos:

  • Ser fácil de usar e interpretar.
  • Ser aplicable en un entorno en línea e interconectado.
  • Proporcionar un control bibliográfico efectivo para todo tipo de medios.
  • Promover su uso más allá de la comunidad bibliotecaria.
  • Ser compatible con otras normas similares.
  • Ofrecer una estructura lógica basada en principios internacionalmente aceptados.
  • Separar la información sobre contenidos, soportes y visualización.

 

Con estos objetivos las RDA sustituyen a las AACR2. Pretenden zanjar los problemas derivados de ésta como su alta complejidad, su falta de estructura lógica, la mezcla de contenidos con soportes de información, la ausencia de relaciones jerárquicas o su escasa compatibilidad con los FRBR (Functional Requirements for Bibliographic Records).

Desde que en junio de 2010 se publicaran las normas RDA, hasta su puesta en producción el 1 de abril de 2013 por parte de las tres Bibliotecas Nacionales de los Estados Unidos (Library of Congress, National Agricultural Library, National Library of Medicine), la evolución y los desarrollos que se han producido en materia de catalogación no han cesado. Así, el formato MARC 21 (Machine Readable Cataloging), desde su novena actualización, en el año 2010, hasta la decimoctava, de abril de 2014, ha incluido numerosas modificaciones en campos y subcampos para la adaptación al nuevo código de catalogación.

La Biblioteca del Congreso de Estados Unidos mantiene, desde su sitio Web9, una página en la que recopila todos los cambios introducidos y que afectan a la adopción de RDA, desde la inclusión de nuevos campos y subcampos en el formato MARC, hasta el cambio de modelo en la forma de asignar la información, suprimiendo abreviaturas o signos de puntuación tradicionalmente incluidos en la descripción de materiales.

Estos cambios en la descripción no son ajenos al material cartográfico, por lo que la metodología en la descripción de colecciones cartográficas varía y requiere de cambios en la gestión y el tratamiento de determinados campos MARC (Novotná, 2013).

 Campo  Subcampo   Cambio
 255  a• Se desestima el uso de corchetes.
• La escala siempre se expresa en forma de fracción 1:n.
• Uso del texto normalizado "Mapa trazado sin usar escala" en caso de ser necesario.
• En caso de aparecer tres o más escalas deben indicarse todas.
• Uso del texto normalizado "Diferentes escalas" en caso de aparecer varios mapas con escalas desconocidas.
 255  b • No se usan abreviaturas.
 255  c • Se permite la asignación de coordenadas decimales.
 300  a • Uso de términos normalizados en la descripción física del material.
 336  • Uso obligatorio del campo Tipo de contenido.
 337  • Uso recomendado del campo Tipo de medio.
 338   • Uso obligatorio del campo Tipo de soporte.

Tabla 1. Cambios en la descripción RDA de material cartográfico.
Fuente: El profesional de la Información. Elaboración propia.


En España, pocos son los ejemplos de bibliotecas que han comenzado a implementar el nuevo código catalográfico. Así lo demuestra la encuesta que el pasado 9 de mayo de 2014 la Biblioteca Nacional de España enviaba a bibliotecas de todo el país para recabar su opinión y conocer las decisiones que hubieran tomado o fueran a tomar respecto a la adopción de RDA.

Fruto de esa encuesta, se recibieron 128 respuestas, en las que se determinaba que 4 bibliotecas no implementarán las RDA, 18 sí lo harán y 106 no han tomado una decisión al respecto. Esta indeterminación se fundamenta en el hecho de que las RDA suponen un cambio considerable con respecto a los códigos actuales de catalogación. Su adaptación obliga a un replanteamiento en la metodología de gestión y a la adaptación de los sistemas de catalogación que no siempre trabajan con la misma versión del formato MARC (Estivill, 2012) y que queda perfectamente reflejado en los resultados de la encuesta de la Biblioteca Nacional, al comprobar que de las 128 respuestas ofrecidas por las bibliotecas españolas, 32 de ellas continúan trabajando con el formato IBERMARC, lo cual denota el uso de sistemas de gestión anticuados.

Sin duda, la adecuación a RDA obligará a un replanteamiento de los sistemas de gestión utilizados y a una modernización de los procesos de descripción que permitan crear bases de información adecuadas e interconectadas al resto de los sistemas de información para no quedar aislados.

figura_2_05

Figura 2: Extracto de registro MARC 21/RDA en DIGIBIB.
Fuente: Sistema de Gestión DIGIBIB. Elaboración propia.


2. Visibilidad y difusión de colecciones cartográficas

Los proyectos de digitalización suponen un alto coste económico para las instituciones. Este coste engloba los costes operativos, relacionados con la adquisición de materiales, equipamiento, transporte y servicios necesarios para poner un marcha un proyecto de digitalización, costes organizativos, puramente de gestión del proyecto, y costes directos del personal implicado en el proceso de digitalización.

No son pocos los proyectos de digitalización en los que se han invertido grandes cifras económicas y su presencia en la Web resulta limitada, al no disponer de los mecanismos necesarios que permiten dar a conocer, difundir y utilizar las colecciones digitales. Por este motivo, la creación de colecciones cartográficas digitales se debe realizar con el objetivo principal de hacer accesibles, a través de la Web, los recursos digitales y la información asociada a ellos. Con este propósito, la implementación de metadatos y la incorporación de protocolos de intercambio de información representan una responsabilidad a la que los gestores de las instituciones, y especialmente los bibliotecarios, deben responder con la idea de que sus colecciones puedan ser accesibles, visibles y utilizadas.

Se hace necesaria, por tanto, la creación de sistemas de información con las máximas características de visibilidad y accesibilidad, que faciliten un amplio posicionamiento en los buscadores más extendidos de la Web y su presencia en proyectos nacionales e internacionales.

La implementación de un repositorio adecuado al protocolo de recolección OAI-PMH proporciona a las colecciones cartográficas esa vía de acceso a los principales motores de búsqueda y a los principales servicios de agregación. Para su desarrollo resulta imprescindible, en términos de sostenibilidad económica del proyecto, que el repositorio OAI-PMH esté perfectamente engranado en todos los procesos de descripción y difusión de la colección digital, y así evitar tener que utilizar un sistema de gestión para la descripción de los recursos y otro diferente en el que poner los objetos digitales para hacerlos recolectables.

La implantación del repositorio OAI-PMH no debe suponer, por lo tanto, incorporar un elemento tecnológico aislado de las habituales tareas de gestión y administración de las colecciones cartográficas, sino que por el contrario debe ser un elemento perfectamente engranado en la gestión de la colección que permita proporcionar diferentes vías de acceso a la difusión de la colección digital a través de servicios y sistemas de información como: Hispana, WorldCat, Europeana, ROAR (Registry of Open Access Repositories), OpenROAR (Directory of Open Access Repositories) y Open Archives Data Providers.

Algunas de las colecciones cartográficas citadas anteriormente, y que disponen de un repositorio OAI-PMH proporcionado por el Sistema de Gestión DIGIBIB, han contribuido de forma notable a la rapidísima evolución y crecimiento que ha experimentado el sitio Web de Hispana, el Directorio y Recolector de Colecciones Digitales del Ministerio de Educación, Cultura y Deporte.

La aportación de estas colecciones cartográficas a Hispana se realiza gracias a la generación automática de metadatos Dublin Core, a partir de las descripciones bibliográficas realizadas en formato MARC 21/RDA, que permite que el Sistema de Gestión DIGIBIB genere un repositorio OAI-PMH actualizado dinámicamente a partir de las descripciones catalogadas. Este mecanismo ha permitido que, en los últimos cinco años, Hispana haya aumentado en 109 colecciones digitales y 78 repositorios OAI-PMH hasta dar acceso, desde el pasado mes de agosto de 2014, a 5.071.542 de objetos digitales (Ministerio de Educación, Cultura y Deporte, 2014).

figura_3_03

Figura 3. Evolución 2010-2014. Hispana.
Fuente: Hispana. Ministerio de Educación Cultura y Deporte. Elaboración propia.

 

3. Interconexión con los servicios de información más importantes del mundo

Uno de los principios básicos sobre los que se sustenta la creación de colecciones cartográficas o cualquier sistema de información, es la necesidad de establecer puntos de conexión con otros sistemas que permitan enriquecer, contextualizar y establecer nuevas rutas de navegación a los usuarios que consultan los fondos.

No se puede atender las necesidades de los usuarios con una colección digital aislada, por lo que el desarrollo del sistema de información debe nacer interconectado con otros sistemas que amplíen los resultados de búsqueda y que permitan obtener más y mejores recursos. Por este motivo la participación en proyectos nacionales e internacionales, como Hispana o Europeana, no sólo debe ser una herramienta de difusión para dar a conocer la colección digital, sino que debe ser un punto de acción vital en las políticas de desarrollo de colecciones cartográficas digitales.

Resulta imprescindible que los sistemas de información se implementen bajo la perspectiva de ser vinculados con los más grandes y más ricos como son los ofrecidos, por ejemplo, por Europeana y la DPLA. La posibilidad de "mezclar" datos de diferentes proveedores de información y presentarlas en nuevos interfaces creados con otros criterios o intereses distintos de los proveedores es un salto cualitativo en la gestión de la información. (Diago 2013).

Con este propósito, el Sistema de Gestión DIGIBIB permite relacionar la colección cartográfica de una institución con los de las bibliotecas digitales más importantes del mundo. Esto es posible gracias a las APIs (Application Programming Interface) de búsqueda de Europeana10 y DPLA11, que permiten que la búsqueda realizada en un catálogo local se realice de forma simultánea y automática en los sitios Web de Europeana y la DPLA, proporcionando los resultados recuperados de ambas bases, lo que genera numerosas posibilidades de difusión de la información, así como la posibilidad de ofrecer vistas diferentes en entornos y esquemas de datos distintos que enriquecen la presentación de contenidos.

De esta forma, con una simple búsqueda, el usuario tiene la posibilidad de acceder y relacionar los registros de su colección cartográfica con los disponibles en otras instituciones como, por ejemplo, el Institut Cartogràfic de Catalunya, el Repositorio de la Biblioteca Virtual de Andalucía o la Universidad Complutense de Madrid, recolectados por Europeana, o The University of Texas at Arlington Library, The University of Virginia Library o Sharlot Hall Museum recolectados por la DPLA.

figura_4_02

Figura 4. Ejemplo APIs de búsqueda Europeana y DPLA
Fuente: Sistema de Gestión DIGIBIB. Elaboración propia.


4. Colecciones cartográficas en Linked Open Data. La adecuación a Europeana Data Model

Linked Open Data se trata de un modelo y una práctica global que va más allá de las bibliotecas, archivos y museos. Se trata de un modelo extensible a toda la información que se pone accesible a través de la Web para los usuarios. En este sentido, las colecciones cartográficas deben realizar un esfuerzo para adecuar sus actuales sistemas de información a las tecnologías y modelos de datos para permitir enlazar los datos geográficos de sus colecciones con otros accesibles públicamente y así permitir:

  • Aumentar el número de resultados de las búsquedas de la colección cartográfica en los motores de búsqueda.
  • Ampliar la visibilidad de la colección y facilitar la localización de recursos.
  • Incrementar el tráfico en la Web de la colección.
  • Eliminar ambigüedades de la búsqueda.
  • Facilitar la búsqueda en bases de datos de miles y miles de recursos.
  • Responder sin ruidos ni silencios.

 

Esta iniciativa, que permite interoperar entre recursos de diferentes bibliotecas y colecciones cartográficas y relacionar los datos con otros disponibles en la Web, está basada en las conocidas cinco estrellas de Linked Open Data (World Wide Web Consortium, 2011).

Siguiendo esas premisas, los últimos desarrollos implementados en el Sistema de Gestión DIGIBIB se han basado en el uso de RDF (Resource Description Framework) como lenguaje para crear definiciones de clases y relaciones entre conceptos. Estas relaciones, a su vez, se establecen mediante el uso de URIs (Uniform Resource Identifier) que identifican a los recursos de forma completamente inequívoca y que permiten conectar los datos de una colección cartográfica con otros disponibles en la Web de forma que no queden aislados y así puedan compartir información con otras fuentes externas.

figura_5_02

Figura 5. Ejemplo MARC 21/RDF.
Fuente: Sistema de Gestión DIGIBIB. Elaboración propia.


Esta transformación de la Web y el aumento del uso de tecnología Linked Open Data tienen su representación en el proyecto de la Biblioteca Digital Europea, Europeana.

Europeana, inaugurada el 20 de noviembre de 2008, permite buscar recursos diseminados por toda Europa. Su particularidad radica en que no se encuentra en una estructura única, sino que funciona como punto de acceso a bases de datos de toda Europa, por lo que se evita que los usuarios tengan que limitar sus búsquedas a una biblioteca digital concreta. Pese a ser un proyecto relativamente joven, ha experimentado importantes cambios durante estos años y ha apremiado a los bibliotecarios a adecuar sus actividades y a adoptar nuevos esquemas y modelos de datos.

Si en primera instancia el uso del esquema ESE (Europeana Semantic Elements) era prioritario para Europeana por resolver problemas como la dificultad de mostrar miniaturas de los contenidos digitales en las páginas de resultados y en la navegación, la imposibilidad de recolectar objetos digitales para acceder directamente a ellos, o la falta de información en materia de derechos, actualmente Europeana ha evolucionado hasta establecer un nuevo modelo de datos denominado EDM (Europeana Data Model).

Este modelo de datos responde a las dificultades que presenta la búsqueda en una base de datos de casi 32 millones de registros, a la disparidad de fuentes, idiomas y tipos de objetos digitales que almacena. Pretende que los proveedores de datos no se limiten a enviar a Europeana metadatos descriptivos de un objeto digital, sino de enviar conjuntamente con esos metadatos otros datos concretos sobre el autor de una obra, sobre los eventos asociados a la obra, las fechas en las que se realizaron esos eventos, los lugares relacionados a la obra y también su temática.

EDM va encaminado a proporcionar y recolectar información contextual de los recursos que recolecta, con el objetivo de ofrecer un servicio de mayor calidad y puede afirmarse, por tanto, que la transformación que se está produciendo en Europeana es análoga a la transformación que está sufriendo la Web y que está derivando en la denominada Web Semántica mediante el uso de tecnología Linked Open Data.

Una de las cuestiones básicas que pretende responder EDM y que resulta esencial para entender el funcionamiento de Open Data, es cómo detectar que dos o más conceptos procedentes de diferentes proveedores de contenido son los mismos o comparten características similares para poder establecer una relación entre ellos. En este sentido, las descripciones centradas en el objeto en sí mismo, es decir el libro, la fotografía o el mapa, presentan enormes dificultades, mientras que el uso de datos cruzados con ontologías multilingües permiten un enriquecimiento deseable para la vinculación y localización de recursos.

Además de poder establecer que dos o más objetos son idénticos, deben ofrecerse una serie de características de contexto, a través de las cuales se pueda aseverar que dos o más objetos están relacionados porque comparten esas características. Esta es la razón por la que EDM define una serie de clases dedicadas a la representación de entidades contextuales (Isaac, 2013):

  • Agent: representa a personas y organizaciones.
  • Event: representa acontecimientos.
  • Place: representa entidades espaciales.
  • TimeSpan: representa periodos de tiempo y fechas.
  • Concept: representa entidades de sistemas de organización del conocimiento como tesauros, esquemas de clasificación o encabezamientos de materias.

 

El objetivo es que estas mismas clases contextuales sirvan también para establecer mecanismos de búsqueda y navegación para los usuarios, dando la posibilidad de acceder y recuperar a:

  • Objetos que comparten uno o varios agentes, por ejemplo relacionar material cartográfico elaborado por el mismo cartógrafo.
  • Objetos que comparten un lugar, por ejemplo para identificar los nombres de los lugares.
  • Objetos que comparten un mismo periodo o fecha, por ejemplo, documentación cartográfica referente al mismo momento histórico.
  • Objetos que son de una misma temática, por ejemplo acceder a material cartográfico referente a estrategias militares.
  • Agentes relacionados con un periodo o fecha, por ejemplo cartógrafos que desarrollan su actividad en el mismo periodo de tiempo.

 

Podemos concluir, por tanto, que Europeana se vale de EDM como concreción de Linked Open Data en el entorno de Europeana. En ambos casos el objetivo es proporcionar información contextual con el objetivo de establecer relaciones entre recursos mediante el uso de identificadores únicos globales y que permitan identificar, por un lado, similitudes, y por otro, producir descripciones más ricas y de mayor valor informativo para los usuarios que las ya conocidas descripciones proporcionadas en Dublin Core.


4.1 Enriquecimiento semántico de datos geográficos

Una de las características más importantes que conlleva la aplicación de tecnología Linked Open Data y, por extensión, de EDM, es la posibilidad de enriquecer semánticamente los datos geográficos de la colección digital, lo cual representa un objetivo claro de cualquier colección cartográfica.

Gracias a este enriquecimiento y a la utilización de ontologías multilingües es posible determinar que registros que incluyen, por ejemplo, una descripción de un lugar definido como "España", estén relacionados con otros que incluyen los términos "Spain", "Espagne" o "Spanien".

Sólo recientemente, los modelos de metadatos de los registros bibliográficos, archivísticos y museológicos permiten disponer de etiquetas apropiadas para establecer vínculos con recursos también en Linked Open Data. El caso más claro podría ser el enriquecimiento semántico de registros codificados según el formato MARC, que dispone de un campo, el 024 (Otros identificadores normalizados), en el que es posible registrar la dirección URI de otro recurso y permite especificar, a partir del subcampo "$2", que el vínculo que se ha registrado corresponde a una URI.

De esta forma, con el simple procedimiento de incluir en el campo 024 de los registros de autoridad de lugar, la URI de un recurso Linked Open Data, se establece una vinculación entre el registro de autoridad de la colección cartográfica que permitirá navegar a otros registros similares proporcionando mejoras indiscutibles en el acceso a la información.

Si bien el procedimiento de enriquecer datos geográficos resulta sencillo, en el caso de colecciones cartográficas, en el que el volumen de datos geográficos es amplio, el Sistema de Gestión DIGIBIB ha desarrollado los mecanismos necesarios para enriquecer la información de la base con fuentes de datos externas, lo que supone un servicio de valor añadido que aumenta y enriquece la información topográfica.

Estos mecanismos permiten que los datos geográficos almacenados en el módulo de descripción del Sistema de Gestión DIGIBIB puedan ser enriquecidos a través de la vinculación directa de URIs procedentes de vocabularios de fuentes externas publicadas en Linked Open Data, como:

  • Lista de Encabezamientos de Materia para las Bibliotecas Públicas12.
  • Getty Thesaurus of Geographic Names13.
  • GeoLinkedData14.
  • GeoNames15.

 

figura_6_02

Figura 6. Ejemplo de nombre geográfico enriquecido.
Fuente: Sistema de Gestión DIGIBIB. Elaboración propia.

 

Cada una de estas fuentes de información proporciona, por sí misma, un servicio de valor añadido. Mientras GeoNames posibilita añadir información semántica de 8.3 millones de topónimos y es considerada la fuente de datos más internacional, GeoLinkedData proporciona una cobertura mayor al incorporar lugares que no son entidades administrativas como pozos, rías, caminos o barrancos. Esta ontología cuenta además con la particularidad de que las fuentes de información geoespaciales proceden del Instituto Geográfico Nacional de España y del Centro Nacional de Información Geográfica. Por su parte, la reciente publicación del Getty Thesaurus of Geographic Names permite incorporar términos mayoritariamente escritos en inglés, mientras que el esquema de términos topográficos de la Lista de Encabezamientos de Materia para las Bibliotecas Públicas en SKOS cuenta con la ventaja de ser fácilmente importable en los sistemas de gestión que sean capaces de procesar ficheros de autoridad codificados en formato XML. Además, dichos términos han sido cruzados con otras fuentes externas como las LCSH, RAMEAU, GND, LEMAG y LEMAC.

Este enriquecimiento semántico, obtenido a partir de la vinculación de URIs, permite que los usuarios puedan acceder a información geográfica relacionada que, de otra manera, sería inaccesible. Así, a partir de una simple consulta a la base de datos, el usuario se puede mover por toda la Web, guiándose por los vínculos establecidos en los datos geográficos de la colección.

5. Aplicaciones y uso en interfaces de búsqueda en colecciones cartográficas

La creación de colecciones cartográficas de calidad se basa en desarrollar herramientas y aplicaciones que permitan un mayor y mejor uso de los objetos digitales por parte de los usuarios en general, involucrar a los usuarios en su patrimonio cultural digital, darlo a conocer, permitir que se reutilice con cualquier fin y buscar su participación activa tanto en su creación, como en su análisis y difusión.

Por este motivo se deben proporcionar más y mejores servicios, herramientas que permitan a los usuarios aumentar el conocimiento del patrimonio digitalizado para fomentar la integración social y cultural, de una forma eficiente, novedosa y en consonancia con la propia evolución que desarrolla la Web y las demandas sociales.

La disponibilidad de objetos digitales realizados con nuevas tecnologías ha conducido al desarrollo de nuevas formas de exponer los contenidos digitales de colecciones cartográficas. El éxito de la difusión de estos contenidos digitales se obtiene al combinar los puntos fuertes que proporciona la propia colección cartográfica física con el potencial que ofrece la tecnología digital.

Así, la última versión del Sistema de Gestión DIGIBIB se ha centrado en el desarrollo de dos aplicaciones de especial relevancia para las colecciones cartográficas. La primera, un nuevo visor de objetos multimedia de alta resolución, encargado específicamente por el Ministerio de Defensa para la implementación en su Biblioteca Virtual, que posibilita hacer zoom sobre una imagen para alcanzar el mayor nivel de detalle posible. La segunda, una línea del tiempo que permite ubicar geográfica y temporalmente las obras de la colección cartográfica y también representaciones geográficas de datos, de tal forma que la propia colección cartográfica no se limite a suministrar información, sino que reutilice los datos que almacena en su base de datos para desarrollar herramientas innovadoras en el acceso a la información.


Visor de alta resolución para colecciones cartográficas

El visor de alta resolución implementado en el Sistema de Gestión DIGIBIB permite la visualización de imágenes de gran tamaño sin que pierdan calidad y permitiendo la posibilidad de aplicar sobre ellas altos niveles de zoom.

Estas funcionalidades se obtienen procesando la imagen original y segmentando dicha imagen en fragmentos más pequeños (tiles de 256 por 256 píxeles). De esta forma, cuando el usuario accede a la imagen para visualizarla, y atendiendo al nivel de zoom establecido, se descarga y se muestra el número de ficheros que sea necesario, consiguiendo que la presentación inicial de la imagen sea muy rápida, al no requerir la descarga completa de la imagen de alta resolución, y ser únicamente necesaria la descarga de muy pocos tiles de menor resolución o fragmentos más pequeños de la imagen de alta resolución.

figura_7_01

Figura 7. Ejemplo de visor de alta resolución.
Fuente: Sistema de Gestión DIGIBIB. Elaboración propia
.


Líneas del tiempo

El Sistema de Gestión DIGIBIB ha implementado un desarrollo basado en la presentación de los datos de las colecciones cartográficas en forma de líneas del tiempo georreferenciadas. Para ello, se han combinado los datos referentes a coordenadas y fechas almacenadas en el módulo de descripción de DIGIBIB con la reutilización y enriquecimiento de fuentes disponibles en la Web, como por ejemplo OpenStreetMap.

El planteamiento de esta aplicación gira en torno a la tecnología Linked Open Data y a la reutilización de datos publicados de forma abierta en diferentes fuentes y vocabularios. Una de las ideas básicas y fundamentales de este desarrollo consiste en que las interfaces de consulta Web de las colecciones cartográficas se transformen en intermediarias, en nexos de unión, entre una colección digital concreta y otras fuentes existentes en la Web de las que pueda extraerse datos, metadatos y objetos digitales que pongan en valor el patrimonio cultural digital.

figura_8_01
Figura 8. Línea del tiempo.
Fuente: Sistema de Gestión DIGIBIB. Elaboración propia.



De esta forma, el usuario contará con nuevos mecanismos para ubicar geográfica y temporalmente las obras de la colección cartográfica gracias a:

  • La representación dinámica de los datos geográficos codificados en registros MARC 21 (autoridades y bibliográficos).
  • La representación dinámica de los datos temporales codificados en registros MARC 21 (autoridades y bibliográficos).
  • La información contextual y los enlaces persistentes proporcionados de la totalidad del registro representado.
  • Los diferentes niveles de zoom en la línea del tiempo, en proporción al rango de años representado. 
  • Los diferentes niveles de zoom en la representación geográfica, desde un mapamundi a un callejero.



6. Conclusiones

El desarrollo de las colecciones cartográficas debe girar sobre la necesidad de aportar contenido normalizado basado en unos protocolos de intercambio definidos, transformar las técnicas de descripción empleadas en Linked Open Data para facilitar la semantización de los metadatos y preparar estos datos para su uso en la Web. Las colecciones cartográficas digitales tienen que hacer un esfuerzo para adaptarse a los cambios tecnológicos y a los nuevos modelos de datos, especialmente los que hacen referencia a la creación de estructuras semánticas de información. La recompensa será la visibilidad de los recursos de la colección digital.

Resulta imprescindible el enriquecimiento de metadatos por medio de la reutilización de vocabularios de todo tipo, especialmente los multiligües, para permitir interfaces de búsqueda más complejas, afinadas y comprensibles. Las tendencias en el desarrollo de las colecciones digitales deben tender a la convergencia, a suprimir los sistemas de información aislados y constituir sistemas de información enriquecidos con fuentes de datos externas.

La visibilidad, la interoperabilidad y la capacidad de gestionar sistemas de información normalizados sostenibles en el tiempo son los puntos de acción que deben regir las políticas de desarrollo de las colecciones cartográficas.


Bibliografía

AGENJO-BULLÓN, X.; HERNÁNDEZ-CARRASCAL, F. (2009). La biblioteca virtual: función y planteamiento. Boletín de la ANABAD, t. 59, núm. 4, p. 25-105. [Disponible en: http://eprints.rclis.org/14352/. Consulta: 04/10/2014].

BERNERS-LEE, T; HENDLER J.; LASSILA, O. (2001). The Semantic Web. Scientific American, mayo 2001, p. 29-37.
[Disponible en: http://www-sop.inria.fr/acacia/cours/essi2006/Scientific%20American_%20Feature%20Article_%20The%20Semantic%20Web_%20May%202001.pdf
. Consulta: 04/10/2014].

BIBLIOTECA NACIONAL DE ESPAÑA (2014). Encuesta sobre RDA. Mayo-Junio 2014. Biblioteca Nacional de España Website [en línea]. [Disponible en http://www.bne.es/webdocs/Prensa/Noticias/2014/0728_InformeEncuestaRDA.pdf. Consulta: 04/10/2014].

CLAYPHAM, R.; CHARLES, V.; ISAAC, A. (2014). Definition of the Europeana Data Model v5.2.5. Europeana Professional Website [en línea]. [Disponible en: http://pro.europeana.eu/documents/900548/0d0f6ec3-1905-4c4f-96c8-1d817c03123c. Consulta: 04/10/2014].

CORNELL UNIVERSITY LIBRARY (2003). Llevando la teoría a la práctica. Tutorial de digitalización de imágenes [en línea]. [Disponible en http://www.library.cornell.edu/preservation/tutorial-spanish/contents.html. Consulta: 04/10/2014].

DEUTSCHE FORSCHUNGSGEMEINSCHAFT (2013). Practical Guidelines on Digitisation. Deutsche Forschungsgemeinschaft Website [en línea]. [Disponible en http://www.dfg.de/formulare/12_151/12_151_en.pdf. Consulta: 04/10/2014].

DIAGO MÁRQUEZ, F.J. (2013). Las API de Europeana para mejorar los sistemas de recuperación de información. Su uso en la Herramienta de Documentalista y otras experiencias e implementaciones. Boletín de la ANABAD, t. 63, núm. 3, p. 523-538.
[Disponible en:
http://www.anabad.org/publicaciones/boletin/2287-2013-num-3julio-septiembre-boletin-de-anabad.html. Consulta: 04/10/2014].

ESTIVILL RIUS, A. (2012). Momentos estelares de la catalogación en el cincuentenario de los Principios de París. BiD textos universitaris de biblioteconomia i documentació, 2012, núm. 25, junio. ISSN 1575- 5886. [Disponible en: http://bid.ub.edu/28/estivill2.htm. Consulta: 04/10/2014].

GILL, T.; GILLILAND, A. J.; WOODLEY, M.S. (2008). Introduction to metadata. Pathways to digital information. Version 3.0 [en línea]. [Disponible en: http://www.getty.edu/research/publications/electronic_publications/intrometadata/index.html. Consulta: 04/10/2014].

DEUTSCHE NATIONAL BIBLIOTHEK (2014). IFLA Satellite Meeting 2014 Frankfurt am Main RDA - Resource Description and Access - status and perspectives. Deutsche National Bibliothek [en línea]. [Disponible en: http://www.dnb.de/DE/Standardisierung/International/iflaSatelliteMeetingProgramm.html. Consulta: 04/10/2014].

HERNANDO DE LARRAMENDI, T. (et al.) (2009). "Datos y metadatos: la normalización dinámica de los elementos y de los procesos constituyentes de una Biblioteca Virtual". En: Interinformación XI Jornadas Españolas de Documentación, (Zaragoza 20, 21 y 22 de mayo de 2009). Madrid: FESABID, p. 109-116. ISBN: 978-84-692-2663-6. [Disponible en: http://www.fesabid.org/zaragoza2009/Libro_Actas_Fesabid_2009.pdf. Consulta: 04/10/2014].

ISAAC, A. (2013). Europeana Data Model Primer. Europeana Professional Website [en línea]. [Disponible en:
http://pro.europeana.eu/documents/900548/770bdb58-c60e-4beb-a687-874639312ba5
. Consulta: 04/10/2014].

MINISTERIO DE EDUCACIÓN, CULTURA Y DEPORTE (2014). Hispana. Directorio y Recolector del Ministerio de Educación, Cultura y Deporte [en línea]. [Disponible en: http://hispana.mcu.es/. Consulta: 04/10/2014].

NOVOTNÁ, EVA (2013). "Catalogación de documentos cartográficos en RDA". En: El Profesional de la información, marzo-abril, v.23, n.2, pp.195-203. [Disponible en http://dx.doi.org/10.3145/epi.2014.mar.13. Consulta: 04/10/2014].

 

Notas:

1. Accesible a través de: http://hispana.mcu.es/ [Consulta: 04/10/2014]
2. Accesible a través de: http://www.europeana.eu/
 [Consulta: 04/10/2014]
3. Accesible a través de: http://dp.la/ [Consulta: 04/10/2014]
4. Accesible a través de:
http://bibliotecadigital.rah.es/dgbrah/
 [Consulta: 04/10/2014]
5. Accesible a través de: http://www.mcu.es/ccbae/es/mapas/principal.cmd
  [Consulta: 04/10/2014]
6. Accesible a través de: http://www.galiciana.bibliotecadegalicia.xunta.es/
 [Consulta: 04/10/2014]
7. Accesible a través de: http://bvpb.mcu.es/cartografia/es/micrositios/inicio.cmd
 [Consulta: 04/10/2014]
8. Accesible a través de: http://www.loc.gov/standards/
 [Consulta: 04/10/2014]
9. Accesible a través de http://www.loc.gov/marc/RDAinMARC.html
 [Consulta: 04/10/2014]
10. Accesible a través de: http://labs.europeana.eu/api/
 [Consulta: 04/10/2014]
11. Accesible a través de: http://dp.la/info/developers/codex/
 [Consulta: 04/10/2014]
12. Accesible a través de: http://id.sgcb.mcu.es/lem/
 [Consulta: 04/10/2014]
13. Accesible a través de: http://www.getty.edu/research/tools/vocabularies/tgn/index.html
 [Consulta: 04/10/2014]
14. Accesible a través de: http://geo.linkeddata.es/
 [Consulta: 04/10/2014]
15. Accesible a través de: http://www.geonames.org/
 [Consulta: 04/10/2014]