Autor/s: Crespo, M.(1); Criado, M.(1); Capdevila, J.(2); Sánchez, A.(3); Soteres, C.(3); Juanatey, M.(3); Bravo, M. J.(1); Rodriguez, C.(1)
(1) DMSGroup: Datos, Metadatos y Servicios SL, (2) Instituto Geográfico Nacional. Servicio Regional en Cataluña, (3) Instituto Geográfico Nacional. Centro Nacional de Información Geográfica
Títol: El patrimonio cartográfico en las infraestructuras de datos espaciales
Temātica: Cartografia histōrica
Publicat a: Revista Catalana de Geografia
IV època / volum XV / núm. 41 / desembre 2010
Font: -
URL: http://www.rcg.cat/articles.php?id=199

 

EL PATRIMONIO CARTOGRÁFICO EN LAS INFRAESTRUCTURAS DE DATOS ESPACIALES

Maria Crespo1, Marta Criado1, Joan Capdevila2, Alejandra Sánchez3, Carolina Soteres3, Marta Juanatey3, M. José Bravo1, Carlos Rodríguez1
1. DMSGroup: Datos, Metadatos y Servicios SL
2. Instituto Geográfico Nacional, Servicio Regional en Cataluña
3. Instituto Geográfico Nacional, Centro Nacional de Información Geográfica

 

Resumen

El desarrollo actual de las Tecnologías de la Información y la Comunicación (TIC) ha facilitado el acceso y la gestión del Patrimonio Cartográfico custodiado en archivos y bibliotecas públicas y privadas, permitiendo además la conservación y preservación de los fondos cartográficos existentes de gran valor histórico y cultural. Sin embargo, se hace necesario permitir el acceso remoto a la información histórico-cartográfica, por ello, se ha empezado a trabajar en este aspecto aprovechando las ventajas que ofrecen las Infraestructuras de Datos Espaciales (IDE).

Con el objetivo de promover y facilitar a las bibliotecas los procesos necesarios para llegar a la publicación de datos y documentos de carácter geográfico e histórico en Internet, utilizando la estrategia IDE, se crea el Grupo de Trabajo Interdisciplinar de Patrimonio Cartográfico en las IDE (GTI PC - IDE). Este grupo está integrado por profesionales de la Documentación y la Geomática, cuyo primer trabajo es la realización de una pasarela bidireccional entre el formato de catalogación MARC21 y la Norma ISO 19115.

 

1. Introducción

Remontándonos a los orígenes de la catalogación en España en la segunda mitad del siglo XVIII, ya se podían percibir indicios de normalización por medio de las reglas elaboradas por el bibliotecario 5º de la Real Biblioteca, Pedro García, que tienen por título Reglas que se han de observar para hacer las cédulas para un índice general [1]. Muchos han sido los intentos de especificaciones como es el caso del Manual del CATMARC para registros cartobibliográficos [2]. En la actualidad la información geográfica es accesible a un gran número de usuarios debido a Internet y a los avances tecnológicos de la época. Por ello, se hace necesario cada vez más el poder acceder a través de Internet al Patrimonio Cartográfico custodiado en archivos y bibliotecas públicas y privadas, permitiendo así la conservación y preservación de los fondos cartográficos existentes de gran valor histórico y cultural. Lo que hace encauzar a las bibliotecas en el camino de la estandarización de los datos, metadatos y servicios web.

Hasta el momento, el desarrollo actual de las Tecnologías de la Información y la Comunicación (TIC) ha facilitado el acceso y la gestión a este tipo de información, sin embargo, se hace necesario permitir el acceso remoto a la información histórico-cartográfica, por lo que se ha empezado a trabajar en este aspecto aprovechando las ventajas que ofrecen las Infraestructuras de Datos Espaciales (IDE). Por otro lado, los atributos de tipo geográfico del patrimonio cartográfico no son aprovechados adecuadamente por los actuales sistemas de publicación de archivos gráficos en Internet utilizados por archivos y bibliotecas. Buena parte de la razón de ser de las IDE radica en la gestión de la georreferenciación o geolocalización de la información que publican.

Por ello, en el año 2008 nace el Grupo de Trabajo Interdisciplinar de Patrimonio Cartográfico en las IDE (GTI PC - IDE) [3], enmarcado dentro del Grupo de Trabajo de la IDEE del Consejo Superior Geográfico. Con el objetivo general de promover y facilitar a las bibliotecas los procesos necesarios para llegar a la publicación de datos y documentos de carácter geográfico e histórico en Internet utilizando la estrategia IDE. Dentro de este Grupo, el IGN con amplia experiencia en metadatos, consideró de gran importancia el objetivo que se había establecido y decidió colaborar en su desarrollo financiando el trabajo de definición de la pasarela.

En la actualidad la mayoría de las bibliotecas catalogan sus recursos conforme a los formatos bibliográficos MARC 21 e IBERMARC, entre otros. Sin embargo, estos formatos no han sido considerados en el ámbito de los estándares de metadatos de las IDE en lo que respecta a la catalogación de información geográfica. Por ello el primer trabajo del Grupo nació con un objetivo bien definido: conseguir la interoperabilidad entre los formatos de catalogación MARC21 y la norma ISO 19115, de tal manera que los registros de metadatos y los fondos cartográficos de las bibliotecas puedan ser encauzados en el ámbito del desarrollo de las IDE. Con este objetivo se quiere conseguir una pasarela bidireccional que permita el paso de un formato al otro.

Los trabajos iniciales de definición de la pasarela consistieron en establecer las relaciones entre los elementos del formato bibliográfico MARC21 [4] y el Núcleo Español de Metadatos (NEM), comenzando por el mínimo número de elementos recomendado, teniendo presentes las Normas de Ejecución de la Directiva INSPIRE y ampliando las correspondencias con elementos de la norma ISO 19115 e ISO 19115-2.

Existen antecedentes de trabajos similares para la conversión de un formato de catalogación a otro como es el caso de Mapping and Converting Essential Federal Geographic Data Committee (FGDC) Metadata into MARC21 and Dublin Core [5], en el cual se presenta una comparativa entre los formatos FGDC, Dublin Core y MARC21, basada en una pasarela estándar [6]. Este trabajo se hizo con el objetivo de poder ver los datos del FGDC en la biblioteca Online Computer Library Center's WorldCat. En este caso se trata de una pasarela en una única dirección de FGDC, Dublin Core a MARC21.

La posibilidad de utilizar como pasarela algunos encadenamientos entre pasarelas ya existentes fue desechada debido a la excesiva perdida de información en algunos de los pasos intermedios. Para desarrollar este objetivo y tener como resultado final una pasarela bidireccional en la cual no exista perdida de información al realizar la conversión de un formato de catalogación a otro, se decidió seguir el esquema descrito por J. Nogueras-Iso et al. (2004) [7]. A continuación se describen y detallan las fases en que se divide el trabajo.


2. Fases del trabajo

Las fases en que se divide el trabajo son: 1. Armonización de las tablas de trabajo definidas para MARC21 y el NEM. 2. Definición de las relaciones cruzadas 3. Definición de las reglas para la conversión de la información. 4. Implementación del estudio realizado.


2.1 Armonización

Muchas normas de metadatos utilizan propiedades similares para definir las características de sus elementos, como puede ser: definición semántica, etiquetas, ocurrencia y condicionalidad o restricciones sobre el valor de un elemento. Pero la forma en que se expresan los distintos valores que puede poseer cada elemento de metadatos es muy variada, no existiendo correspondencia entre las distintas normas de metadatos. Por ejemplo, valores definidos mediante listas controladas o tesauros.

Si los atributos utilizados para describir las características de los elementos de metadatos y el método para completar esa información fueran descritos de manera similar en las distintas normas de metadatos, no sólo se simplificaría la correspondencia, sino que también se simplificaría el desarrollo de nuevos cruces entre estas normas.

Para realizar el estudio comparativo entre formatos de catalogación fue necesario estudiar y evaluar los elementos pertenecientes a MARC21 e ISO19115, NEM v.1.0 y el Reglamento de INSPIRE. Se partió de dos tablas iniciales, como describe J. Nogueras-Iso en la fase de armonización [7].

La tabla inicial de MARC21 presentaba un total de 40 campos (incluida la cabecera) y la tabla inicial del NEM v1.0 presentaba todos los elementos de metadatos incluidos en el NEM v1.0.

En estos casos las diferencias estructurales venían dadas desde el formato MARC21, por el valor de los indicadores que "introducían" la información que luego se iba a dar del campo y de los subcampos. Al igual que define ISO 19115, para sus elementos y subelementos de metadatos, valores de multiplicidad y tipo de restricción, la estructura de campos y subcampos del formato MARC21 también establece valores de multiplicidad y restricción para cada uno sus campos, características que facilitan los trabajos de armonización entre ambos estándares y el establecimiento de sus relaciones cruzadas.

Después de estudiar la estructura de MARC21, los atributos que componen un registro de metadatos, su significado y detectar los posibles inconvenientes entre los elementos pertenecientes a MARC21 frente a ISO 19115, se solicitó a los distintos organismos que participan en el Grupo, ejemplos de un registro de metadatos en MARC21 para poder conocer mejor el significado de estos elementos y poder establecer una mejor correspondencia.

Analizados los ejemplos de los registros recibidos se llegó a las siguientes conclusiones:

  • La tabla inicial correspondiente al formato MARC21 no estaba completa, ya que no recogía todos los elementos utilizados por los distintos organismos en sus catalogaciones.
  • Existían diferencias con respecto a la condicionalidad en las catalogaciones de un mismo recurso para un mismo campo.
  • Se empleaba el uso de un mismo campo para recoger diferente información en función del organismo encargado de realizar la catalogación.

 

Como consecuencia de las conclusiones extraídas y con el fin de realizar la armonización entre tablas, fue necesario definir los campos de MARC21 a tener en cuenta en el mapeo, junto con la condicionalidad y ocurrencia de los mismos. Para ello, se solicitó a los distintos organismos que completasen una tabla que mostrara la obligatoriedad de cada campo MARC21, según el criterio de cada uno de ellos, y que realizasen una consulta a sus registros de metadatos para detectar qué campos de MARC21 empleaban en la catalogación de sus recursos cartográficos.

Con esta información se pudo evaluar la totalidad de campos presentes en la catalogación de recursos cartográficos, lo que permitió detectar que existían campos en las consultas realizadas que no estaban incluidos en la tabla MARC21 inicial y viceversa. Este hecho se debía a que en la tabla MARC21 de inicio se tuvieron en cuenta solamente los campos considerados como un perfil mínimo de MARC21 para la catalogación de documentos cartográficos, según el Consorci de Biblioteques Universitàries de Catalunya (CBUC).

Detectados los campos MARC21 a intervenir en el mapeo y la condicionalidad de los mismos, según define MARC21 [8], se creó una segunda versión de la tabla MARC21 en la que quedaban recogidos todos los campos objeto de la consulta. Esta segunda versión consta de un total de 100 campos.

Paralelamente, según se estudiaban los elementos pertenecientes a MARC21 y se definía la tabla final para materializar el cruce, se ampliaron los elementos de la tabla inicial del NEM. Primeramente con los elementos del Reglamento de INSPIRE y posteriormente con ISO 19115, adaptándola finalmente a la versión 1.1 del NEM (borrador del 27 de abril de 2010). Véase figura 1 para observar la metodología seguida para el cruce de elementos entre MARC 21 e ISO 19115.

El resultado final de la fase de armonización puede ser considerado como un proceso continuo a lo largo del desarrollo de todo el trabajo.

 

2.2 Relaciones cruzadas

Teniendo en cuenta que la finalidad que se persigue es conseguir la interoperabilidad entre formatos, se tuvieron en cuenta una serie de aspectos para el desarrollo de la fase de mapeo y que a continuación se citan.

Esta fase es considerada como la más importante en el desarrollo de la pasarela. En ella se establece una correspondencia semántica entre elementos de la norma origen, en este caso MARC21, y su correspondencia con los elementos considerados semánticamente equivalentes en la norma de destino, en este caso ISO 19115.

Hay que resaltar que en algunas ocasiones fue necesario establecer otros criterios distintos al enunciado en el párrafo anterior. Con ellos se pretendió atenuar lo máximo posible la perdida de información de un formato a otro, e intentar transferir la mayoría de la información descrita de un registro cartográfico de MARC21 a ISO 19115 y viceversa.

Para abordar esta fase se definió un proceso metodológico que permitiese avanzar en el establecimiento de las relaciones cruzadas según las siguientes etapas (véase Figura 1). En una primera etapa se buscó una correspondencia mínima, la definida por aquellos elementos de metadatos pertenecientes al NEM e INSPIRE, los cuales permitían conseguir la interoperabilidad buscada. En esta etapa se realizó un estudio comparativo entre aquellos elementos del NEM de carácter obligatorio, condicional y opcional que presentaban relación con los elementos de MARC21 definidos en la tabla final utilizada para realizar el cruce. Este estudio permitió detectar los casos en los cuales no existía correspondencia con los elementos de carácter obligatorio y se planteó una propuesta de soluciones en la fase de definición de reglas de conversión.

En una segunda etapa se amplió esa correspondencia mínima con campos de la norma ISO 19115 e ISO19115-2 y se revisaron los elementos para que cumplieran con la versión v1.1 del perfil NEM.

 

41_art4_1

Figura 1. Metodología del cruce de elemento.

 

Obtenido el cruce inicial de elementos, por medio del cuestionario de evaluación del mapeo, se puso a disposición del resto del Grupo el resultado obtenido. Este cuestionario tenía como objetivo la aprobación del cruce realizado para poder así, definir un mapeo definitivo entre los formatos de catalogación.

Las respuestas obtenidas por parte de los distintos miembros del Grupo fueron analizadas y con ellas se establecieron variaciones en el cruce inicial, permitiendo definir un cruce definitivo teniendo en cuenta los siguientes criterios:

  • Coincidencia semántica entre elementos MARC21 e ISO 19115.
  • Debido a que varios campos de MARC21 pueden tener el mismo significado, se comprobó la repetividad de los mismos en los ejemplos de catalogación recibidos para poder establecer unas mejores reglas de conversión.
  • Normas de Ejecución de la Directiva INSPIRE e ISO 19115.
  • Recomendaciones del NEM para la catalogación de información geográfica.
  • Obligatoriedad y ocurrencia de los campos MARC21.
  • Porcentaje de respuestas coincidentes del cuestionario de evaluación distribuido y comentarios aportados por los distintos miembros del Grupo.


Además de los cruces directos que se pudieron realizar entre elementos, semánticamente hablando, se adoptaron las siguientes soluciones, todas ellas enmarcadas en función del tipo de elementos a cruzar. Se propusieron soluciones para:

  • Listas controladas: se cruzaron los campos de MARC21 junto con los valores de subcampos. Para aquellos valores que no se encontraban presentes en las listas controladas se definieron nuevas entradas tomando el valor del subcampo MARC21. 
  • Palabras clave: la información de los campos 006 (mapas), 007 (mapas, globos, recurso electrónico e imágenes de sensor) y 008 (mapas) era necesario recuperarla, ya que aportan información de carácter general sobre el recurso cartográfico catalogado. No existe correspondencia para cada uno de ellos con ningún elemento de ISO cuyo dominio sea texto libre, aunque algunas posiciones de estos campos sí podrían tener correspondencia con el elemento Forma de presentación. Si se siguiera la forma de proceder descrita anteriormente para las listas controladas, se deberían incluir 87 nuevos valores en este elemento de metadatos. Debido a la poca operatividad de la solución se decidió incluir los valores de estos campos dentro del elemento de metadatos Palabras clave, lo cual asegura la recuperación de la información.
  • Para los elementos enunciados en el párrafo anterior, y otros cuyo cruce se corresponde con el elemento de metadatos Palabras clave, es necesario definir un tesauro [1]. Este proceso se realizará en la fase de implementación de la pasarela.


Efectuado el mapeo, evaluado el cuestionario de opinión sobre el cruce realizado y teniendo en cuenta los criterio anteriormente citados para definir el cruce final, se obtuvo un cruce total de 64 elementos pertenecientes a MARC21 frente a 60 elementos pertenecientes a ISO 19115. Véase figura 2.

Total de elementos cruzados (ISO-NEM-INSPIRE) 
 Elementos sólo de ISO cruzados = 36
 Elementos NEM v 1.1 cruzados = 24
 Elementos INSPIRE cruzados = 16
 Total elementos = 60
 Total de elementos cruzados MARC21 = 64

Figura 2. Tabla con el número total de elementos cruzados
para ISO, NEM, INSPIRE y MARC 21.

A continuación se detalla el cruce establecido entre los formatos de catalogación MARC 21 e ISO 19115. Véanse figuras 3, 4 y 5.

- Correspondencia entre MARC21 - NEM v1.1: campos del NEM no incluidos en INSPIRE

 Campos de MARC  Elementos de NEM v1.1
 1  Cabecera pos.09: #(MARC)=UTF8 Conjunto de caracteres de los metadatos
 2 352 $k Formato de distribución
 3 Cabecera pos.06: a(material impreso textual)=002, e(material cartográfico)=006,
 f(material cartográfico manuscrito)=015(introducir como nuevo valor).
 t(material manuscrito textual)=016(introducir como nuevo valor) Campo 006-Mapas pos.
 00: e(material cartográfico)=006, f(material cartográfico manuscrito)=015 (introducir como nuevo valor)
 Campo 007-Mapas pos,00: a(mapa)=006, c(recurso electrónico)=017 (introducir como nuevo valor en
 la lista), d(globo)=018 (introducir como nuevo valor), r(imágenes con sensores remotos)=003
 Forma de presentación
 4 536 $a Créditos
 5 006 Mapa (pos. 05-06) + 008 Mapa (pos. 22-23) + 342 $a-$q Sistema de referencia
 6 773 $a- $b- $d- $g- $h- $p- $s- $t Linaje (Fuentes)
 7 514 $a-$b-$c-$d-$e-$f-$g-$h-$i-$j-$k Componente Cuantitativa (Informes de calidad)
 8 8 008-Mapas (pos. 15-17) + 040 $a + 130 $a+008 pos.07-10; 130$k + 005 + 001  Identificador del archivo de metadatos

 Figura 3. Tabla de correspondencia entre los elementos de MARC21 y NEM v1.1

 

- Correspondencia entre MARC21 - INSPIRE: incluidos campos del NEM v1.1

 Campos de MARC   Elementos de INSPSIRE
  1  245$a + 008 pos.07-10, 130$f  Título
  2 500 $a + 501 $a + 502 $a + 504 $a + 505 $a-$g-$r-$t + 514 $z + 520 $a-$b-$c + 590 + 591 + 592 + 593 +
 594 + 595 + 596 + 597 + 598 + 599
 Resumen
  3 008 (mapas) pos.25, 006 (mapas) pos,08: a(mapa individual)=016, b(serie de mapas)=005, c(mapa seriado)=006,
 d(globo)=017 (introducir como nuevo valor), e(Atlas)=018 (introducir como nuevo valor), f(Mapa separado)=019
 (introducir como nuevo valor), g(Mapa encuadernado)=020 (introducir como nuevo valor), u(Desconocido)=021
 (introducir como nuevo valor), z(Otro)=022 (introducir como nuevo valor).
 Nivel jerárquico
  4 856 $d - $l - $u Recurso en línea
  5 008 pos. 35-37 + 041 si no coincide con el 008  Idioma del conjunto de datos
  6 130 $k  Categoría del tema
  7 006 (mapas) pos.01-04,pos.12,pos.16-17; 007 (mapas) pos.01,pos.03,pos.04,pos.05,pos.06,pos.07;
 007 (recurso electrónico) pos.01,pos.03; 007 (globo) pos.01,pos.03,pos.04,pos.05; 007 (imágenes de
 sensores remotos) pos.03,pos.04,pos.09-10; 008 (mapas) pos.18-21,pos.29,pos.33-34; 043; 080; 130$k;
 650 $a; 651 $a;752
 Palabras claves
  8 034 $d- $e- $f- $g Coordenadas geográficas
  9 Fecha de creación = 008 pos. 07-10; 130 $f
Fecha de publicación = 260 $c
 Fecha de los datos
 10 034 $b - $c Resolución espacial
 11 017 $a  Condiciones de acceso y uso
 12 506 $a-$b-$c-$d-$e-$f-$u+ 540 $a-$b-$c-$d-$u Restricciones de acceso público
 13 Punto de contacto de los datos (Rol: Autor) = 245 $c
 Punto de contacto de los datos general (Rol: Punto de contacto) = 270 $a - $b - $c - $d - $e- $h - $j- $k -
 $l - $m- $p - $r
 Punto de contacto de los datos (Rol: Conservador) = 535 $a - $b - $c
 Punto de contacto de los datos (Rol: Editor) = 260 $a - $b
 Punto de contacto de los datos (Rol: Procesador) = 533 $b - $c
 Punto de contacto responsable
 14 005 Fecha de creación de los metadatos
 15 040 $b Idioma de los metadatos
 16 040 $a Punto de contacto de los metadatos 

 Figura 4. Tabla de correspondencia entre los elementos de MARC21 e INSPIRE.

- Correspondencia MARC21 - ISO 19115 + ISO 19115-2

  Campos de MARCElementos de ISO 19115 + ISO 19115-2 
  1 246 $a Título alternativo
  2 250 $a-$b Edición
  3 020 $a ISBN
  4 022 $a ISSN
  5 007-Recurso electrónico (pos.11) + 008 (pos.06) + 245$b + 255 + 300 + 507$a - $b + 515 +  
 530 + 546 + 585 + 586 + 700 + 852 + 510 + 580 + 533 $a-$d-$e-$f-$n
 Información suplementaria
  6 522 $a  Descripción del ámbito geográfico
  7 007 (Recurso electrónico) pos.06-08 Bits por valor
  8 007 (Imágenes de sensores remotos) pos.05 Porcentaje cubierto por nubes
  9 007 (Imágenes de sensores remotos) pos.06 Descripción de la plataforma
 10 007 (Imágenes de sensores remotos) pos.07  Descripción de la categoría
 11 342 $a  Nombre del sistema de referencia
 12 342 $b Unidades del eje
 13 342 $e  Latitud de línea oblicua
 14 342 $f  Longitud de línea oblicua
 15 342 $g  Longitud del meridiano central
 16 342 $h Latitud de origen de la proyección
 17 342 $i  Este falso
 18 342 $j  Norte falso
 19 342 $k  Factor de escala en el Ecuador
 20 342 $l  Altura del punto de perspectiva sobre la superficie
 21 342 $m Angulo de azimut
 22 342 $n Longitud vertical recta desde el Polo
 23 342 $p Identificador geográfico
 24 342 $q  Elipsoide
 25 342 $r  Semieje mayor
 26 342 $s  Aplanamiento
 27 352 $b Tipo de objeto geométrico
 28 352 $c  Recuento de objetos geométricos
 29 352 $d Tamaño de la dimensión, Nombre de la dimensión
 30 352 $d - $e - $f  Tamaño de la dimensión, Nombre de la dimensión
 31 352 $g Nivel de topología
 32 352 $q  Tipo de fichero
 33 753 $b Lenguaje del modelo
 34 856 $c Técnica de descompresión de un fichero
 35 856 $f Nombre del recurso en línea
 36 856 $s  Tamaño de transferencia

Figura 5. Tabla de correspondencia entre los elementos de MARC21 e ISO 19115 e ISO 19115-2.


En los siguientes gráficos, véanse figuras 6 y 7, se representan los porcentajes de elementos de NEM e INSPIRE que presentan correspondencia con los elementos de MARC21 para los cuales se ha establecido el mapeo.

Del total de los 37 elementos de metadatos del NEM se ha establecido correspondencia con el 65% (24 elementos) y para el caso de los 22 elementos de INSPIRE, también incluidos en NEM, se ha establecido correspondencia con el 73% (16 elementos).

41_art4_2

Figura 6. Porcentaje de elementos con correspondencia en NEM.

41_art4_3

Figura 7. Porcentaje de elementos con correspondencia en NEM.


2.3 Reglas de la conversión

Una vez que se armonizaron las tablas correspondientes a cada formato de catalogación y se realizó el cruce de elementos fue necesario definir una serie de reglas de conversión que permitieran materializar los cruces planteados. Estas reglas son pautas específicas necesarias para establecer la correspondencia entre los elementos de MARC21 y los elementos de ISO 19115.

Para llevar a cabo el mapeo se tuvo en cuenta propiedades generales de los elementos como la definición semántica, la ocurrencia u obligatoriedad; el dominio de cada elemento, es decir, si son elementos de texto libre o pertenecen a listas controladas; y la estructura propia de la futura pasarela. Estas consideraciones se tradujeron en dos conjuntos de reglas de conversión: reglas de conversión para los elementos de metadatos y reglas de conversión para la herramienta informática.

Reglas de conversión para los elementos de metadatos
No existen problemas cuando el cruce se produce entre elementos que comparten idénticas propiedades y la correspondencia es uno a uno, los problemas surgen cuando las propiedades no son idénticas, es decir, un elemento obligatorio se cruza con uno opcional o un elemento de texto libre se cruza con un elemento de valor controlado, por ejemplo.
Cuando las propiedades no son idénticas o la correspondencia no es uno a uno se pueden dar los siguientes casos:

  • Un elemento de ISO 19115, NEM, INSPIRE se cruza con varios elementos de MARC21. Por ejemplo, el elemento «Resumen» de ISO 19115 se cruza con los elementos «Notas» de MARC21.
  • Un elemento de MARC21 se cruza con varios elementos de ISO 19115, NEM, INSPIRE. El elemento «Fecha de la última transacción (005)» de MARC21 se cruza con el elemento «Fecha de creación de los metadatos» y con la fecha de los metadatos del identificador del archivo de metadatos.
  • Un elemento de ISO 19115, NEM, INSPIRE se cruza con varios elementos de MARC21, pero sólo le corresponde la información de un único elemento, es decir, que el elemento no es repetible. Por ejemplo el elemento «Nivel jerárquico» se puede cruzar con la posición 25 del elemento 008 (mapas) y con la posición 08 del elemento 006(mapas) de MARC21, pero la pasarela sólo tomará el valor de uno de ellos.
    Si el elemento de ISO 19115, NEM, INSPIRE se corresponde con una lista controlada de valores, primero se deben cruzar los valores de MARC21 con los valores de la lista controlada. Si no es posible realizar el cruce se debe ampliar la lista controlada con los valores de MARC21. Véase figura 8.

 

41_art4_4

Figura 8. Cruce de los valores controlados del elemento «Forma de presentación».

  • Para el cruce de elementos de MARC21 con el elemento ISO 19115, NEM, INSPIRE «Palabras clave» se debe definir un tesauro de términos MARC21.
  • Los valores del elemento 130 $k «Subasiento de forma» de MARC21 se deben agrupar según las 19 categorías de tema de ISO 19115, NEM, INSPIRE y las 3 categorías añadidas. Para no perder la información de este campo se completarán los valores exactos en «Palabras clave» según el tesauro de términos MARC21.

 

Estas reglas generales se definieron de forma específica para cada uno de los cruces de elementos realizados como una columna adicional en la tabla del mapeo.

 

Reglas de conversión para la herramienta informática
Aparte de las propiedades del contenido de los elementos de metadatos fue necesario definir una serie de reglas específicas para la herramienta informática que permitirá la conversión entre formatos de forma automática. Las reglas generales que se citan a continuación se detectaron durante el desarrollo de las fases anteriores. Este listado podrá ampliarse a medida que se desarrolle el software correspondiente a la pasarela.

  • Si el elemento de metadatos de destino es de carácter obligatorio, la pasarela debe rellenar el elemento de forma automática con los valores adecuados. Por ejemplo con el valor «no disponible».
  • Los elementos de ISO 19115, NEM, INSPIRE que se cruzan con varios elementos de MARC21 no pueden tener duplicada la información. Es decir, la pasarela debe leer la información de los elementos de MARC21 que debe cruzar y si se repite, detectarla y no duplicarla.
  • El formato de los elementos de ISO 19115, NEM, INSPIRE «fechas» es AAAA/MM/DD. Si en MARC21 las fechas van acompañadas de texto, la pasarela debe detectarlo y eliminar el texto. Por ejemplo, si en MARC21 aparece «Año de 1765» la pasarela debe transformarlo a 1765/01/01.
  • La pasarela debe realizar una conversión directa entre las abreviaturas del listado de países e idiomas de MARC21 y el listado de países e idiomas de ISO 19115.
    En la mayoría de las ocasiones las propias reglas de conversión definidas son las propuestas de soluciones planteadas para resolver los problemas detectados a la hora de realizar el cruce de elementos.


2.4 Implementación

Definida la pasarela y el modelo da datos, el objetivo de la última fase es la implementación de la pasarela en las organizaciones que pretendan publicar sus fondos utilizando las IDE o quieran trabajar habitualmente con las normas ISO. En primer lugar se plantea la implementación en un software de carácter general que permita la conversión entre formatos de forma automática. Es lo que llamamos una aplicación de referencia. Pero somos conscientes que las organizaciones son complejas y que la introducción de un recurso de este tipo debe adaptarse a sus particularidades, cosa por la cual se plantea la realización de un caso de uso como demostración de la aplicabilidad de la pasarela.

Teniendo en cuenta que las normas ISO para metadatos utilizan como formato de intercambio XML (ISO/TS 191139) y para el caso de MARC21 el formato empleado es código máquina, en el momento de la implementación se plantan dos posibilidades: convertir el formato MARC21 a XML [9] y posteriormente para realizar la aplicación de la pasarela utilizar la tecnología [7], XSL (Extensible Stylesheet Language (W3C, 2003)) [10]. Otra opción sería en lugar de pasar el formato de MARC21 a XML crear una aplicación de pasarela que recorra el fichero de MARC y por medio de asignación de elementos se establezca su correspondencia con los elementos definidos en el fichero XML. Este proceso de conversión de formatos tendría que ser análogo para el caso inverso: de ISO a MARC.


3. Conclusiones

Como conclusiones generales del trabajo realizado se citan a continuación las siguientes:

  • Se han establecido las relaciones cruzadas entre los formato de catalogación MARC21 y las Normas de Ejecución de la Directiva INSPIRE, ISO 19115, ISO 19115-2 y el NEM v1.1
  • Debido a los diferentes criterios de catalogación ha sido necesario evaluar los cruces realizados con ejemplos de catalogación de recursos cartográficos, permitiendo esto detectar problemas de obligatoriedad y uso de los campos MARC21.
  • Se han buscado soluciones alternativas ante la imposibilidad de cruces directos entre elementos para atenuar al máximo la pérdida de información, en el supuesto que existiera al pasar de un formato a otro: se han ampliado las listas controladas definiendo los nuevos valores a tomar, se han cruzado campos de MARC21 con el elemento de metadatos Palabras claves y se ha propuesto la definición de un tesauro de términos controlados MARC21.
  • Se han planteado reglas de conversión adicionales a los cruces directos que servirán de base para la implementación informática de la pasarela.
  • Como resultado final contabilizable se puede concluir que se han cruzado un total de 60 elementos pertenecientes a ISO 19115, NEM, INSPIRE, frente a los 64 elementos de MARC21 de un total inicial presentes en la tabla de armonización de 100.
  • El mapeo final ha sido el resultado de un trabajo colaborativo y consensuado por los distintos miembros del Grupo a través del cuestionario de evaluación, reuniones periódicas y con el intercambio de documentación vía electrónica.
  • Se ha dado un paso adelante en el ámbito de los metadatos al establecer por primera vez una pasarela teórica entre el formato MARC21 e ISO 19115. El futuro es su puesta en práctica para ver su funcionalidad en el ámbito de las IDE y lograr el objetivo de promover y facilitar a las bibliotecas los procesos necesarios para llegar a la publicación de datos y documentos de carácter geográfico e histórico en Internet.

 

4. Referencias


[1] Carmen Líter Mayayo. Biblioteca Nacional de España. Historia de la catalogación en España.
[2] Ed. Lluís Anglada y Concepción Miralpeix. Institut Català de Bibliografía. Manual de CATAMARC.
[3] http://www.idee.es/show.do?to=pideep_subgrupo_trabajo.ES
[4] http://www.loc.gov/marc/marcspa.html
 
[5] Adam Chandler and Dan Foley. University of Louisiana Lafayette. Mapping and Converting Essential Federal Geographic Data Committee (FGDC) Metadata into MARC21 and Dublin Core. Año 2000.
[6] Mangan 1997. LC 1999
[7] J. Nogueras-Iso et al. (2004) «Metadata standard interoperability: application in the geographic information domain»
[8] http://www.loc.gov/marc/bibliographic/nlr/nlr.html#intro

[9] http://www.loc.gov/standards/marcxml/ 

[10] http://www.w3.org/Style/XSL/

 


Comentaris externs

Envia el teu comentari