Autor/s: Portolés-Rodríguez, D.*; Martínez, R.*; López, F. G.**; Monteagudo, S.**
*Idearium Consultores, SL, **Centro de Información Territorial de Aragón. Gobierno de Aragón
Títol: Aplicación de técnicas multicriterio para la organización y clasificación de resultados de consulta a una cartoteca digita
Temàtica: Cartografia històrica
Publicat a: Revista Catalana de Geografia
IV època / volum XVII / núm. 46 / octubre 2012
Font: V Jornadas IBERCARTO. Santander, octubre 2012
URL: http://www.rcg.cat/articles.php?id=255

 

APLICACIÓN DE TÉCNICAS MULTICRITERIO PARA LA ORGANIZACIÓN Y CLASIFICACIÓN DE RESULTADOS DE CONSULTA A UNA CARTOTECA DIGITAL 

D. Portolés-Rodríguez*
Rafael Martínez Cebolla*
Fernando Germán López Martín**
Sergio Monteagudo Latorre**

*Idearium Consultores SL
**Centro de Información Territorial de Aragón. Gobierno de Aragón



1. Introducción

El Centro de Información Territorial de Aragón (CINTA) publicó en 2010 la Cartoteca Digital del Sistema de Información Territorial de Aragón (SITAR); dicha cartoteca ya fue descrita en un artículo presentado en la pasada reunión de Ibercarto [Portolés-Rodríguez, 2010]. A lo largo de estos años, la cartoteca ha evolucionado mediante la incorporación de numerosas mejoras, y ha tenido además que enfrentarse al reto de incorporar un número muy superior de documentos, sin dejar de cumplir el principio esencial de diseño planteado desde el inicio, que no es otro que el de la facilidad de acceso, con el objetivo de poder llegar a cualquier usuario, experto o no.

Para lograr que la operativa de uso sea simple, se ha conservado el original mecanismo de consulta a la cartoteca: mediante un simple click de ratón en un punto del territorio. Pese a haberse planteado el diseño de posibles interfaces de consulta más elaboradas y complejas, se ha querido preservar esta forma de uso, ya consolidada, debido a que se ha estimado es la más sencilla para el usuario no iniciado.

En la actualidad, más de 37.000 documentos están incorporados a la cartoteca de SITAR. Debido al número elevado de posibles documentos de interés para el usuario como resultado de su consulta, es necesario establecer un criterio de clasificación y organización de los documentos, de tal modo, que pueda localizarse los documentos más apropiados con cierta agilidad y rapidez.

2. Evolución de los mecanismos de presentación de resultados de la cartoteca del SITAR.

Inicialmente, la primera versión de la cartoteca mostraba los resultados obtenidos en cualquier orden en un simple listado. Pese a que puede resultar demasiado sencillo, es suficiente con este criterio cuando el conjunto de datos disponibles es reducido. De una forma rápida, se logra obtener transparencia y difusión de los contenidos cartográficos, consiguiendo con dicha publicación un primer avance para la comunidad científica y para la sociedad en general. Además, este primer prototipo cumplía la misión de servir como muestra gráfica y funcional de lo que se pretendía obtener con la aplicación, facilitando la comprensión y transmisión del conocimiento a posibles futuros actores que pudieran aportar nuevos contenidos a la cartoteca. De entre estos actores, destacarían especialmente aquellas instituciones situadas en un nivel administrativo distinto al de Gobierno de Aragón cuyas contribuciones permitieran enriquecer la infraestructura de datos espaciales subyacente. [Rajabifard, 2001].

Como todo sistema de información, es posible diseñar la cartoteca conforme a diferentes enfoques. Concretamente, este primer enfoque antes descrito, correspondía a lo que se denomina como modelo "basado en el sistema", que permitía cumplir con el objetivo de difusión; sin embargo, esta primera versión de la herramienta no satisfizo las aspiraciones de los diseñadores de la cartoteca. Cabe recordar que el principio inspirador de la cartoteca de Aragón fue el de convertirse en "Un ejemplo de democratización de la cartografía" [Portolés-Rodríguez, 2010]. Por lo tanto, decidió evolucionarse hacia el enfoque de la cartoteca conforme al modelo de sistema de información "centrado en el usuario", para lograr un acceso más adecuado a los contenidos que alberga por parte de todos los usuarios, sean expertos o no.

Este cambio de enfoque se ha producido con mucha frecuencia durante los últimos años en sistemas de almacenamiento y recuperación de información. Según los planteamientos de diversos autores [Caro-Castro, 2010: 2] este cambio se relaciona con diferentes factores:

  • Por una parte, al popularizarse el uso de las redes de información, la recuperación de información se ha desplazado desde el terreno de los especialistas al de los usuarios finales. Esta nueva población de usuarios, cada vez más numerosa y heterogénea, reclama mecanismos de recuperación de información que se adapten a sus habilidades y necesidades: herramientas interactivas y amigables que proporcionen acceso a información multimedia y faciliten diferentes tipos de búsqueda (equiparación, exploración, navegación). Para diseñar estos sistemas es necesario saber qué demandan los usuarios y cómo se comportan durante la búsqueda.
  • Paralelamente, se ha producido un cambio en el concepto de la naturaleza de la recuperación de información. El proceso de búsqueda de información no es sólo mediante una determinada estrategia de búsqueda sino que también debe tener en consideración al usuario con una necesidad de información. En el extremo opuesto, el resultado no es sólo un conjunto de documentos potencialmente relevantes, sino también un usuario cuyo estado de conocimiento se ha modificado durante la interacción.


Teniendo presente este enfoque "centrado en el usuario", se realizó un análisis de la operativa más habitual de los usuarios, así como las posibles incorrecciones e interpretaciones erróneas que pueden surgir. Respecto al primer punto, se observó que es habitual el comportamiento de los usuarios de solicitar los datos de un punto para a continuación acercar el mapa con objeto de visualizar algún detalle; por este motivo, se introdujo la mejora de acercar el mapa automáticamente en el caso de consultas de información alejadas (escalas superiores a 1:50.000). En relación a lo segundo, se introdujo en aquellos contenidos que podían contener errores, un aviso de posibles desplazamientos o deformaciones por el hecho de ser un documento no realizado con una métrica precisa - como por ejemplo ocurre con un plano histórico del S. XVII - o por las deformaciones obtenidas al realizar una fotografía aérea como efecto de la perspectiva. Por último, se incorporó un enlace a los metadatos de los planos para poder obtener información adicional que ayude a comprender exactamente lo visualizado a través de la cartoteca.

Conforme fue aumentando el número de documentos disponibles en la cartoteca, llegando a tener varias decenas de miles, se hizo necesario plantear una agregación por temas y colecciones. El objetivo principal era el de presentar de una forma más clara al usuario un gran número de resultados. Todos los documentos fueron asignados a una determinada colección. Al tener muchos documentos disponibles, determinadas consultas de información podían obtener un número significativo de documentos, llegando en algunos casos a ser superior a 200 documentos.

Sin embargo, tras analizar las opiniones de los usuarios, se llegó a la conclusión de que era necesario ir un paso más allá. Pese a que la agrupación en colecciones resultaba útil, no todas las colecciones eran demandadas por igual. Por este motivo, se planteó ordenar las colecciones, priorizando en primer lugar de la clasificación de resultados presentados, a aquellos temas de mayor interés o más completos. Además, se procedió a organizar consecutivamente colecciones similares pero de fechas o escalas distintas.

El siguiente paso consistió en seleccionar el mejor candidato de algunas colecciones. Se analizaron varios criterios para construir una heurística apropiada, siendo la más adecuada la que selecciona aquel documento de la colección cuyo centroide sea el más cercano al punto seleccionado por el usuario. Este criterio resulta especialmente útil en el caso de ser una colección de fotografías aéreas - fotogramas - o imágenes obtenidas mediante un satélite. Este proceso de reorganización y priorización se realiza de forma transparente al usuario, de tal modo que de un simple vistazo puede obtener la visualización del que se ha considerado mejor de la colección. En caso de no ser el más conveniente o necesitar más detalles, siempre puede obtener la lista completa de candidatos, ordenada por distancia del centroide del documento al punto consultado. Cabe mencionar que no en todas las colecciones resulta conveniente realizar este proceso, puesto que en algunos casos es muy complejo el seleccionar un candidato como preferible frente a otro. Así por ejemplo, en la colección de "Cartografía" o "Medio Ambiente" conformado por mapas temáticos de carreteras, de límites administrativos, de montes, entre otros, resulta complejo comparar dos contenidos y decidir que uno es "preferible" frente a otro para obtener el candidato óptimo.

Asimismo, se planteó la posibilidad de establecer una categorización de los contenidos presentados según a la escala del documento y la escala a la que fue realizada la petición de información. De entrada, parece lógico pensar que si se realiza una petición de información a escala menor, sin gran precisión, pueda ser más interesante un documento que abarque más territorio frente a otro de escala mayor que afecta sólo a un pequeño ámbito pero que casualmente coincide mejor con la consulta realizada. Sin embargo, esta posibilidad se descartó temporalmente ya que implica otras modificaciones en el comportamiento de la cartoteca, difícilmente resolubles a corto plazo.

3. La influencia de la opinión de los usuarios.

En los años que lleva operativa la cartoteca digital del SITAR, ha sido prioritaria la tarea de recabar la opinión de los usuarios de la misma para poder priorizar aquellas actuaciones funcionales de mejora encaminadas a satisfacer las demandas más solicitadas. El hecho de considerar a los usuarios como la piedra angular del sistema, ha estado presente desde los comienzos de la plataforma donde se enmarca la cartoteca, el SITAR, para todos y cada uno de los componentes que lo conforman [Portolés-Rodríguez, 2005].

A continuación se muestran las principales demandas y necesidades de mejora que se han transmitido y en el siguiente apartado se mostrarán las actuaciones que se están llevando a cabo para satisfacerlas.

En primer lugar, hay que destacar que tras estudiar el comportamiento de los usuarios de la cartoteca, se ha podido determinar que los usuarios que utilizan esta herramienta se agrupan en dos grandes colectivos.

El primer colectivo corresponde a los usuarios que acceden a la cartoteca para localizar todos los fondos cartográficos de una o varias zonas de interés. Este grupo es el más numeroso y es el que inspiró los principios fundacionales del diseño de esta aplicación. Sus demandas suelen estar siempre relacionadas con dudas acerca del modus operandi a seguir para alcanzar su objetivo. Además, también suelen plantear dudas acerca de la presentación de resultados - especialmente cuando el número de resultados supera los varios centenares de documentos - y sobre los detalles de lo que se van a encontrar en cada una de las colecciones de documentos. Desde siempre han tenido la posibilidad de acceder al metadato completo de cada uno de los documentos, pero en general suelen solicitar una información descriptiva más resumida que la que proporciona el metadato con su gran cantidad de detalles.

El segundo de los colectivos ha surgido con el tiempo y corresponde a usuarios que vienen utilizando la cartoteca con cierta asiduidad en los últimos años y que conocen lo que en ella se almacena. Las estadísticas de uso de la cartoteca revelan que se han realizado más de 21.000 accesos a la herramienta en el último año. Este tipo de usuarios con un perfil más experimentado, tiene necesidades mucho más específicas y concretas, detalladas en los párrafos siguientes.

Las demandas de este segundo grupo son muy variadas, destacando principalmente la posibilidad de asignar criterios de filtrado de los resultados obtenidos. Habitualmente, este tipo de usuarios no les interesan todos los contenidos, sino un subconjunto de ellos para sus necesidades. Debido a que, en muchos casos, conocen la existencia de los contenidos almacenados en la cartoteca, los usuarios expertos utilizan la cartoteca para localizar contenidos de una determinada colección, ignorando el resto de contenidos, los cuales complican la tarea de localizar exactamente lo que les resulta de interés.

Es frecuente que haya usuarios que, por ejemplo, sólo quieran obtener contenidos de un rango de años o de un tipo de documentos concreto. Así pues, hay quien sólo quiere encontrarse, por ejemplo, con los fotomapas del vuelo de la Confederación Hidrográfica del Ebro de 1927 puesto que conoce que está disponible en la cartoteca, descartando todos los demás contenidos. Incluso hay usuarios que sólo les resulta de interés aquellos contenidos que puedan descargarse y no sólo visualizarse, puesto que tienen previsto hacer operaciones posteriores de análisis con el dato original.

Por último, cabe resaltar que, debido a que la cartoteca es una herramienta en continua evolución e incorporación de contenidos, en ocasiones los últimos contenidos incorporados, pasan "desapercibidos" al quedar integrados con un conjunto muy grande de contenidos preexistentes. De este modo, los usuarios más habituales, no siempre son conscientes de las novedades que se han incorporado recientemente, y perciben la cartoteca como un producto más estático de lo que realmente es.

4. Estado actual y previsto del mecanismo de presentación de resultados: aplicación de técnicas multicriterio.

Actualmente la cartoteca muestra por defecto al usuario los resultados agrupados por colecciones organizadas y priorizando el mejor candidato de cada una de ellas, si procede. Estas posibilidades coinciden con lo explicado anteriormente.

 

46_10_01

Figura 1. Tabla de resultados de la cartoteca actual.
Fuente: Gobierno de Aragón, Cartoteca del Sistema de Información Territorial de Aragón. Elaboración propia.


Sin embargo, se está trabajando en la posibilidad de permitir al usuario modificar este comportamiento, filtrando determinados candidatos que no cumplan con sus expectativas. Los resultados de esta nueva versión desarrollada están en fase de pruebas, estando prevista su puesta en producción en los próximos meses.

Concretamente, en la nueva versión, el usuario puede elegir entre los siguientes filtros de presentación de resultados:

  • Mostrar sólo datos que se pueden visualizar.
  • Mostrar sólo datos que se pueden descargar.
  • Filtrar por intervalo de fecha.
  • Filtrar por intervalo de escala.
  • Filtrar por tipo de contenido.
  • Filtrar por colección.

 

46_10_02

Figura 2. Ventana de selección de opciones de filtrado de resultados.
Fuente: Gobierno de Aragón, Cartoteca del Sistema de Información Territorial de Aragón. Elaboración propia.


Gracias a esta funcionalidad, el usuario puede configurar y personalizar sus búsquedas en la cartoteca de una manera más ajustada a sus necesidades.

No obstante, éstos no son los únicos cambios que se están realizando. Teniendo presentes las consideraciones mencionadas en el apartado anterior, se están desarrollando otras funcionalidades demandadas por los usuarios de la cartoteca.

Así por ejemplo, para informar de un modo rápido al usuario de lo que se puede encontrar en cada una de las colecciones, se ha incorporado como texto emergente al dejar el ratón sobre el nombre de la colección, un breve texto descriptivo que recoge las características esenciales de lo que se incluye en la colección. En cualquier caso, se sigue manteniendo el enlace al metadato de la colección para aquellos usuarios que necesiten un mayor grado de detalle informativo.

Otra de las funcionalidades que se va a incorporar es la de resaltar las colecciones y contenidos recientemente incorporados. El mecanismo que se ha decidido seguir consiste en la agrupación de todas aquellas colecciones que se han incorporado en las últimas semanas y mostrar dicho grupo en primer lugar para llamar más la atención del usuario. Al margen de esta actuación, se difunde también la presencia de los nuevos contenidos a través de los canales y mecanismos habituales existentes hasta la fecha: redes sociales twitter y facebook de SITAR, avisos en otras aplicaciones como puede ser el visor 2D, actualización de la página de noticias de la web de SITAR y de la página web del CINTA, boletín mensual de noticias de la Dirección General de Ordenación del Territorio, entre otras.

Además, se ha atendido a la necesidad de simplificar la presentación de resultados en varios niveles en lugar del existente hasta el momento que sólo contenía un nivel de agregación: la colección. De este modo, todas las colecciones se agrupan en torno a un tipo de contenidos, proporcionando un nivel previo en la jerarquía de resultados. El usuario al solicitar la obtención de información, obtiene una lista con los posibles tipos existentes - en el caso de que exista algún contenido de dicho tipo para su petición - y dentro de esa categoría, obtiene la lista de colecciones de ese tipo. Con la jerarquía en dos niveles se consigue simplificar la interpretación de resultados, aproximando las colecciones similares y discriminando aquellas que puedan no ser de interés para el usuario.

Concretamente, los tipos actualmente disponibles en los que se han categorizado todas las colecciones son los siguientes: fotos, ortofotos, planos, imágenes de satélite, cartografía y temática.

Gráficamente, la propuesta de resultados de lo descrito en los párrafos precedentes, quedaría conforme a la siguiente figura:

 

46_10_03

Figura 3. Propuesta de nueva tabla de resultados de la cartoteca.
Fuente: Gobierno de Aragón, Cartoteca del Sistema de Información Territorial de Aragón. Elaboración propia.


Por último, se encuentra también en fase de pruebas un criterio adicional que permitirá incorporar un nuevo elemento de juicio de valor: el criterio de relevancia del documento. Internamente se está llevando a cabo un proceso de asignación de relevancia - importancia - de los contenidos disponibles asignando mayor relevancia a los documentos que son más detallados o que forman parte de una colección completa de documentos.

En los próximos meses se espera asimismo realizar una catalogación más detallada de los contenidos disponibles, a partir de la cual se podrán obtener nuevos criterios relevantes que puedan servir de filtro a los resultados. La adopción de tesauros y ontologías serán clave en la categorización y clasificación de los documentos en cada uno de los términos disponibles, permitiendo filtrar y agrupar por tema y palabras clave, e incluso, poder guiar al usuario hacia otros contenidos de interés relacionados, ya sea por cercanía territorial - criterios espaciales - o bien por semejanza de la información representada - criterios semánticos - entre otros. Además, con esta caracterización basada en ontologías o tesauros será posible establecer un mayor número de relaciones con otros servicios y aplicaciones existentes en el SITAR.

5. Futuros mecanismos de presentación de resultados previstos: incorporación de nuevos criterios

A corto plazo, el Centro de Información Territorial de Aragón (CINTA), responsable de la cartoteca del SITAR, tiene previsto solicitar la autorización para la incorporación de fondos documentales disponibles en cartotecas y archivos de otras instituciones y organismos. Una vez realizada la incorporación de los contenidos, es muy posible que se puedan establecer nuevos criterios organizativos, como por ejemplo, el contribuidor o responsable del documento.

Así por ejemplo, en los últimos meses se ha firmado un convenio para la consulta de los fondos de la Real Sociedad Económica Aragonesa de Amigos del País y, a corto plazo, se establecerán los acuerdos formales necesarios para la consulta y publicación de los fondos existentes en los siguientes organismos o instituciones: Archivo de la Corona, Archivos provinciales, Fundación Casa de Ganaderos y Documentos y Archivos de Aragón (DARA).

Además se tiene previsto seguir realizando un análisis etnográfico del comportamiento de los usuarios de la cartoteca para poder establecer dos nuevos criterios. Un primer criterio de popularidad que se ha previsto correspondería con el de posicionar en los primeros lugares los resultados que más han sido seleccionados por los usuarios. De este modo, se obtendría un criterio actualizado periódicamente y que encajaría con una amplia mayoría de los usuarios de la cartoteca. En segundo lugar, se pretende realizar un análisis de los puntos del territorio donde los usuarios realizan más peticiones de información. Con este análisis, se pretende obtener un mapa de las zonas más consultadas (mapas de calor o heat map) [Oldřich Horák, 2011] y descubrir tendencias y popularidad de zonas del territorio a lo largo del tiempo.

Al margen de estas consideraciones, se va a seguir con detenimiento la creación, evolución o mejora de toda iniciativa similar que pueda realizarse en el mundo de las cartotecas digitales. Resultan especialmente interesantes todas aquellas aportaciones relacionadas con la mejora y simplificación del proceso de georreferenciación de documentos cartográficos, como se describe por ejemplo en [Rafael Roset, 2012]. Asimismo, también se tiene previsto realizar una ronda de contactos con los responsables de cartotecas físicas para perfeccionar el mecanismo de selección de contenidos, tratando de representar algorítmicamente los procedimientos seguidos por este tipo de expertos en su tarea diaria de atención al público. Para ello, la celebración del encuentro Ibercarto resulta de gran interés al poner en contacto a un gran número de personas involucradas en temas tan estrechamente relacionados.

Por último, se pretende adaptar la presentación de resultados de la cartoteca para que se agrupen conforme a los temas que plantea la reciente Ley 14/2010, de 5 de julio, sobre las infraestructuras y los servicios de información geográfica en España [Ley LISIGE - BOE, 2010: 59628]. Esta adaptación se enmarca dentro de un proceso global descrito más ampliamente en el articulo [Martínez-Cebolla, 2012].

6. Conclusiones

En el presente artículo se ha presentado la evolución que ha experimentado una cartoteca digital que no sólo se ha conformado con difundir los contenidos que alberga y aumentar su número, sino que además ha realizado una importante labor para satisfacer las demandas de sus usuarios. Esta herramienta, que nació con voluntad de ser un servicio público de carácter universal, ha dirigido sus esfuerzos en lograr ser de gran utilidad para los especialistas en ordenación del territorio en particular, y a toda la sociedad en general. El equipo técnico responsable de la herramienta es consciente desde el primer momento del hecho de que la clave del éxito de la cartoteca dependerá en gran medida del grado de aceptación que tenga entre sus usuarios.

El hecho de almacenar un número ingente - y en continuo crecimiento - de documentos implica que sea necesaria una compleja gestión de la presentación y organización de los resultados que el usuario espera y desea obtener, basándose en técnicas multicriterio. A lo largo de las líneas anteriores no sólo se han descrito los pasos realizados para lograr una adecuada estructuración progresiva y ordenada de contenidos, sino que también se plantean las acciones que está previsto adoptar a corto y medio plazo.

En los próximos meses el equipo de desarrollo abordará nuevos retos para continuar con su labor de mejora continua, mediante el contacto con otros responsables de cartotecas - digitales o no - para perfeccionar su heurística y estrategia de presentación de resultados y para ampliar el conjunto de contenidos disponibles. Además, también abordarán la tarea de la adecuación al nuevo marco normativo que se establece en España tras la aprobación de la Ley LISIGE.

7. Bibliografía.

Portolés-Rodríguez, D. et al. (2010): "La Cartoteca del Sistema de Información Territorial de Aragón: Un ejemplo de democratización de la cartografía". Ibercarto 2010. Valencia.

Abbas Rajabifard (2001): "SDI Hierarchy: From Local to Global SDI initiatives". Open Seminar on SDI in Asia and the Pacific Region. 7th PCGIAP meeting, Tsukuba, Japan.

Carmen Caro-Castro et al. (2010): "La investigación sobre recuperación de información desde la perspectiva centrada en el usuario: métodos y variables". Revista española de Documentación Científica, Vol 26, No 1. 2003.

Portolés-Rodríguez, D. et al. (2005): "La gestión de usuarios en una Infraestructura de Datos Espaciales". Jornadas de las Infraestructuras de Datos Espaciales de España, JIDEE 2005, Madrid.

Oldřich Horák et al. (2011): "GeoWeb application user-interface evaluation using heatmaps". Recent Advances in Applied & Biomedical Informatics and Computational Engineering in Systems Applications, Florence (Italy).

Rafael Roset et al. (2012): "Georeferenciación de mapas antiguos con herramientas de código abierto". Revista Catalana de Geografia IV època / volum XVII / núm. 45 / juny 2012.

Ley 14/2010, de 5 de julio, sobre las infraestructuras y los servicios de información geográfica en España. Boletín Oficial del Estado, 6 de julio de 2010, núm. 163, p. 59628.

Rafael Martínez Cebolla et al. (2012): "La evolución paradigmática del SITAR: Etapas en el desarrollo IDE del nodo cartográfico aragonés". XVII Encuentros Internacionales sobre Sistemas de Información y Documentación, Ibersid 2012, Zaragoza.

 


Comentaris externs

Envia el teu comentari