Web Feature Service: acceso en red a datos espaciales vectoriales
Artículo realizado por: Francisco Javier Delgado del Hoyo
Máster Universitario de Investigación en TIC
Redactado para la asignatura: Introducción a las Especialidades
Universidad de Valladolid
28 de enero de 2010
Introducción
En estos momentos los Sistemas de Información Geográfica (SIG) [10,14] tienen una importancia capital, no sólo para documentar la superficie del planeta, sino para dar soporte a multitud de aplicaciones como planificación, diseño de rutas, evaluación de impacto, simulación, etc. Es una forma de modelar e integrar en un sólo sistema toda la información que puede ser georeferenciada, es decir, que tiene una posición geográfica asociada.
La enorme diversidad de interfaces y servicios entre las diferentes empresas hizo necesaria la creación de diversos estándares para resolver los problemas de interoperabilidad surgidos. El Open Geospatial Consortium (OGC) agrupa actualmente a más de 300 empresas y organismos públicos que buscan definir estándares abiertos e interoperables dentro de los SIG y la World Wide Web. Desde 1994 su objetivo es llegar a acuerdos para definir interfaces para sus sistemas de geoprocesamiento, facilitando el intercambio de información geográfica en bene.cio de sus usuarios. Lamentablemente la existencia de grandes empresas como ArcGIS que tienen una posición dominante en este mercado impide en la mayoría de ocasiones llegar a acuerdos o si los hay, son sumamente insatisfactorios, como en el caso del Web Feature Service (WFS).
Algunos de los estándares especificados por el OGC más importantes son estos:
- Web Map Service (WMS): genera mapas en formato ráster bajo demanda del cliente, visualizables en un cliente de SIG o Web.
- Geography Markup Language (GML): almacena y representa elementos geográficos en formato vectorial en varias dimensiones.
- Keyhole Markup Language (KML): lenguaje de marcado en XML para representar datos tridimensionales y navegar modelos complejos.
- Web Coverage Service (WCS): facilita el acceso a cobertura geoespacial (contenidos como imágenes de satélite, fotografía aérea, elevación digital del terreno, etc).
- Web Feature Service (WFS): recupera información relacionada con una entidad almacenada en formato vectorial sobre el mapa. Es habitual que los clientes de este servicio superpongan los datos sobre imágenes de mapas obtenidos con WMS porque están diseñados para interactuar entre ellos. La .gura 1 muestra la arquitectura típica de un SIG utilizando los servicios definidos por el OGC.
El Web Feature Service es sin duda el más débil y menos utilizado de todos los estándares y sin embargo es el más imprescindible porque representa la unica vía de acceso a los datos vectoriales del mapa que se obtiene vía WMS. Los problemas que presentaremos aquí son algunos de los obstáculos que imposibilitan su expansión o que limitan su uso comercial actualmente, comparado con los otros estándares del OGC.
Así pues su importancia es capital dentro del área de los SIG y por tanto del estado de la técnica.
La investigación en el WFS está motivada por la actual falta de soluciones a las deficiencias que plantea el estándar, presentadas en la sección 2. Al tratarse de problemas no resueltos son temas especialmente indicados para la investigación y las posibles soluciones que describiremos en la sección 3 son sólo hipótesis o vías de solución. En la sección 4 se resumen algunas de las conclusiones y trabajo por hacer.
Situación en el sistema de I+D+i
La investigación en posibles soluciones para estos problemas es un campo activo activo actualmente dentro de las Tecnologías de la Información y las Comunicaciones (TIC), relacionado con los Servicios Web, aplicaciones de logística y transporte
o incluso con las ontologías espaciales. Dentro del Máster de Investigación se sitúa dentro de asignaturas como Paradigmas, arquitecturas y middleware de sistemas telemáticos distribuidos, Tecnologías emergentes de sistemas telemáticos y en Ingeniería de sistemas telemáticos de gestión y trasportes.
En relación con los actores que intervienen en el sistema de I+D+i este tema es objeto de estudio por parte del grupo ITNTITAST de la Universidad de Valladolid, y en particular por una de sus divisiones como es el Laboratorio de Infraestructura de Datos Espaciales (IDELab) [7] de Valladolid. A su vez este grupo desarrolla proyectos de investigación con agentes externos a la universidad como CEDETEL y COTESA. Las investigaciones en problemas relacionados con SIG gestionadas por el IDELab se enmarcan dentro del Plan Nacional de I+D+i y es égica en el futuro inmediato. area estrat´
Estado de la técnica
2.1. El estándar WFS
El WFS proporciona una interfaz para realizar consultas y transacciones sobre características, utilizando el lenguaje GML. El estándar es una especi.cación del OGC del año 2005 (ver [1–3]) que se utiliza en SIG para gestionar capas de información vectoriales como en la .gura 2. Una característica o feature es un objeto dentro de la sistema que representa una entidad física con posición geográfica, dotada de atributos como nombre, forma o localización. La interfaz del estándar sólo define 4 operaciones:
GetCapabilities: devuelve las operaciones permitidas en el servicio.
DescribeFeatureType: devuelve el esquema de un tipo de característica.
GetFeature: dada una consulta devuelve instancias de una característica con sus atributos. Puede contener varias consultas, construidas con .ltros sobre alguna característica y sus atributos y definidas utilizando el Lenguaje de consulta de Catálogo (CQL) [12]. Esta primitiva no contienen ningún tipo de información semántica explícita en la consulta ni en el resultado para referirse a diferentes compoenentes de una observación. En su lugar se pueden definir extensiones propias al estándar con nuestro propio modelo de características, como en el Climate Science Modeling Language (CSCL) [6].
GetGmlObject, Transaction y LockFeature: son operaciones opcionales para obtener objetos GML desde una consulta, insertar, borrar, actualizar una característica y bloquearla.
2.2. Limitaciones
El estándar WFS es tan genérico y simple que sus deficiencias proviene de la propia especi.cación y la interfaz del servicio. Por ejemplo, la mayoría de servicios WFS que existen actualmente sólo proporcionan características geográficas estáticas típicas de mapas de GIS vectoriales: lindes, ríos, regiones, etc. A ellas podemos asociar atributos dinámicos como observaciones en un punto de interés o estado del trá.co, aunque después sólo obtendremos el último valor. Cuando los resultados de la consulta son abundantes no hay una forma definida en el estándar reducir la cantidad de información devuelta.
En este caso nos centraremos en el problema más importante: el bajo rendimiento de las consultas (cuello de botella). Según la especi.cación las consultas remitidas al servidor son resueltas de forma remota y los resultados devueltos al usuario, independientemente del número de registros resultantes. El cuello de botella deriva de la gran cantidad de información codificada en modo texto enviada por la red y que ralentiza el servicio saturando la red.
La raíz del problema es el uso de GML como lenguaje de codificación de las consultas y devolución de resultados. Este hereda todos los problemas derivados de XML como la pérdida de e.ciencia y el elevado tamaño, haciendo que el rendimiento del servicio sea pésimo. En muchos dominios de aplicación es conveniente evaluar otras soluciones más especí.cas que respondan mejor a nuestros requisitos de rendimiento, como ocurre en [4], donde se evalúa como más e.ciente utilizar el estándar Sensor Observation Servide (SOS) que el WFS para el intercambio y representación de registros de datos en puntos concretos en plataformas submarinas.
Soluciones
A continuación vamos a describir brevemente las soluciones fuera del estándar que se han explorado [15], de las cuales profundizaremos en la última solamente.
Cambio en la codificación de los contenidos. modificar el estándar actual para codi.car los contenidos en un formato binario o similar que necesita hasta 7 veces menos espacio que el XML tradicional. También sería posible utilizar otros formatos de representación alternativos a GML para representar la información de los que ya existen actualmente.
Compresión al vuelo. Una solución clásica en los servicios Web que acelera y optimiza el rendimiento de las transmisiones de datos es la compresión .al vuelo”de los contenidos. Es una solución que combina el sistema de compresión GZIP con el protocolo HTTP. De nuevo es una solución que no está contemplada en la especi.cación estándar por lo que implicaría una revisión de la misma.
Cambio del interfaz. Consiste en rediseñar la especi.cación del interfaz y el protocolo del servicio Web para adaptarlo a una arquitectura orientada a recursos como REST [9,11]. En este caso se aprovechan las primitivas menos habituales de HTTP como son POST, PUT y DELETE para manejar recursos que se representan mediante una URL y se aprovechan de la notación JSON de JavaScript [13] que evita la necesidad de XML y es un formato más ligero y e.ciente para el intercambio de datos.
Paginación de resultados. Proviene de las bases de datos y consiste en dividir los registros resultantes de la consulta en pequeños grupos manejables, cuyo tamaño y orden define el cliente. En este sentido el estándar no dispone de primitivas de servicio para ordenar los resultados ni tampoco para dividirlos.
La última solución es viable, porque es una aproximación adoptada ya en la parte del estándar transaccional (WFST [5]) donde existe un parámetro que limita el número de registros resultado. Sin embargo sólo se utiliza para la inserción, borrado y actualización de features en el servidor de contenidos, utilizando el concepto de transacción. También es original porque todavía no se ha implementado con éxito en WFS y reutiliza una solución ya existente para resolver el problema del rendimiento de las consultas. Finalmente también es significativa, porque es un problema no resuelto y supondría una mejora importante frente a las soluciones actuales.
Conclusiones
El WFS es una especi.cación de un servicio Web que surge de una buena idea (permitir el acceso a datos vectoriales), pero que probablemente debido a intereses ocultos, ha sido concebido de la forma menos e.ciente (y comercial) posible. Su principal limitación proviene del cuello de botella en el acceso a los resultados de una consulta. Aunque existen diversas técnicas provenientes de otros servicios Web que pueden ser reutilizadas, el problema es que todas ellas requieren modificaciones en el estándar para ser viables y efectivas.
Además de esta, el estándar tiene otras limitaciones como la excesiva sencillez de la interfaz, la falta de semántica de las características, o la imposibilidad de manejar la variable tiempo. La solución a estos problemas consiste en ampliar el estándar mediante extensiones propias del dominio de aplicación, algo que se hace casi imprescindible debido a la simplicidad y elevada .exibilidad de la especi.cación del OGC.
El problema es considerado una pregunta de investigación porque todavía no existe una respuesta o solución definitiva que cumpla con los requisitos demandados por los usuarios. En este caso el IDELab de Valladolid es el OPI encargado de la investigación de estos problemas dentro del Máster de Investigación en TIC.
Referencias
[1] Web feature service (WFS) implementation speci.cation, 2005. Available from: www. opengeospatial.org/standards/wfs.
[2] Simple feature access part 1: Common architecture, October 2006. Available from: www. opengeospatial.org/standards/sfa.
[3] Simple feature access part 2: SQL option, October 2006. Available from: www. opengeospatial.org/standards/sfs.
[4] Luis Bermudez, Philip Bogden, Eric Bridger, Tony Cook, Charlton Galvarino, Gerry Creager, David Forrest, and John Graybeal. Web feature service (wfs) and sensor observation service (sos) comparison to publish time series data. Collaborative Technologies and Systems, International Symposium on, 0:36–43, 2009.
[5] Cartomod. Edición cartográ.ca web (wfs/t). Available from: www.sigte.udg.es/ jornadassiglibre2007/comun/3pdf/4.pdf.
[6] Natural Enviorement Research Council. Climate science modelling language [online]. 2008. Available from: csml.badc.rl.ac.uk.
[7] Universidad de Valladolid. Laboratorio de infraestructuras de datos espaciales [online]. 2010. Available from: idelab.uva.es.
[8] Confederación Hidrográfica del Guadalquivir. Servicios ogc de información medioambiental [online]. 2010. Available from: www.chguadalquivir.es/ opencms/portalchg/laDemarcacion/ informacionMedioambiental/serviciosOgc.
[9] Roy Thomas Fielding. Architectural Styles and the Design of Networkbased Software Architectures. PhD thesis, California, 2000. Available from: www.ics.uci.edu/~fielding/pubs/ dissertation/top.htm.
[10] C.P. Lo and A.K.W. Yeung. Concepts and techniques of geographic information systems. Prentice Hall Upper Saddle River, NJ, 2002.
[11] R Lucchi, M Millot, and C Elfers. Resource oriented architecture and REST: assessment of impact and advantages on INSPIRE. Technical EUR 23397 EN 2008, European Commission, 2008. Available from: ies.jrc.ec.europa. eu/uploads/fileadmin/Documentation/ Reports/Spatial_Data_infrastructures/ EUR_20062007/EUR_23397_EN.pdf.
[12] D. Nebert, A. Whiteside, and PP Vretanos. OpenGIS catalogue services speci.cation. Open Geospatial Consortium Inc, 2004.
[13] A. Sayar, M. Pierce, and G. Fox. Integrating AJAX approach into GIS visualization web services. In Proceedings of IEEE International Conference on Internet and Web Applications and Services ICIW, volume 6, pages 23–25. Citeseer.
[14] C.D. Tomlin. Geographic information systems and cartographic modeling. Englewood Cli.s, 1990.
[15] S. Tu, M. Flanagin, Y. Wu, M. Abdelguer.,
E. Normand, and Venkata Mahadevan. Design strategies to improve performance of GIS web services. In Information Technology: Coding and Computing, 2004. Proceedings. ITCC 2004. International Conference on, volume 2, pages 444– 448 Vol.2, 2004.