Web Feature Service: acceso en red a datos espaciales vectoriales

Artículo realizado por: Francisco Javier Delgado del Hoyo
Máster Universitario de Investigación en TIC
Redactado para la asignatura: Introducción a las Especialidades
Universidad de Valladolid
28 de enero de 2010

 Introducción

En estos momentos los Sistemas de Información Geográfica (SIG) [10,14] tienen una importancia capi­tal, no sólo para documentar la superficie del planeta, sino para dar soporte a multitud de aplicaciones como planificación, diseño de rutas, evaluación de impacto, simulación, etc. Es una forma de modelar e integrar en un sólo sistema toda la información que puede ser georeferenciada, es decir, que tiene una posición ge­ográfica asociada.
La enorme diversidad de interfaces y servicios en­tre las diferentes empresas hizo necesaria la creación de diversos estándares para resolver los problemas de interoperabilidad surgidos. El Open Geospatial Con­sortium (OGC) agrupa actualmente a más de 300 empresas y organismos públicos que buscan definir estándares abiertos e interoperables dentro de los SIG y la World Wide Web. Desde 1994 su objeti­vo es llegar a acuerdos para definir interfaces para sus sistemas de geoprocesamiento, facilitando el inter­cambio de información geográfica en bene.cio de sus usuarios. Lamentablemente la existencia de grandes empresas como ArcGIS que tienen una posición dom­inante en este mercado impide en la mayoría de oca­siones llegar a acuerdos o si los hay, son sumamente insatisfactorios, como en el caso del Web Feature Ser­vice (WFS).


Algunos de los estándares especificados por el OGC más importantes son estos:

  • Web Map Service (WMS): genera mapas en for­mato ráster bajo demanda del cliente, visualiz­ables en un cliente de SIG o Web.
  • Geography Markup Language (GML): almacena y representa elementos geográficos en formato vectorial en varias dimensiones.
  • Keyhole Markup Language (KML): lenguaje de marcado en XML para representar datos tridi­mensionales y navegar modelos complejos.
  • Web Coverage Service (WCS): facilita el ac­ceso a cobertura geoespacial (contenidos como imágenes de satélite, fotografía aérea, elevación digital del terreno, etc).
  • Web Feature Service (WFS): recupera informa­ción relacionada con una entidad almacenada en formato vectorial sobre el mapa. Es habitual que los clientes de este servicio superpongan los datos sobre imágenes de mapas obtenidos con WMS porque están diseñados para interactuar entre el­los. La .gura 1 muestra la arquitectura típica de un SIG utilizando los servicios definidos por el OGC.

El Web Feature Service es sin duda el más débil y menos utilizado de todos los estándares y sin embargo es el más imprescindible porque representa la unica vía de acceso a los datos vectoriales del mapa que se obtiene vía WMS. Los problemas que presentaremos aquí son algunos de los obstáculos que imposibilitan su expansión o que limitan su uso comercial actual­mente, comparado con los otros estándares del OGC.
Así pues su importancia es capital dentro del área de los SIG y por tanto del estado de la técnica.
La investigación en el WFS está motivada por la actual falta de soluciones a las deficiencias que plantea el estándar, presentadas en la sección 2. Al tratarse de problemas no resueltos son temas espe­cialmente indicados para la investigación y las posi­bles soluciones que describiremos en la sección 3 son sólo hipótesis o vías de solución. En la sección 4 se resumen algunas de las conclusiones y trabajo por hacer.


Situación en el sistema de I+D+i

La investigación en posibles soluciones para es­tos problemas es un campo activo activo actual­mente dentro de las Tecnologías de la Información y las Comunicaciones (TIC), relacionado con los Ser­vicios Web, aplicaciones de logística y transporte
o incluso con las ontologías espaciales. Dentro del Máster de Investigación se sitúa dentro de asignat­uras como Paradigmas, arquitecturas y middleware de sistemas telemáticos distribuidos, Tecnologías emer­gentes de sistemas telemáticos y en Ingeniería de sis­temas telemáticos de gestión y trasportes.
En relación con los actores que intervienen en el sistema de I+D+i este tema es objeto de estudio por parte del grupo ITNTITAST de la Universidad de Valladolid, y en particular por una de sus divi­siones como es el Laboratorio de Infraestructura de Datos Espaciales (IDELab) [7] de Valladolid. A su vez este grupo desarrolla proyectos de investigación con agentes externos a la universidad como CEDE­TEL y COTESA. Las investigaciones en problemas relacionados con SIG gestionadas por el IDELab se enmarcan dentro del Plan Nacional de I+D+i y es égica en el futuro inmediato. area estrat´


Estado de la técnica
2.1. El estándar WFS


El WFS proporciona una interfaz para realizar con­sultas y transacciones sobre características, utilizan­do el lenguaje GML. El estándar es una especi.cación del OGC del año 2005 (ver [1–3]) que se utiliza en SIG para gestionar capas de información vectoriales como en la .gura 2. Una característica o feature es un objeto dentro de la sistema que representa una en­tidad física con posición geográfica, dotada de atrib­utos como nombre, forma o localización. La interfaz del estándar sólo define 4 operaciones:
GetCapabilities: devuelve las operaciones permi­tidas en el servicio.
DescribeFeatureType: devuelve el esquema de un tipo de característica.
GetFeature: dada una consulta devuelve instan­cias de una característica con sus atributos. Puede contener varias consultas, construidas con .ltros sobre alguna característica y sus atribu­tos y definidas utilizando el Lenguaje de con­sulta de Catálogo (CQL) [12]. Esta primitiva no contienen ningún tipo de información semántica explícita en la consulta ni en el resultado para referirse a diferentes compoenentes de una obser­vación. En su lugar se pueden definir extensiones propias al estándar con nuestro propio modelo de características, como en el Climate Science Mod­eling Language (CSCL) [6].
GetGmlObject, Transaction y LockFeature: son operaciones opcionales para obtener objetos GML desde una consulta, insertar, borrar, ac­tualizar una característica y bloquearla.


2.2. Limitaciones


El estándar WFS es tan genérico y simple que sus deficiencias proviene de la propia especi.cación y la interfaz del servicio. Por ejemplo, la mayoría de servi­cios WFS que existen actualmente sólo proporcionan características geográficas estáticas típicas de mapas de GIS vectoriales: lindes, ríos, regiones, etc. A el­las podemos asociar atributos dinámicos como obser­vaciones en un punto de interés o estado del trá.­co, aunque después sólo obtendremos el último valor. Cuando los resultados de la consulta son abundantes no hay una forma definida en el estándar reducir la cantidad de información devuelta.
En este caso nos centraremos en el problema más importante: el bajo rendimiento de las consultas (cuello de botella). Según la especi.cación las con­sultas remitidas al servidor son resueltas de forma remota y los resultados devueltos al usuario, inde­pendientemente del número de registros resultantes. El cuello de botella deriva de la gran cantidad de in­formación codificada en modo texto enviada por la red y que ralentiza el servicio saturando la red.
La raíz del problema es el uso de GML como lenguaje de codificación de las consultas y devolu­ción de resultados. Este hereda todos los problemas derivados de XML como la pérdida de e.ciencia y el elevado tamaño, haciendo que el rendimiento del servicio sea pésimo. En muchos dominios de apli­cación es conveniente evaluar otras soluciones más especí.cas que respondan mejor a nuestros requisitos de rendimiento, como ocurre en [4], donde se evalúa como más e.ciente utilizar el estándar Sensor Obser­vation Servide (SOS) que el WFS para el intercambio y representación de registros de datos en puntos con­cretos en plataformas submarinas.


Soluciones


A continuación vamos a describir brevemente las soluciones fuera del estándar que se han explorado [15], de las cuales profundizaremos en la última sola­mente.
Cambio en la codificación de los con­tenidos. modificar el estándar actual para codi­.car los contenidos en un formato binario o simi­lar que necesita hasta 7 veces menos espacio que el XML tradicional. También sería posible uti­lizar otros formatos de representación alterna­tivos a GML para representar la información de los que ya existen actualmente.
Compresión al vuelo. Una solución clásica en los servicios Web que acelera y optimiza el rendimiento de las transmisiones de datos es la compresión .al vuelo”de los contenidos. Es una solución que combina el sistema de compresión GZIP con el protocolo HTTP. De nuevo es una solución que no está contemplada en la especi­.cación estándar por lo que implicaría una re­visión de la misma.
Cambio del interfaz. Consiste en rediseñar la especi.cación del interfaz y el protocolo del ser­vicio Web para adaptarlo a una arquitectura ori­entada a recursos como REST [9,11]. En este ca­so se aprovechan las primitivas menos habituales de HTTP como son POST, PUT y DELETE para manejar recursos que se representan me­diante una URL y se aprovechan de la notación JSON de JavaScript [13] que evita la necesidad de XML y es un formato más ligero y e.ciente para el intercambio de datos.
Paginación de resultados. Proviene de las bases de datos y consiste en dividir los reg­istros resultantes de la consulta en pequeños gru­pos manejables, cuyo tamaño y orden define el cliente. En este sentido el estándar no dispone de primitivas de servicio para ordenar los resultados ni tampoco para dividirlos.

La última solución es viable, porque es una aprox­imación adoptada ya en la parte del estándar transac­cional (WFST [5]) donde existe un parámetro que limita el número de registros resultado. Sin embargo sólo se utiliza para la inserción, borrado y actual­ización de features en el servidor de contenidos, uti­lizando el concepto de transacción. También es orig­inal porque todavía no se ha implementado con éxito en WFS y reutiliza una solución ya existente para re­solver el problema del rendimiento de las consultas. Finalmente también es significativa, porque es un problema no resuelto y supondría una mejora impor­tante frente a las soluciones actuales.

Conclusiones


El WFS es una especi.cación de un servicio Web que surge de una buena idea (permitir el acceso a datos vectoriales), pero que probablemente debido a intereses ocultos, ha sido concebido de la forma menos e.ciente (y comercial) posible. Su principal limitación proviene del cuello de botella en el acce­so a los resultados de una consulta. Aunque existen diversas técnicas provenientes de otros servicios Web que pueden ser reutilizadas, el problema es que todas ellas requieren modificaciones en el estándar para ser viables y efectivas.
Además de esta, el estándar tiene otras limita­ciones como la excesiva sencillez de la interfaz, la falta de semántica de las características, o la imposi­bilidad de manejar la variable tiempo. La solución a estos problemas consiste en ampliar el estándar me­diante extensiones propias del dominio de aplicación, algo que se hace casi imprescindible debido a la sim­plicidad y elevada .exibilidad de la especi.cación del OGC.
El problema es considerado una pregunta de in­vestigación porque todavía no existe una respuesta o solución definitiva que cumpla con los requisitos de­mandados por los usuarios. En este caso el IDELab de Valladolid es el OPI encargado de la investigación de estos problemas dentro del Máster de Investigación en TIC.


Referencias


[1] Web feature service (WFS) implementation speci.cation, 2005. Available from: www. opengeospatial.org/standards/wfs.
[2] Simple feature access part 1: Common archi­tecture, October 2006. Available from: www. opengeospatial.org/standards/sfa.

[3] Simple feature access part 2: SQL op­tion, October 2006. Available from: www. opengeospatial.org/standards/sfs.
[4] Luis Bermudez, Philip Bogden, Eric Bridger, Tony Cook, Charlton Galvarino, Gerry Creager, David Forrest, and John Graybeal. Web feature service (wfs) and sensor observation service (sos) comparison to publish time series data. Collab­orative Technologies and Systems, International Symposium on, 0:36–43, 2009.
[5] Cartomod. Edición cartográ.ca web (wfs/t). Available from: www.sigte.udg.es/ jornadassiglibre2007/comun/3pdf/4.pdf.
[6] Natural Enviorement Research Council. Climate science modelling language [online]. 2008. Avail­able from: csml.badc.rl.ac.uk.
[7] Universidad de Valladolid. Laboratorio de in­fraestructuras de datos espaciales [online]. 2010. Available from: idelab.uva.es.
[8] Confederación Hidrográfica del Guadalquivir. Servicios ogc de información medioam­biental [online]. 2010. Avail­able from: www.chguadalquivir.es/ opencms/portalchg/laDemarcacion/ informacionMedioambiental/serviciosOgc.
[9] Roy Thomas Fielding. Architectural Styles and the Design of Networkbased Software Architec­tures. PhD thesis, California, 2000. Avail­able from: www.ics.uci.edu/~fielding/pubs/ dissertation/top.htm.
[10] C.P. Lo and A.K.W. Yeung. Concepts and tech­niques of geographic information systems. Pren­tice Hall Upper Saddle River, NJ, 2002.
[11] R Lucchi, M Millot, and C Elfers. Resource oriented architecture and REST: assessment of impact and advantages on INSPIRE. Technical EUR 23397 EN 2008, European Commission, 2008. Available from: ies.jrc.ec.europa. eu/uploads/fileadmin/Documentation/ Reports/Spatial_Data_infrastructures/ EUR_20062007/EUR_23397_EN.pdf.
[12] D. Nebert, A. Whiteside, and PP Vretanos. OpenGIS catalogue services speci.cation. Open Geospatial Consortium Inc, 2004.
[13] A. Sayar, M. Pierce, and G. Fox. Integrating AJAX approach into GIS visualization web ser­vices. In Proceedings of IEEE International Con­ference on Internet and Web Applications and Services ICIW, volume 6, pages 23–25. Citeseer.
[14] C.D. Tomlin. Geographic information systems and cartographic modeling. Englewood Cli.s, 1990.
[15] S. Tu, M. Flanagin, Y. Wu, M. Abdelguer.,
E. Normand, and Venkata Mahadevan. Design strategies to improve performance of GIS web services. In Information Technology: Coding and Computing, 2004. Proceedings. ITCC 2004. In­ternational Conference on, volume 2, pages 444– 448 Vol.2, 2004.