Actualización automática de información en entornos de datos abiertos


APORTA_BANNER_WEB_750x180

Esta entrada se publicó en A un clic de las TIC

Este post se publicó el mismo día en que se celebraba el encuentro Aporta 2015 sobre open data, promovido por el Ministerio de Hacienda y Administraciones Públicas y el Ministerio de Industria, Turismo y Energía. El objeto de las distintas ediciones de este encuentro ha sido ahondar en los aspectos clave del open data y analizar aquellos casos reales en los que los datos abiertos desempeñan una función relevante en el plan estratégico de una organización.Recordemos que las iniciativas de datos abiertos están destinadas a poner a disposición de terceros los datos producidos por una organización con objeto de que se usen para consulta, análisis, seguimiento de la gestión, generación de nuevos productos y servicios o, en general, cualquier actividad a la que éstos los quieran destinar.

Al margen de aspectos estratégicos y filosóficos, estas iniciativas tienen un fuerte componente tecnológico. En general, y desde el punto de vista de sistemas de información, clasificaría sus componentes de la siguiente manera:

  • Catálogo: La base de toda la infraestructura, la que almacena los datos, los publica y permite localizarlos entre todo el maremágnum de información. Posiblemente es el único elemento indispensable de estos sistemas.
  • Gestión de contenidos: Poco a poco se va aceptando que se requiere una capa sobre el catálogo para hacer más amigable y flexible el portal de datos abiertos. En muchos casos incluso el catálogo se desarrolla sobre el propio gestor de contenidos.
  • Transparencia: Con un catálogo y un gestor de contenidos, es muy fácil crear una pequeña particularización del portal hacia la transparencia y un portal de Gobierno abierto.
  • Visualizaciones: Son un elemento esencial para hacer más amigables y accesibles estas iniciativas, proporcionan un ejemplo palpable de la potencia de los datos.
  • Elementos de carga dinámica de datos: La carga de datos supone uno de los mayores retos a los que se enfrenta una iniciativa de datos abiertos. Es necesario identificar las estrategias y herramientas para realizarla sin que suponga grandes esfuerzos a la organización, lo que a la larga llevaría a la muerte por inanición del portal. Así, para una iniciativa viable, son fundamentales los elementos que realizan una carga automática y dinámica de los datos.Tube el placer de participar en la mesa de “Iniciativas de datos abiertos: soluciones facilitadoras” donde hablé de lecciones aprendidas en el desarrollo de proyectos de datos abiertos, más concretamente de la actualización automática de los conjuntos de datos, para entablar después un debate con el resto de empresas que componen la mesa.
  • Puntos SPARQL y APIS: Para un acceso directo a los datos y la automatización de su uso.
  • Por supuesto, es necesario adecuarse a la normativa vigente.

A pesar de que en España las iniciativas de Gobierno abierto, y en consecuencia las de datos abiertos, tienen un fuerte impulso en la transparencia, lo que se observa es que realmente su uso continuado está asociado al consumo de información de servicios públicos, como son autobuses, tráfico, comercios, etc (Fuente: Portales de datos abiertos de Santander  Las Palmas de Gran Canaria. En este sentido, nos encontramos las plataformas de ciudad, como Fiware  o la  smart city de Valencia , que incorporan los datos abiertos como su ventana hacia reutilizadores y empresas.

La publicación de información de servicios públicos está destinada a la creación de servicios y generación de economía. Requiere un firme compromiso de los promotores con la estabilidad de la iniciativa y con la disponibilidad, formatos, licencias, tasa de refresco y calidad de los datos. Esto no es viable si no se dispone de herramientas que automaticen su extracción, enriquecimiento y publicación.

A medida que hacemos más sofisticado el sistema que da soporte a los datos abiertos es muy fácil olvidar el objetivo e intentar dotarlo de mayores capacidades. Esto complica en exceso el proyecto y pueden llegar a empañar el resultado. Los sistemas de almacenamiento de información no están optimizados para realizar análisis complejos sobre ellos, no están destinados a ser un bus de comunicaciones que intercambien los mensajes de miles de sensores de una ciudad y tampoco podrán mover y publicar Gigas de información por minuto. Si bien todo esto se puede conseguir, y se está haciendo en algunas de las iniciativas citadas, es importante comprender las fronteras entre las tecnologías y su objeto.

Por tanto, la tesis mantenida en mi intervención será que una información de servicios públicos de calidad y actualizada es vital para el desarrollo de los portales de datos abiertos. Para ello será necesario desplegar sistemas de actualización dinámica y automática de los datos y no debemos confundir un proyecto de datos abiertos con uno de inteligencia de negocio o de smart city. En este sentido, recientemente se aprobaba la primera norma sobre datos abiertos para smart cities en España.

El soporte a la charla fue:

 

 

Compartir
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *