Fusión de Datos

Proporciona el primer tipo de respuesta a la cuestión de cuál es el procesamiento más adecuado para extraer la información de mayor calidad a partir de los datos de los sensores. El escenario tecnológico habitual para la captación de datos de tráfico en las ciudades ha sido, hasta ahora, pobre y limitado. Las tecnologías de detección tradicionales son caras y sólo proporcionan un tipo de datos. El advenimiento de las TIC está cambiando rápidamente esta perspectiva. Una Smart City está sensorizada mediante una proliferación de fuentes tecnológicas independientes (espiras de inducción, magnetómetros, CCTV, Bluetooth, vehículos con GPS…) que lleva a un conjunto de datos heterogéneo y posiblemente inconsistente. ¿Cómo se pueden explotar de la manera más eficiente los datos multisensoriales para generar una información consistente y de valor añadido?

Leer Más

En un escenario plausible de sensorización para la Smart Mobility en una Smart City coexisten una variedad de tecnologías para la captación de esos datos de tráfico, cuyo procesamiento proporcionará la información, más o menos “Smart” en función de la sofisticación y esfuerzo computacional utilizados. Grosso modo las tecnologías que pueden coexistir en ese escenario serian:

  • Espiras de inducción magnética que pueden medir: Intensidad, Ocupación, Velocidad y Clasificación de vehículos.
  • Tecnologías alternativas que proporcionan medidas similares a las de las espiras de inducción, tales como magnetómetros, radares y CCTV con procesamiento de imagen.
  • Tecnologías de identificación de vehículos o de identificación de huella electrónica, tales como cámaras de televisión con lectura de la placa de matrícula (LPR License Plate Reader), antenas de captura de dispositivos Bluetooth/WiFi y lectores de identificadores electrónicos TAGs. La función de detección en todos estos casos permite el cálculo del tiempo de viaje entre unidades consecutivas.
  • De localización automática de vehículos, GPS+3G (o similar)
  • Sistemas cooperativos: Representan las posibilidades tecnológicas del futuro a medio-largo plazo y se pueden materializar en dos familias de carácter general: V2V y V2I.

La situación de facto que plantean todo este tipo de escenarios tecnológicos puede describirse de la manera siguiente:

  • Diferentes tipos de sensores que miden las mismas variables de tráfico con diferentes grados de precisión y/o agregaciones temporales
  • Diferentes tipos de sensores que miden diferentes variables de tráfico con diferentes precisiones y/o agregaciones temporales

En definitiva, conjuntos de medidas heterogéneas, a las que se les pueden añadir datos complementarios como los que corresponden a datos meteorológicos y acontecimientos como eventos o fenómenos estacionales.

Las preguntas naturales son ¿Qué se puede hacer con estos conjuntos de datos heterogéneos? ¿Cómo se puede extraer la mayor, mejor y más eficiente información de tráfico a partir de ellos?

La propuesta de Betterways tiene dos componentes:

  • INTEGRACIÓN: Creación de perfiles que correspondan a tipologías homogéneas en función de los acontecimientos externos al sistema de tráfico que los pueden haber configurado, como por ejemplo el día-tipo, a franja horaria o las condiciones meteorológicas. El número y variedad de perfiles depende, evidentemente, de la cantidad de datos históricos y tipologías recogidas.
  • FUSION DE DATOS MULTISENSORIALES, una de cuyas definiciones que mejor expresa el concepto sea: “A technique by which data from several sensors are combined through a centralized data processor to provide comprehensive and accurate information” o, como, sintéticamente afirma el profeson Van Lint de la Universidad de Delft "The science of extracting valuable information from raw traffic data"

Los primeros pasos del proceso corresponden a la generación de la base de datos integrada, que combina los datos de tráfico proporcionados por las diferentes tecnologías, con los diferentes tipos de eventos para generación de los perfiles.

En general hay un consenso entre los expertos sobre cuáles son las capacidades fundamentales de las técnicas de “Data Fusion”, que Dailey (1996) y Ou (2011), resumen de la manera siguiente:

  • Incremento de la confianza: más de un sensor puede confirmar el objetivo.
  • Reducción de la ambigüedad: la información conjunta procedente de múltiples sensores reduce el conjunto de hipótesis sobre el objetivo.
  • Mejora de la detección: la integración de múltiples medidas del mismo objetivo proporciona un ratio mejorado de señal/ruido, lo que incrementa la seguridad de la detección.
  • Incremento de la robustez: un sensor puede proporcionar información donde otros no están disponibles, no están operativos o son ineficaces.
  • Mejora del cubrimiento espacial y temporal: un sensor puede trabajar donde o cuando otro no puede.
  • Provisión de una única secuencia de datos a partir de muchas secuencias de input

Hay un acuerdo general en clasificar las técnicas de fusión de datos en tres niveles, cuyas características genéricas describe Dailey (1996)

CARACTERÍSTICAS GENÉRICAS
Nivel de Fusión Método General Técnica Específica
Nivel 1 Asociación de datos
Estimación Posicional
Figuras de Mérito - "Gating techniques"
Filtro de Kalman
Nivel 2 Fusión por identidad
Reconocimiento de Patrones
Teoría Bayesiana de la Decisión, Razonamiento Evidencial de Dempster-Schafer, Redes Neuronales Adaptativas
Métodos de clustering
Nivel 3 Inteligencia Artificial Sistemas Basados en Conocimiento, Blackboard Arquitecture, Fuzzy Logic

Varshney (1997) propone una versión más elaborada que se adecua mejor a las aplicaciones de las técnicas de Fusión de Datos al caso de los datos de tráfico.

CARACTERÍSTICAS ESPECÍFICAS
Nivel de Fusión Propósito Método
Nivel 1 Procesamiento de datos en bruto Métodos de estimación de estado, Filtros digitales, Filtros de Kalman, Filtros de partículas, etc
Nivel 2 Derivación de características distintivas y patrones de comportamiento Métodos de clasificación/Inferencia (Reconocimiento Estadístico de Patrones, Razonamiento Evidencial de Demster-Chaffer, Métodos Bayesianos, Redes Neuronales, Medidas de Correlación, Teoría de Fuzzy Sets...)
Nivel 3 Toma de decisiones y detección de sucesos Sistemas de Ayuda a la Toma de Decisiones, Sistemas Basados en Conocimiento

El nivel 1 de fusión está orientado al procesamiento de los datos brutos proporcionados por las diferentes variedades tecnológicas de sensores y a la estimación de los estados básicos del sistema objeto del análisis. El objetivo de la fusión en este nivel es la traducción de estos datos en información básica para la determinación del estado del sistema de tráfico: intensidades, ocupaciones, velocidades. El nivel 2 de fusión tiene como objetivo derivar características distintivas y patrones de comportamiento a partir de las estimaciones de estado del nivel anterior. En el caso de los sistemas de tráfico vehicular esto significa la predicción de la evolución del estado a corto plazo, la detección de incidentes, etc. El nivel 3 de fusión puede considerase como un nivel de toma de decisiones sobre el sistema a partir de la información suministrada por los niveles 1 y 2.

Ou (2011) propone un planteamiento según el cual cuál se puede caracterizar a los métodos de fusión de datos de tráfico como constituidos por dos componentes principales: un núcleo y una cápsula.

El NÚCLEO representa las leyes físicas y las hipótesis que sustentan la teoría de los flujos de tráfico, como por ejemplo:

  • Leyes físicas: las leyes de conservación del número de vehículos
  • Hipótesis: el flujo del tráfico es homogéneo en cierta región del espacio-tiempo
  • Leyes e hipótesis: las que fundamentan los modelos de flujos de tráfico de primer orden (Ecuaciones de continuidad), el diagrama fundamental del tráfico, etc.
  • Modelos lineales
  • Hipótesis de distribuciones gausianas de las variables del modelo y de los errores de medida.

La CÁPSULA representa las técnicas de asimilación, como por ejemplo:

  • Las técnicas estadísticas: capaces de combinar de manera óptima modelos y datos.

Betterways ha desarrollado sus herramientas siguiendo los planteamientos de Varshney (1997) y Ou (2011) para implementar un proceso de tratamiento de datos con tres niveles de fusión.

  • El nivel 1 de Fusión de Datos de Tráfico tiene como objeto el procesamiento de los datos brutos proporcionados por cada uno de los sensores para la obtención de un conjunto de datos válido sin presencia de detecciones atípicas, que sea completo, sin datos faltantes consecuencia de fallos del sensor o de la eliminación de atípicos, y si hace falta que sea completado con datos una predicción consistente con la secuencia observada para el intervalo de tiempo en cuestión. A partir del conjunto de datos válidos se puede obtener una estimación y una predicción robusta del estado del tráfico.
  • La estimación del estado del tráfico permite alimentar los procedimientos de nivel 2 de fusión para la actualización de los perfiles históricos con los nuevos datos obtenidos. Permitiendo que los perfiles históricos sean cada vez más representativos al ser actualizados permanentemente.
  • Finalmente el nivel 3 de fusión permite, mediante el uso de modelos dinámicos de tráfico proporcionar herramientas para la toma de decisiones.

El nivel 1 comporta la ejecución previa de dos procesos:

  • Filtrado de los datos brutos: por refinada y precisa que sea la tecnología siempre se producen medidas atípicas que es necesario filtrar, de lo contrario se dispondría de series de observaciones sesgadas o con desviaciones tipo distorsionadas por la presencia de atípicos.
  • Provisión de datos faltantes: la supresión de datos atípicos genera “huecos” en las series de observaciones que es necesario rellenar para disponer de series completas. Este es el papel de los modelos de datos faltantes.

Otra aplicación de los métodos implementados por Betterways es la reconstrucción espacio temporal del estado del tráfico por interpolación entre datos puntuales y eliminación del ruido de alta frecuencia, preservando la mayor parte de la información dinámica relevante. La aplicación del método de fusión de fuentes de datos heterogéneos para la reconstrucción espacio-temporal permite que ésta sea más robusta y que se puedan obtener estimaciones para puntos en los que una sola de fuente de datos no podría proporcionar.


Figura: (a) Puntos con datos de espiras inducción dentro de las dimensiones espacio-tiempo (b) Trayectorias medias correspondientes a los viajes entre los sensores de dispositivos Bluetooth (c) Reconstrucción espacio-temporal del estado del tráfico para la sección de la red a partir de los datos de espiras magnéticas (d) Reconstrucción espacio-temporal del estado del tráfico para la sección de la red a partir de los datos Bluetooth (e) Reconstrucción espacio-temporal del estado del tráfico para la sección de la red a partir de la fusión de todas las fuentes de datos. (Datos de espiras de inducción y de viajes entre los tres sensores Bluetooth de la calle Gran Vía el día 03/02/2012)

Finalmente también se incluye la estimación del Macro Fundamental Diagram (MFD) de Geroliminis y Daganzo (2008), con la que partiendo de datos locales proporcionados por Estaciones de Tomada de Datos desplegadas por toda la red vial y datos puntuales obtenidos a partir de los vehículos equipados con GPS, se genera una nueva información de carácter global interpretable en términos de medida de la capacidad global de la red y de su estado en un momento dado.