Browsing articles tagged with " correlación"

Análisis y predicción de lluvias basado en el vapor de agua gps

Jul 8, 2011   //   by jc.cantera   //   Minería de Datos  //  7 Comments

La lluvia es uno de los procesos fundamentales del ciclo hidrológico tanto desde el punto de vista ambiental como humano. La lluvia es la fuente de agua de la vegetación natural, así como de los cultivos. También es el origen de la mayoría del agua de consumo humano, tanto doméstico como en la industria, servicios, etc.

Por último, cabe citar a la lluvia como origen de riesgos naturales, tanto por la ausencia de la misma como por la ocurrencia de fenómenos torrenciales. En las zonas de clima mediterráneo esta situación es especialmente evidente: se trata de zonas en general deficitarias en agua, con precipitaciones escasas e irregulares y donde se dan más o menos frecuentes episodios torrenciales, que causan daños en el medio y grandes pérdidas económicas y humanas.

Por todo ello es fundamental avanzar en el conocimiento de la lluvia como proceso natural, herramienta para la gestión de este valioso recurso y para la predicción de riesgos asociados a eventos extremos.

Una de las variables clave en la ocurrencia de precipitaciones es el contenido en vapor de agua atmosférico. Múltiples estudios han establecido la existencia de niveles altos de vapor de agua en la atmósfera previos a la ocurrencia de precipitaciones intensas en la zona mediterránea. Sin embargo aspectos como el tiempo entre el pico de vapor de agua atmosférico y la ocurrencia de la lluvia o su intensidad no se encuentran en la actualidad satisfactoriamente resueltos, debido en parte a la complejidad del proceso y en parte a la dificultad de determinar el contenido en vapor de agua atmosférico. El GPS durante esta última década se ha convertido en un instrumento de gran interés en meteorología. Esto es debido a su probada eficacia para la estimación del contenido en vapor de agua de la atmósfera.

Este artículo presenta un análisis experimental que establece la relación entre las variaciones del contenido en vapor de agua y de la presión atmosférica, con las lluvias observadas en el periodo 2005-2010, en Pamplona.

Para tratar de predecir el momento y cantidad de precipitaciones, especialmente las copiosas, en Ibermática hemos realizado un estudio de minería de datos con los datos de Fecha, Presión atmosférica, Vapor de agua estimado por GPS y Precipitación.

Buscando correlaciones entre pares de atributos, se observa que en ningún caso llega al 30%. Aún así, se inicia un proceso de estudio de minería de datos, elaborando un modelo de clasificación con resultados, que predice y acierta un alto porcentaje de casos, pero siempre que las precipitaciones sean bajas o nulas.

 

La escasez de correlación directa entre datos se ve en la mezcla aparentemente azarosa de los colores que representan valores de los parámetros en los siguientes gráficos y en la escasa agrupación que presentan (excepto en precipitaciones muy bajas, que no son significativas):

 

Como se trata de determinar más precisamente las precipitaciones mayores, especialmente las más intensas, se analizan los datos desde el punto de vista temporal tratándolos como una serie, de forma que se tenga en cuenta la evolución de los parámetros. Para detectar los casos de precipitaciones mayores, se eliminan del análisis los datos con precipitaciones nulas o muy bajas (Precipitación < 1).

El estudio se hace teniendo en cuenta los datos de 24 registros anteriores (24h) y un horizonte de previsión de N horas. Como método de aprendizaje y predicción el modelo incluye una red neuronal.

La red neuronal generada como resultado no predice con precisión la cantidad exacta de precipitación. Sin embargo, comparando la serie de datos reales con la predicción obtenida, se observa una gran similitud en la gráfica de precipitaciones, especialmente en los picos de precipitación, tanto en el tiempo, como en magnitud, obteniéndose una correlación en torno al 83% en el mejor de los casos.

Acostumbrados como estamos a ver siempre en los mapas del tiempo las isobaras, sorprende que los mejores resultados se dan cuando se excluye la presión del conjunto de datos.

De esta forma, se concluye que tratando los datos como serie temporal, considerando la evolución de los parámetros en el tiempo, y desechando los datos no significativos en los que la precipitación es nula, se pueden anticipar los momentos de fuerte precipitación, en un grado muy aproximado en cuanto a magnitud.