Autores:
(1) Yuxin Meng;
(2) Feng Gao;
(3) Eric Rigall;
(4) Ran Dong;
(5) Junyu Dong;
(6) Qiandu.
A. Área de estudio y entorno del experimento
El Mar de China Meridional se encuentra en el Océano Pacífico occidental, en el sur de China continental. Su superficie es de unos 3,5 millones de kilómetros cuadrados con una profundidad media de 1.212 metros. En este artículo, el área de estudio seleccionada es (3,99°N∼24,78°N, 98,4°E∼124,4°E).
Utilizamos los datos de teledetección satelital de alta resolución del GHRSST (Grupo para la temperatura de la superficie del mar de alta resolución) [55] como datos observados. GHRSST proporciona una variedad de datos sobre la temperatura de la superficie del mar, incluidas coordenadas de franjas satelitales, datos cuadriculados y productos cuadriculados sin espacios. Aquí, hemos empleado productos cuadriculados sin espacios, que se generan combinando observaciones complementarias de satélite e in situ dentro de un marco de interpolación óptima. Se selecciona el HYCOM [56] como modelo numérico. Sus resoluciones espaciales son 1/20°×1/20° y 1/12°×1/12°, respectivamente. La resolución temporal es de un día. Los datos de mayo de 2007 a diciembre de 2013 se utilizan para la formación, mientras que los datos restantes de enero de 2014 a diciembre de 2014 se utilizan para las pruebas. Cabe señalar que utilizamos datos sin nubes proporcionados por GHRSST. Los datos fueron capturados por instrumentos de microondas que pueden atravesar las nubes. Por lo tanto, los datos cubren completamente el área de estudio. Además, la hora exacta de cada píxel en el producto GHRSST SST es la misma.
La estandarización del puntaje Z se utilizó para el preprocesamiento como:
donde x denota el modelo SST de GHRSST y HYCOM, z denota los datos normalizados, µ y σ denotan el valor medio y la desviación estándar respectivamente. Convertimos los datos en mapas de calor de forma cuadrada de 256 × 256.
Más específicamente, los datos GHRSST y el vector aleatorio de 512 dimensiones se utilizan en el primer paso del entrenamiento previo de la red. El tamaño de los datos GHRSST de entrada es N × H × W, donde N representa el tamaño del lote, H indica la altura de los datos de entrada y W denota el ancho de los datos de entrada. Para la segunda etapa de la red anterior, solo empleamos datos GHRSST para el entrenamiento del codificador. Los tamaños de entradas y salidas para ambas etapas son N × H × W. De manera similar, en el tercer paso del entrenamiento previo de la red, los datos de HYCOM SST se introducen en el modelo previamente entrenado. Aquí, los tamaños tanto de las entradas como de las salidas son N × H × W. En nuestras implementaciones, configuramos N en 2430, mientras que H y W están configurados en 256.
Realizamos extensos experimentos en una NVIDIA GeForce 2080Ti con 8 GPU. La red anterior utiliza la misma estructura y configuración de red mencionada en [53] para adquirir el conocimiento físico a partir de los datos históricos observados. Luego, el conocimiento físico obtenido se transfiere a los datos del modelo numérico con el fin de restaurar y mejorar los componentes incorrectos en el modelo numérico. La configuración del modelo ConvLSTM utilizado en este artículo es la misma que la del modelo ConvLSTM en el trabajo de Shi [20]. El conjunto de datos GHRSST SST se utiliza como punto de referencia para la comparación y evaluación en este documento.
B. Influencias del número del último día para la predicción de la TSM
Como se mencionó en la Sección III. C, t denota el número de días pasados utilizados para la predicción. Es un parámetro crítico que puede afectar el rendimiento de la predicción de SST. En este artículo, intentamos predecir la TSM de los próximos uno, tres y siete días. Implementamos extensos experimentos para encontrar el
número adecuado de días pasados para la futura predicción de TSM. Se aplican como criterios de evaluación el error cuadrático medio (RMSE) y el coeficiente de determinación (R2). Los valores de RMSE más bajos y R2 más altos indican resultados más precisos.
La Tabla I enumera los resultados de la predicción para el día siguiente utilizando los datos de los últimos uno, tres y cinco días, por separado. Se puede observar que el modelo propuesto funciona mejor cuando se utilizan datos de los últimos cinco días, donde los resultados de RMSE y R2 son 0,3618 y 0,9967 respectivamente. Son ligeramente mejores que los otros esquemas. En comparación con los otros dos esquemas, los valores RMSE y R2 mejoran en 0,0086, 0,001 y 0,0028, 0,0006. Por lo tanto, los datos de los últimos cinco días se adoptan para la predicción de TSM del siguiente día.
Analizamos las influencias de t para la predicción de TSM de los próximos tres días en la Tabla II. Se puede ver que cuanto más tiempo se utilizaron datos históricos, mejor se logró el rendimiento de la predicción. El valor RMSE que utiliza los datos de los últimos siete días logra el mejor rendimiento. Se mejora en 0,0025 en comparación con los datos de los últimos cinco días. Mientras tanto, el R2 obtiene el mejor rendimiento utilizando los datos de los últimos siete días en comparación con los otros dos esquemas. Por lo tanto, los datos de los últimos siete días se utilizaron para la predicción de TSM de los próximos tres días.
Los resultados experimentales de la predicción de la TSM de los próximos siete días se ilustran en la Tabla III. Como puede verse, los resultados de la predicción que utilizan los datos de los últimos diez días logran el mejor rendimiento. Por lo tanto, aprovechamos los datos de los últimos diez días para la predicción de TSM de los próximos siete días.
C. Estudio de ablación
Para verificar la efectividad de la red previa y el entrenamiento de GAN, realizamos experimentos de ablación. Como se ilustra en la Fig. 3, dos variantes están diseñadas para comparar de la siguiente manera:
• Esquema A. Se reemplaza la secuencia de la red anterior y ConvLSTM. Los datos SST del modelo numérico se introducen primero en ConvLSTM y luego la salida se introduce en la red previa bien entrenada.
• Esquema B. La red anterior no ha sido bien capacitada. Específicamente, se ha omitido el entrenamiento del modelo GAN (el primer paso en la Fig. 2) en el entrenamiento de red anterior.
Los resultados experimentales se muestran en la Tabla IV. Como se puede observar, nuestro método logra los mejores valores de RMSE y R2. Específicamente, el método propuesto supera al Esquema A, lo que demuestra que la secuencia correcta de la red anterior y ConvLSTM puede mejorar el rendimiento de la predicción de SST. Es evidente que la red anterior restaura efectivamente los componentes incorrectos de los datos del modelo numérico y los datos restaurados funcionan mejor en la predicción de SST. Además, el método propuesto tiene un rendimiento superior al Esquema B, lo que demuestra que el modelado GAN es un paso esencial. El modelado GAN puede aprender la distribución de datos de la SST observada y ayuda a la red anterior a capturar mejor información física de la SST observada. En resumen, en el método propuesto, utilizamos el aprendizaje adversario para el preentrenamiento previo de la red, que puede transferir efectivamente el conocimiento físico de los datos SST observados a la red anterior. Puede guiar una rápida convergencia del entrenamiento y mejorar el rendimiento de la predicción de SST.
D. Resultados experimentales y discusión
La Fig. 4 compara la SST prevista para el próximo día con los datos reales observados. Podemos ver que los resultados previstos de nuestro método coinciden bien con los datos observados. De manera similar, los datos observados y la SST correspondiente prevista para los próximos tres días y siete días se muestran en la Fig. 5 y la Fig. 6, respectivamente. Los resultados visualizados indican que el método propuesto puede generar resultados sólidos y confiables para el pronóstico de SST.
En la Fig. 7 se ilustra un diagrama de dispersión de la predicción de TSM para el día siguiente. Se puede observar que los puntos de datos son
distribuidos aproximadamente uniformemente cerca de la línea roja. Las figuras 8 y 9 son diagramas de dispersión de los resultados de la predicción para los próximos tres días y los próximos siete días, respectivamente. Los diagramas de dispersión demuestran la eficacia del método propuesto para la predicción de la TSM.
Para verificar la efectividad del método propuesto, comparamos el método propuesto con siete métodos estrechamente relacionados: ConvLSTM [20], Hybrid-NN [14], Hybrid-TL [15], Gen-END [57], VAE- GAN [58], Tra-NM y Tra-ASL. El área de estudio es (3,99°N∼24,78°N, 98,4°E∼ 124,4°E) para estos métodos. Todos estos métodos utilizaron los datos de entrenamiento de los últimos 5 días para la predicción del siguiente día, los datos de los últimos 7 días para la predicción de los siguientes 3 días y los datos de los últimos 10 días para los siguientes 7 días. predicción.
ConvLSTM se analiza en la Sección III. C, y es un modelo espacio-temporal eficaz para la predicción de TSM. HybridNN utiliza la discrepancia entre los datos observados y los datos del modelo numérico para guiar el entrenamiento de redes neuronales profundas. Hybrid-TL combina las ventajas de los modelos numéricos y las redes neuronales mediante el aprendizaje por transferencia. GenEND es un codificador generativo que se puede utilizar para la predicción de SST. VAE-GAN integra codificador automático variacional y
GAN y puede capturar características semánticas de alto nivel para la predicción de SST. Los datos de HYCOM SST se utilizan para entrenar el modelo ConvLSTM para la próxima predicción de 1, 3 y 7 días (denominada Tra-NM). Tra-ASL es un método de asimilación tradicional y explota las correlaciones entre múltiples tipos de datos (datos observados y datos de modelos numéricos).
Los datos de GHRSST se utilizan primero para entrenar un modelo ConvLSTM, que sirve como base. Es un enfoque basado en datos ampliamente utilizado para la predicción de la TSM. Hybrid-NN, HybridTL, Gen-END y VAE-GAN emplean los datos GHRSST y HYCOM para el entrenamiento. Los datos de asimilación de HYCOM [56]
aquí se utilizan, con una resolución espacial de 1/12°×1/12°. Nuestro método mejora y rectifica los componentes incorrectos en los datos del modelo numérico al introducir conocimiento físico a partir de los datos históricos observados. Los datos del modelo numérico corregido se denominan datos mejorados por la física. Para comparar con los datos mejorados por la física, los datos de asimilación de HYCOM (Tra-ASL) y los datos de HYCOM (Tra-NM) se utilizan de manera similar para entrenar el modelo ConvLSTM.
Los tiempos de entrenamiento de ConvLSTM, Hybrid-NN, Tra-NM y Tra-ASL para las próximas predicciones de 1, 3 y 7 días son 1,8, 4,4 y 8,2 horas, respectivamente. El método Hybrid-TL entrenó el modelo ConvLSTM dos veces y la duración del entrenamiento es de 3,6, 8,8 y 16,4 horas para las tres tareas, respectivamente. El VAE-GAN requiere 181,6, 184,2 y 188,4 horas para el entrenamiento, mientras que el método Gen-END requiere casi la misma cantidad de tiempo, con 196,8, 199,3 y 203,2 horas para tres tareas de predicción de SST, respectivamente.
Los resultados para la siguiente predicción de TSM de 1, 3 y 7 días se presentan en la Tabla V. Es evidente que el método TraNM produce resultados insatisfactorios en comparación con los otros métodos. Es probable que esto se deba a componentes incorrectos en los datos de HYCOM, que afectan negativamente el rendimiento de la predicción de SST. El método Hybrid-NN también tiene un rendimiento deficiente, ya que sus valores RMSE promedio son los segundos más bajos entre los modelos. El modelo Hybrid-TL funciona mejor que ConvLSTM para la predicción de SST de 1 día siguiente, pero no para las otras dos tareas. Nuestro método logra los mejores valores RMSE y los valores R2 más altos. En comparación con el modelo ConvLSTM, los valores RMSE promedio de nuestro método mejoran efectivamente. Demuestra que la introducción del conocimiento físico
a partir de los datos observados puede restaurar los componentes incorrectos en los datos del modelo numérico, mejorando así la precisión de la predicción de SST.
La Fig. 10 presenta los resultados visualizados para la predicción de TSM del siguiente día, los datos de TSM observados y sus diferencias, respectivamente. Se puede ver que los resultados previstos son muy similares a los datos de TSM observados en toda la región del Mar de China Meridional. La Fig. 11 muestra los resultados visualizados para la predicción de TSM de los próximos tres días. Se observa que existen algunas diferencias significativas en los valores en el Golfo de Tonkín y en otras zonas marginales del Mar de China Meridional. La Fig. 12 ilustra los resultados visualizados para la predicción de TSM de los próximos siete días. Se encuentra que los valores de diferencia principales se concentran principalmente en el Golfo de Tonkín para la predicción de los próximos siete días, y son mayores que los resultados de las otras dos tareas.
E. Limitación y discusión
De la Fig. 7 a la Fig. 9, se puede observar que hay algunas imprecisiones en la SST de rango medio, que se visualizan en la Fig. 13. Los píxeles brillantes indican grandes errores de predicción de la SST, mientras que los píxeles oscuros denotan predicciones precisas de la SST. Como puede verse, estos puntos están ubicados principalmente en la parte noroeste del Estrecho de Taiwán, donde la temperatura de la superficie del mar prevista es más baja que los datos observados. El error de predicción se debe principalmente al modelo ConvLSTM y la máscara terrestre. En nuestras implementaciones, la máscara de terreno se aplica al área de estudio. El ConvLSTM explota las características espaciales y temporales de toda el área de estudio. Las características de la parte noroeste del Estrecho de Taiwán se ven afectadas hasta cierto punto por la máscara terrestre y, por lo tanto, dan lugar a errores de predicción. Si se pudieran obtener datos de entrenamiento de mayor resolución, se mejoraría aún más la precisión de las predicciones en esta región.
En las Fig. 11 y 12 se puede observar que no hay un aumento significativo de errores con el día principal. Esto puede deberse al hecho de que nuestro método utiliza una cantidad suficiente de datos de entrenamiento y las redes neuronales profundas pueden capturar de manera efectiva las características temporales. Además, la persistencia de la TSM también es un factor importante.
Este documento está disponible en arxiv bajo licencia CC 4.0.