paint-brush
Rede Neural Profunda para Previsão da Temperatura da Superfície do Mar: Resultados Experimentais e Análisepor@oceanography
183 leituras

Rede Neural Profunda para Previsão da Temperatura da Superfície do Mar: Resultados Experimentais e Análise

Muito longo; Para ler

Neste artigo, os pesquisadores aprimoram a previsão de TSM transferindo conhecimento físico de observações históricas para modelos numéricos.
featured image - Rede Neural Profunda para Previsão da Temperatura da Superfície do Mar: Resultados Experimentais e Análise
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Autores:

(1) Yuxin Meng;

(2) Feng Gao;

(3) Eric Rigall;

(4) Ran Dong;

(5) Junyu Dong;

(6) Qian Du.

Tabela de links

4. RESULTADOS EXPERIMENTAIS E ANÁLISE

A. Área de estudo e configurações do experimento


O Mar da China Meridional está localizado no Oceano Pacífico Ocidental, no sul da China continental. Sua área é de cerca de 3,5 milhões de quilômetros quadrados com profundidade média de 1.212 metros. Neste artigo, a área de estudo selecionada é (3,99°N∼24,78°N, 98,4°E∼124,4°E).


Usamos os dados de sensoriamento remoto de satélite de alta resolução do GHRSST (Grupo de Temperatura da Superfície do Mar de Alta Resolução) [55] como dados observados. O GHRSST fornece uma variedade de dados de temperatura da superfície do mar, incluindo coordenadas de faixa de satélite, dados em grade e produtos em grade sem lacunas. Aqui, empregamos produtos de grade sem lacunas, que são gerados pela combinação de observações complementares de satélite e in situ dentro de uma estrutura de interpolação ideal. O HYCOM [56] é selecionado como modelo numérico. Suas resoluções espaciais são 1/20°×1/20° e 1/12°×1/12°, respectivamente. A resolução temporal é de um dia. Os dados de maio de 2007 a dezembro de 2013 são utilizados para treinamento, enquanto os demais dados de janeiro de 2014 a dezembro de 2014 são utilizados para testes. Deve-se observar que usamos dados sem nuvem fornecidos pelo GHRSST. Os dados foram capturados por instrumentos de micro-ondas que podem penetrar nas nuvens. Portanto, os dados têm cobertura total da área de estudo. Além disso, o tempo exato de cada pixel no produto GHRSST SST é o mesmo.


A padronização do escore Z foi utilizada para pré-processamento como:



onde x denota o SST do modelo GHRSST e HYCOM, z denota os dados normalizados, µ e σ denotam o valor médio e o desvio padrão, respectivamente. Convertemos os dados em mapas de calor quadrados de 256 × 256.


Mais especificamente, os dados GHRSST e o vetor aleatório de 512 dimensões são utilizados na primeira etapa do treinamento prévio da rede. O tamanho dos dados GHRSST de entrada é N × H × W, onde N representa o tamanho do lote, H indica a altura dos dados de entrada e W denota a largura dos dados de entrada. Para o segundo estágio da rede anterior, empregamos apenas dados GHRSST para treinamento do codificador. Os tamanhos de entradas e saídas para ambos os estágios são N × H × W. Da mesma forma, na terceira etapa do treinamento anterior da rede, os dados HYCOM SST são alimentados no modelo pré-treinado. Aqui, os tamanhos das entradas e das saídas são N × H × W. Em nossas implementações, definimos N como 2.430, enquanto H e W são ambos definidos como 256.


Figura 3. Ilustração de três modelos utilizados no estudo da ablação. (a) Esquema A: Os dados SST do modelo numérico são primeiro alimentados no ConvLSTM e, em seguida, a saída é alimentada na rede anterior bem treinada. A sequência da rede anterior e do ConvLSTM é substituída. (b) Esquema B: A rede anterior não foi bem treinada. Especificamente, o treinamento do modelo GAN na rede anterior foi omitido. (c) O método proposto.


Conduzimos extensos experimentos em uma NVIDIA GeForce 2080Ti com 8 GPUs. A rede anterior usa a mesma estrutura e configuração de rede mencionada em [53] para adquirir o conhecimento físico a partir dos dados históricos observados. Em seguida, o conhecimento físico obtido é transferido para os dados do modelo numérico com o objetivo de restaurar e melhorar os componentes incorretos do modelo numérico. A configuração do modelo ConvLSTM usado neste artigo é a mesma do modelo ConvLSTM no trabalho de Shi [20]. O conjunto de dados GHRSST SST é utilizado como referência para comparação e avaliação neste artigo.


B. Influências do número do dia anterior para previsão de TSM


Conforme mencionado na Seção III. C, t denota o número de dias anteriores usados para previsão. É um parâmetro crítico que pode afetar o desempenho da previsão de TSM. Neste artigo, tentamos prever a próxima TSM de um dia, três dias e sete dias. Implementamos extensos experimentos para encontrar o


TABELA IRESULTADOS EXPERIMENTAIS DE DIFERENTES NÚMEROS DE DIAS ÚLTIMOS PARA A PREVISÃO DE TSM DO PRÓXIMO DIA


TABELA IIRESULTADOS EXPERIMENTAIS DE DIFERENTES NÚMEROS DE DIAS ÚLTIMOS PARA A PREVISÃO DE TSM DOS PRÓXIMOS TRÊS DIAS


TABELA IIIRESULTADOS EXPERIMENTAIS DE DIFERENTES NÚMEROS DE DIAS ÚLTIMOS PARA A PREVISÃO DE TSM DOS PRÓXIMOS SETE DIAS


número adequado de dias anteriores para a previsão futura de TSM. A raiz do erro quadrático médio (RMSE) e o coeficiente de determinação (R2) são aplicados como critérios de avaliação. Valores mais baixos de RMSE e valores mais altos de R2 indicam resultados mais precisos.


A Tabela I lista os resultados da previsão para o dia seguinte usando os dados dos últimos um dia, três dias e cinco dias, separadamente. Pode-se observar que o modelo proposto apresenta melhor desempenho ao utilizar dados dos últimos cinco dias, onde os resultados do RMSE e do R2 são 0,3618 e 0,9967 respectivamente. Eles são ligeiramente melhores que os outros esquemas. Em comparação com os outros dois esquemas, os valores de RMSE e R2 melhoram em 0,0086, 0,001 e 0,0028, 0,0006. Portanto, os dados dos últimos cinco dias são adotados para a previsão de TSM do próximo dia.


Analisamos as influências de t para a previsão de TSM dos próximos três dias na Tabela II. Pode-se observar que quanto mais longos os dados históricos foram utilizados, melhor foi o desempenho da previsão. O valor RMSE utilizando dados dos últimos sete dias atinge o melhor desempenho. É melhorado em 0,0025 em comparação com os dados dos últimos cinco dias. Enquanto isso, o R2 tem o melhor desempenho usando os dados dos últimos sete dias em comparação com os outros dois esquemas. Portanto, os dados dos últimos sete dias foram usados para a previsão de TSM dos próximos três dias.


Os resultados experimentais da previsão de TSM para os próximos sete dias são ilustrados na Tabela III. Como pode ser visto, os resultados da previsão usando os dados dos últimos dez dias alcançam o melhor desempenho. Portanto, exploramos os dados dos últimos dez dias para a previsão de TSM dos próximos sete dias.


TABELA IVRESULTADOS EXPERIMENTAIS (MÉDIA±STD) DE ESTUDOS DE ABLAÇÃO COM MÉDIA MAIS DE 10 EXECUÇÕES ALEATÓRIAS


C. Estudo de Ablação


Para verificar a eficácia da rede anterior e do treinamento GAN, realizamos experimentos de ablação. Conforme ilustrado na Fig. 3, duas variantes são projetadas para comparação como segue:


• Esquema A. A sequência da rede anterior e do ConvLSTM é substituída. Os dados SST do modelo numérico são primeiro alimentados no ConvLSTM e, em seguida, a saída é alimentada na rede anterior bem treinada.


• Esquema B. A rede anterior não foi bem treinada. Especificamente, o treinamento do modelo GAN (a primeira etapa na Fig. 2) no treinamento anterior da rede foi omitido.


Os resultados experimentais são apresentados na Tabela IV. Como pode ser visto que nosso método atinge os melhores valores de RMSE e R2. Especificamente, o método proposto supera o Esquema A, que demonstra que a sequência correta da rede anterior e do ConvLSTM pode aumentar o desempenho da previsão de TSM. É evidente que a rede anterior restaura efetivamente os componentes incorretos dos dados do modelo numérico e os dados restaurados têm melhor desempenho na previsão de TSM. Além disso, o método proposto apresenta desempenho superior ao Esquema B, o que demonstra que a modelagem GAN é uma etapa essencial. A modelagem GAN pode aprender a distribuição de dados do SST observado e ajuda a rede anterior a capturar melhores informações físicas do SST observado. Resumindo, no método proposto, utilizamos aprendizagem adversária para pré-treinamento prévio da rede, o que pode efetivamente transferir o conhecimento físico dos dados de TSM observados para a rede anterior. Ele pode orientar a convergência rápida do treinamento e melhorar o desempenho da previsão de TSM.


D. Resultados Experimentais e Discussão


A Figura 4 compara a TSM prevista para o próximo dia com os dados reais observados. Podemos ver que os resultados previstos do nosso método combinam bem com os dados observados. Da mesma forma, os dados observados e a TSM prevista correspondente para os próximos três dias e sete dias são exibidos na Figura 5 e na Figura 6, respectivamente. Os resultados visualizados indicam que o método proposto pode gerar resultados robustos e confiáveis para previsão de TSM.


Um gráfico de dispersão na previsão de TSM para o próximo dia é ilustrado na Fig. 7. Pode-se observar que os pontos de dados são


Figura 4. Resultados da previsão de TSM do próximo dia versus os dados reais observados.


5. Resultados da previsão de TSM para os próximos três dias versus os dados reais observados.


6. Resultados da previsão de TSM para os próximos sete dias versus os dados reais observados.


Figura 7. Gráfico de dispersão comparando a previsão de TSM do próximo dia com os dados observados correspondentes


Figura 8. Gráfico de dispersão comparando a previsão de TSM dos próximos três dias com os dados observados correspondentes


distribuído aproximadamente uniformemente perto da linha vermelha. A Figura 8 e a Figura 9 são gráficos de dispersão dos resultados da previsão para os próximos três dias e os próximos sete dias, respectivamente. Os gráficos de dispersão demonstram a eficácia do método proposto para previsão de TSM.


Para verificar a eficácia do método proposto, comparamos o método proposto com sete métodos intimamente relacionados: ConvLSTM [20], Hybrid-NN [14], Hybrid-TL [15], Gen-END [57], VAE- GAN [58], Tra-NM e Tra-ASL. A área de estudo é (3,99°N∼24,78°N, 98,4°E∼ 124,4°E) para estes métodos. Todos esses métodos usaram os dados de treinamento dos últimos 5 dias para a previsão do próximo dia, os dados dos últimos 7 dias para a previsão dos próximos 3 dias e os dados dos últimos 10 dias para os próximos 7 dias. predição.


ConvLSTM é discutido na Seção III. C, e é um modelo espaço-temporal eficaz para previsão de TSM. HybridNN utiliza a discrepância entre os dados observados e os dados do modelo numérico para orientar o treinamento de redes neurais profundas. Hybrid-TL combina as vantagens de modelos numéricos e redes neurais por meio de aprendizagem por transferência. GenEND é um codificador generativo que pode ser usado para previsão de TSM. VAE-GAN integra autoencoder variacional e


Figura 9. Gráfico de dispersão comparando a previsão de TSM dos próximos sete dias com os dados observados correspondentes


GAN e pode capturar recursos semânticos de alto nível para previsão de SST. Os dados HYCOM SST são usados para treinar o modelo ConvLSTM para a próxima previsão de 1 dia, 3 dias e 7 dias (denominada Tra-NM). Tra-ASL é um método de assimilação tradicional e explora as correlações entre vários tipos de dados (dados observados e dados de modelos numéricos).


Os dados GHRSST são utilizados primeiro para treinar um modelo ConvLSTM, que serve como linha de base. É uma abordagem baseada em dados amplamente utilizada para previsão de TSM. Hybrid-NN, HybridTL, Gen-END e VAE-GAN empregam os dados GHRSST e HYCOM para treinamento. Os dados de assimilação HYCOM [56]


TABELA DE RESULTADOS DE PREDIÇÃO VSST DE DIFERENTES MÉTODOS


Figura 10. Resultados visualizados para a previsão de TSM do próximo dia.


11. Resultados visualizados para a previsão de TSM dos próximos três dias. A primeira coluna mostra os resultados da TSM prevista. Os dados reais observados de SST são mostrados na segunda coluna. Apresentamos sua diferença na terceira coluna.


são usados aqui, com uma resolução espacial de 1/12°×1/12°. Nosso método melhora e retifica os componentes incorretos nos dados do modelo numérico, introduzindo conhecimento físico a partir dos dados históricos observados. Os dados do modelo numérico corrigido são chamados de dados aprimorados pela física. Para comparar com os dados aprimorados pela física, os dados de assimilação HYCOM (Tra-ASL) e os dados HYCOM (Tra-NM) são usados de forma semelhante para treinar o modelo ConvLSTM.


Os tempos de treinamento de ConvLSTM, Hybrid-NN, Tra-NM e Tra-ASL para as próximas previsões de 1 dia, 3 dias e 7 dias são de 1,8, 4,4 e 8,2 horas, respectivamente. O método Hybrid-TL treinou o modelo ConvLSTM duas vezes e a duração do treinamento foi de 3,6, 8,8 e 16,4 horas para as três tarefas, respectivamente. O VAE-GAN requer 181,6, 184,2 e 188,4 horas para treinamento, enquanto o método Gen-END requer quase a mesma quantidade de tempo, com 196,8, 199,3 e 203,2 horas para três tarefas de previsão de TSM, respectivamente.


Os resultados para a previsão de TSM para os próximos 1 dia, 3 dias e 7 dias são apresentados na Tabela V. É evidente que o método TraNM produz resultados insatisfatórios em comparação com os outros métodos. Isto provavelmente se deve aos componentes incorretos nos dados HYCOM, que afetam negativamente o desempenho da previsão de TSM. O método Hybrid-NN também tem um desempenho fraco, pois seus valores médios de RMSE são os segundos mais baixos entre os modelos. O modelo Hybrid-TL tem desempenho melhor que o ConvLSTM para a previsão de TSM do próximo dia, mas não para as outras duas tarefas. Nosso método atinge os melhores valores de RMSE e os maiores valores de R2. Em comparação com o modelo ConvLSTM, os valores médios de RMSE do nosso método são efetivamente melhorados. Demonstra que a introdução do conhecimento físico


12. Resultados visualizados para a previsão de TSM dos próximos sete dias. A primeira linha mostra os resultados da SST prevista. Os dados reais observados de TSM são mostrados na segunda linha. Apresentamos sua diferença na terceira linha.


dos dados observados pode restaurar os componentes incorretos nos dados do modelo numérico, melhorando assim a precisão da previsão de TSM.


A Figura 10 apresenta os resultados visualizados para a previsão de TSM do próximo dia, os dados de TSM observados e suas diferenças, respectivamente. Pode-se observar que os resultados previstos são altamente semelhantes aos dados de TSM observados em toda a região do Mar da China Meridional. A Figura 11 exibe os resultados visualizados para a previsão de TSM dos próximos três dias. Observa-se que existem algumas diferenças significativas de valores no Golfo de Tonkin e em outras áreas marginais do Mar da China Meridional. A Figura 12 ilustra os resultados visualizados para a previsão de TSM dos próximos sete dias. Verifica-se que os principais valores de diferença concentram-se principalmente no Golfo de Tonkin para a previsão dos próximos sete dias e são maiores do que os resultados das outras duas tarefas.


E. Limitação e Discussão


Da Figura 7 à Figura 9, pode-se observar que existem algumas imprecisões na TSM de médio alcance, que são visualizadas na Figura 13. Pixels brilhantes indicam grandes erros de previsão de TSM, enquanto pixels escuros denotam previsões precisas de TSM. Como pode ser visto, estes pontos estão localizados principalmente na parte noroeste do Estreito de Taiwan, onde a temperatura prevista da superfície do mar é inferior aos dados observados. O erro de previsão é causado principalmente pelo modelo ConvLSTM e pela máscara de terreno. Nas nossas implementações, a máscara de terreno é aplicada à área de estudo. O ConvLSTM explora as características espaciais e temporais de toda a área de estudo. As características da parte noroeste do Estreito de Taiwan são afetadas até certo ponto pela máscara de terra e, portanto, resultam em erros de previsão. Se dados de treinamento de maior resolução pudessem ser obtidos, a precisão das previsões nesta região seria melhorada ainda mais.


Figura 13. Visualização do erro de predição de TSM.


Nas Figuras 11 e 12 pode-se observar que não há aumento significativo de erros com o lead day. Isso pode ser devido ao fato de nosso método usar uma quantidade suficiente de dados de treinamento e as redes neurais profundas serem capazes de capturar efetivamente as características temporais. Além disso, a persistência do TSM também é um fator importante.


Este artigo está disponível no arxiv sob licença CC 4.0.