paint-brush
Rede Neural Profunda para Previsão da Temperatura da Superfície do Mar: Resumo e Introduçãopor@oceanography
169 leituras

Rede Neural Profunda para Previsão da Temperatura da Superfície do Mar: Resumo e Introdução

Muito longo; Para ler

Neste artigo, os pesquisadores aprimoram a previsão de TSM transferindo conhecimento físico de observações históricas para modelos numéricos.
featured image - Rede Neural Profunda para Previsão da Temperatura da Superfície do Mar: Resumo e Introdução
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Autores:

(1) Yuxin Meng;

(2) Feng Gao;

(3) Eric Rigall;

(4) Ran Dong;

(5) Junyu Dong;

(6) Qian Du.

Tabela de Links

Abstrato

Tradicionalmente, modelos numéricos têm sido utilizados em estudos oceanográficos para simular a dinâmica dos oceanos, representando equações físicas. No entanto, muitos factores relativos à dinâmica dos oceanos parecem estar mal definidos. Argumentamos que a transferência de conhecimento físico a partir de dados observados poderia melhorar ainda mais a precisão dos modelos numéricos na previsão da Temperatura da Superfície do Mar (TSM). Recentemente, os avanços nas tecnologias de observação da Terra produziram um crescimento monumental de dados. Consequentemente, é imperativo explorar formas de melhorar e complementar os modelos numéricos utilizando as quantidades cada vez maiores de dados observacionais históricos. Para tanto, apresentamos um método de previsão de TSM que transfere conhecimento físico de observações históricas para modelos numéricos. Especificamente, usamos uma combinação de um codificador e uma rede adversária generativa (GAN) para capturar conhecimento físico dos dados observados. Os dados do modelo numérico são então inseridos no modelo pré-treinado para gerar dados aprimorados pela física, que podem então ser usados para previsão de TSM. Os resultados experimentais demonstram que o método proposto melhora consideravelmente o desempenho da previsão de TSM quando comparado com várias linhas de base do estado da arte.


Termos de Indexação —Temperatura da superfície do mar, conhecimento físico, rede adversária generativa, modelo numérico

I. INTRODUÇÃO

Os modelos NUMÉRICOS têm sido um método de computação matemática tradicional para previsão da dinâmica dos oceanos. De acordo com as estatísticas do Programa Mundial de Investigação Climática (WCRP), a comunidade científica desenvolveu mais de 40 modelos numéricos oceânicos, cada um com as suas próprias vantagens e características. Por exemplo, o sistema de modelo oceânico regional (ROMS) [1] tem um poderoso módulo ecológico adjacente, o modelo rápido de atmosfera oceânica (FOAM) [2] é altamente eficaz em estudos globais acoplados oceano-atmosfera, o modelo oceânico costeiro de volume finito (FVCOM) [3] é capaz de ajustar com precisão os limites da costa e a topografia submarina. O modelo oceânico de coordenadas híbridas (HYCOM) [4] pode implementar três variedades de coordenadas auto-adaptativas. Esses modelos numéricos não são intercambiáveis e seu uso depende da aplicação específica. Deve-se notar que os diversos processos da dinâmica oceânica descritos em modelos numéricos são baseados em equações simplificadas e


Figura 1. Comparação conceitual do modelo numérico e do método proposto para previsão da temperatura da superfície do mar (TSM). (a) Modelo numérico. (b) Método proposto para previsão de TSM. A rede adversária generativa é usada para transferir o conhecimento físico dos dados históricos observados para o modelo numérico e, portanto, melhora o desempenho da previsão de TSM.


parâmetros devido à nossa compreensão limitada do oceano. Os movimentos e mudanças no oceano real são tão diversos e complexos que identificar as fontes de um determinado fenómeno torna-se um verdadeiro desafio. Portanto, a busca por novas relações ou conhecimentos a partir de dados históricos é de fundamental importância para melhorar o desempenho de modelos numéricos no estudo da dinâmica oceânica. Neste artigo, nos referimos à capacidade que pode melhorar o modelo numérico como conhecimento físico. Assumimos que os dados históricos podem possuir conhecimento físico até então desconhecido.


O deep learning tem a notável capacidade de aprender funções altamente complexas, transformando os dados originais em um nível de abstração muito mais elevado. Em [5], Lecun et al. descreveu os princípios fundamentais e os principais benefícios do aprendizado profundo. Recentemente, o aprendizado profundo foi aplicado a uma variedade de tarefas, como monitoramento da biodiversidade marinha [6], [7], identificação de alvos em imagens de sonar [8], [9] e previsão da concentração de gelo marinho [10]. Por exemplo, Bermant et al. [6] empregaram redes neurais convolucionais (CNNs) para classificar espectrogramas gerados a partir de dados acústicos de cachalotes. Allken et al. [7] desenvolveram um modelo CNN para classificação de espécies de peixes, aproveitando dados sintéticos para aumentar os dados de treinamento. Lima et al. [8] propuseram um método de aprendizagem por transferência profunda para reconhecimento automático de frentes oceânicas, extraindo conhecimento de modelos CNN profundos treinados em dados históricos. Xu et al. [9] apresentaram uma abordagem combinando redes de geração profunda e aprendizagem por transferência para detecção de naufrágios por sonar. Ren et al. [10] propuseram uma estrutura codificador-decodificador com redes totalmente convolucionais que podem prever a concentração de gelo marinho com uma semana de antecedência com alta precisão. Através da aplicação de métodos baseados em aprendizagem profunda à investigação oceânica, foram alcançadas melhorias significativas em termos de classificação e desempenho de previsão.


Devido ao conhecimento físico incompleto em modelos numéricos e ao fraco desempenho de generalização das redes neurais, existem alguns esforços para melhorar o desempenho da previsão combinando as vantagens do modelo numérico e das redes neurais. Na ciência geográfica, isso pode ser alcançado de três maneiras diferentes [11]: 1) Aprendendo os parâmetros do modelo numérico através de redes neurais. As redes neurais podem descrever de maneira ideal a cena observada a partir do modelo detalhado de alta resolução, mas muitos parâmetros são difíceis de deduzir, tornando sua estimativa um desafio. Brenowitz et al. [12] treinaram uma rede neural profunda baseada na parametrização física unificada e explicaram a influência da radiação e da convecção cumulus. 2) Substituição do modelo numérico por uma rede neural. Desta forma, a arquitetura da rede neural profunda pode capturar a consistência física especificada. Pannekoucke et al. [13] traduziram equações físicas em arquiteturas de redes neurais usando uma ferramenta plug-and-play. 3) Analisar a incompatibilidade de saída entre o modelo numérico e os dados de observação. As redes neurais podem ser usadas para identificar, visualizar e compreender os padrões de imprecisões do modelo e corrigir dinamicamente o desvio do modelo. Patil et al. [14] aplicaram a discrepância entre os resultados do modelo numérico e os dados observacionais para treinar uma rede neural para prever a temperatura da superfície do mar (TSM). Ham et al. [15] treinaram uma rede neural convolucional baseada em aprendizagem por transferência. Eles primeiro treinam seu modelo nos dados do modelo numérico e, em seguida, usam os dados de reanálise para calibrar o modelo. No entanto, descobriu-se que a terceira abordagem sofre de um problema de viés de longo prazo, em que o desempenho da previsão se deteriora à medida que os dias de previsão aumentam.


Para resolver as questões acima, neste estudo, utilizamos as redes adversárias generativas (GANs) para transferir o conhecimento físico dos dados históricos observados para os dados do modelo numérico, conforme ilustrado na Fig. O método pode corrigir a parte física nos dados do modelo numérico para melhorar o desempenho da previsão. Para ser mais específico, conforme ilustrado na Fig. 2, primeiro adquirimos o recurso físico dos dados observados usando um modelo de rede anterior composto por um codificador e GAN. Posteriormente, obtivemos o SST aprimorado pela física, alimentando os dados do modelo numérico no modelo pré-treinado. Depois disso, o SST aprimorado pela física foi adotado para treinar um modelo espaço-temporal para prever o TSM. Enquanto isso, realizamos experimentos de ablação para aproveitar ao máximo os novos dados gerados.


As principais contribuições deste artigo são três:


• Até onde sabemos, somos os primeiros a transferir conhecimento físico dos dados históricos observados para os dados do modelo numérico usando GANs para previsão de TSM.


• A diferença entre os dados melhorados baseados no conhecimento físico e os resultados previstos foi explorada para ajustar o peso do modelo durante o treinamento.


• Os resultados experimentais indicam que o método proposto pode cobrir a escassez de conhecimento físico no modelo numérico e melhorar a precisão da previsão.


O resto do artigo está organizado da seguinte forma. A Seção II apresenta a revisão da literatura relacionada ao nosso método, enquanto o desenho do nosso método é detalhado na Seção III. Em seguida, os resultados experimentais são mostrados na Seção IV. A Seção V finalmente conclui este artigo.


Este artigo está disponível no arxiv sob licença CC 4.0.