paint-brush
Rede Neural Profunda para Previsão da Temperatura da Superfície do Mar: Método Propostopor@oceanography
112 leituras

Rede Neural Profunda para Previsão da Temperatura da Superfície do Mar: Método Proposto

Muito longo; Para ler

Neste artigo, os pesquisadores aprimoram a previsão de TSM transferindo conhecimento físico de observações históricas para modelos numéricos.
featured image - Rede Neural Profunda para Previsão da Temperatura da Superfície do Mar: Método Proposto
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Autores:

(1) Yuxin Meng;

(2) Feng Gao;

(3) Eric Rigall;

(4) Ran Dong;

(5) Junyu Dong;

(6) Qian Du.

Tabela de links

III. MÉTODO PROPOSTO

O modelo numérico pode prever a distribuição espacial da TSM e suas teleconexões globais em conjunto. Ele tem um bom desempenho em pistas curtas para previsão de TSM. No entanto, argumentamos que a transferência do conhecimento físico dos dados observados pode melhorar ainda mais o desempenho do modelo numérico para previsão de TSM. Para tanto, adotamos GANs para aprender o conhecimento físico nos dados observados.


Zhu et al. [53] propuseram um método de inversão GAN que não apenas reconstrói fielmente os dados de entrada, mas também garante que o código latente invertido seja semanticamente significativo. Eles demonstraram que aprender apenas os valores dos pixels da imagem alvo é insuficiente e que os recursos aprendidos são incapazes de representar a imagem no nível semântico. Inspirados neste trabalho, projetamos um codificador em GAN para aprender conhecimento físico a partir dos dados observados, denominado rede anterior. Esta rede anterior não apenas aprende os valores de pixel dos dados observados do alvo, mas também captura as informações físicas. Melhora efetivamente a precisão da previsão de TSM.


A seguir, apresentamos o método proposto da seguinte forma: 1) Visão geral do método, 2) Rede anterior, 3) Predição de TSM com dados aprimorados.


A. Visão Geral do Método


Nesta subseção, resumimos o método de previsão de TSM proposto e descrevemos detalhadamente a entrada e a saída de cada estágio. Conforme ilustrado na Figura 2, o método de predição de TSM proposto consiste em dois estágios: treinamento prévio da rede e predição de TSM com dados aprimorados.


1) Treinamento prévio em rede. Esta etapa consiste em três etapas. Na primeira etapa, o SST observado (dados GHRST) é usado para treinamento do modelo GAN. Na segunda etapa, o gerador pré-treinado e os dados GHRSST são usados para treinar o codificador. Na terceira etapa, o gerador e o codificador pré-treinados são combinados na rede anterior. A rede anterior é usada para transferir o conhecimento físico dos dados observados para o modelo numérico. O modelo numérico SST (dados HYCOM) é então alimentado na rede anterior para aprimorar suas representações de recursos.


2) Previsão de TSM com dados aprimorados. Os dados aprimorados pela física são inseridos no modelo ConvLSTM para previsão de TSM. O SST do dia seguinte, dos próximos 3 dias e dos próximos 7 dias são previstos separadamente.


Deve-se notar que a maioria dos trabalhos existentes [26] [27] utiliza apenas os dados observados para treinamento ConvLSTM. Por outro lado, nosso método aproveita dados aprimorados pela física para treinamento ConvLSTM. A seguir, descrevemos em detalhes o treinamento anterior da rede e a previsão de TSM com dados aprimorados.


B. Etapa 1: Treinamento Prévio em Rede


Construímos uma rede prévia para aprender o conhecimento físico nos dados observados e manter sua informação semântica/física constante após o treinamento. Conforme ilustrado na Figura 2, o treinamento anterior da rede é composto por três etapas: treinamento do modelo GAN, treinamento do codificador e geração de dados com aprimoramento físico. A seguir, fornecemos descrições detalhadas de cada etapa.


Treinamento do modelo GAN. O modelo GAN é usado para aprender a distribuição de dados do SST observado. A função objetivo é a seguinte:



O processo de treinamento do modelo GAN está resumido no Algoritmo 1. Treinamos o modelo sobre a TSM observada até que o gerador G capture as características físicas dos dados de TSM observados.



onde F(·) representa a extração de características através da rede VGG. A rede VGG significa a rede proposta pelo Visual Geometry Group [54] e é uma rede neural convolucional profunda clássica.


O treinamento do codificador é descrito no Algoritmo 2. Os parâmetros do gerador G são fixos, enquanto os parâmetros do codificador E e do discriminador D são atualizados com base na Eq. 2 e Eq. 3, respectivamente.


A motivação do Estágio 1 é construir uma rede anterior que possa retificar os componentes incorretos nos dados do modelo numérico. Para tanto, primeiramente desenvolvemos um modelo GAN que captura a distribuição de dados da TSM observada e pode gerar dados de TSM de alta qualidade. Posteriormente, o codificador é treinado para garantir que os códigos latentes gerados preservem a informação semântica/física no SST observado. Argumentamos que através da aprendizagem contraditória, a rede anterior (composta pelo codificador e gerador) pode retificar as partes incorretas nos dados de entrada, uma vez que o conhecimento físico foi incorporado na rede anterior. Consequentemente, na terceira etapa, quando os dados do modelo numérico são alimentados na rede anterior, o conhecimento físico incorporado pode corrigir os componentes incorretos nos dados do modelo numérico.




C. Estágio 2: Previsão de TSM com dados aprimorados


ConvLSTM é uma ferramenta eficaz para prever dados espaço-temporais. É uma rede neural recorrente que incorpora blocos convolucionais nas transições entrada-estado e estado-estado. Ao contrário da camada LSTM tradicional, o ConvLSTM não apenas preserva o relacionamento sequencial, mas também extrai características espaciais dos dados. Desta forma, podemos aproveitá-lo para capturar características espaço-temporais robustas. A função objetivo do ConvLSTM é formulada da seguinte forma:



Os dados de SST aprimorados pela física são inseridos no modelo ConvLSTM para previsão de SST da seguinte forma:



Os pesos obtidos pelo gerador são reaproveitados no Algoritmo 2, onde apenas os pesos do gerador são fixos. O codificador introduzido e o discriminador passam por outro processo de treinamento sobre a TSM observada. Seus pesos são atualizados com base na Eq. 2 e Eq. 3, respectivamente. Após o treinamento, o código gerado pelo codificador incorporaria o conhecimento físico aprendido.


Por fim, adquirimos os dados reforçados com base no conhecimento físico utilizando o modelo pré-treinado acima. Os pesos de



o gerador e o codificador do Algoritmo 2 são reutilizados e o modelo numérico SST é explorado para produzir dados do modelo numérico reforçados pela física.


No Algoritmo 3, os dados aprimorados pelo conhecimento físico são aproveitados para treinar um modelo ConvLSTM espaço-temporal para previsão de TSM. Neste artigo, a TSM do dia seguinte, dos próximos 3 dias e dos próximos 7 dias são previstas separadamente. Para esta parte, conduzimos um estudo de ablação para utilizar os dados reforçados de forma eficaz.


Este artigo está disponível no arxiv sob licença CC 4.0.