paint-brush
用于海面温度预测的深度神经网络:提出的方法经过@oceanography
112 讀數

用于海面温度预测的深度神经网络:提出的方法

太長; 讀書

在本文中,研究人员通过将历史观测中的物理知识转移到数值模型来增强 SST 预测。
featured image - 用于海面温度预测的深度神经网络:提出的方法
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

作者:

(1)孟雨欣;

(2)高峰;

(3)埃里克·里加尔;

(4)董冉;

(5)董俊宇;

(6)千渡。

链接表

三、提出的方法

数值模型可以同时预测 SST 的空间分布及其全球遥相关。它在 SST 预测的短时间内表现良好。然而,我们认为从观测数据中迁移物理知识可以进一步提高数值模型对 SST 预测的性能。为此,我们采用 GAN 来学习观测数据中的物理知识。


Zhu[53] 提出了一种 GAN 反演方法,不仅可以如实地重建输入数据,而且可以确保反演后的潜在编码具有语义意义。他们证明了仅仅学习目标图像的像素值是不够的,学习到的特征无法在语义层面表示图像。受此工作的启发,我们在 GAN 中设计了一个编码器来从观测数据中学习物理知识,称为先验网络。这个先验网络不仅学习目标观测数据的像素值,还捕捉物理信息。它有效地提高了 SST 预测精度。


接下来,我们介绍所提出的方法:1)方法概述,2)先验网络,3)使用增强数据的 SST 预测。


A.方法概述


在本小节中,我们总结了所提出的 SST 预测方法,并详细描述了每个阶段的输入和输出。如图 2 所示,所提出的 SST 预测方法包括两个阶段:先前网络训练和使用增强数据的 SST 预测。


1)先验网络训练。此阶段包含三个步骤。第一步,使用观测到的 SST(GHRST 数据)进行 GAN 模型训练。第二步,使用预训练的生成器和 GHRSST 数据训练编码器。第三步,将预训练的生成器和编码器组合成先验网络。先验网络用于将观测数据的物理知识转移到数值模型。然后将数值模型 SST(HYCOM 数据)输入先验网络以增强其特征表示。


2)增强数据的SST预测。将物理增强数据输入ConvLSTM模型进行SST预测。分别预测第二天、接下来的3天和接下来的7天的SST。


需要注意的是,大多数现有研究 [26] [27] 仅使用观测数据进行 ConvLSTM 训练。相比之下,我们的方法利用物理增强数据进行 ConvLSTM 训练。接下来,我们详细描述了先前的网络训练和使用增强数据的 SST 预测。


B. 第一阶段:先前的网络训练


我们构建一个先验网络来学习观测数据中的物理知识,并在训练后保持其语义/物理信息不变。如图 2 所示,先验网络训练包括三个步骤:GAN 模型训练、编码器训练和物理增强数据生成。接下来我们将对每个步骤进行详细描述。


GAN 模型训练。GAN模型用于从观察到的 SST 中学习数据分布。目标函数如下:



GAN 模型的训练过程总结在算法 1 中。我们在观察到的 SST 上训练模型,直到生成器 G 从观察到的 SST 数据中捕获物理特征。



其中F(·)表示通过VGG网络进行特征提取。VGG网络是Visual Geometry Group[54]提出的网络,是一种经典的深度卷积神经网络。


编码器的训练如算法2所示,生成器G的参数固定,而编码器E和鉴别器D的参数分别基于公式2和公式3进行更新。


第 1 阶段的动机是构建一个先验网络,以纠正数值模型数据中的错误成分。为此,我们首先设计了一个 GAN 模型,该模型可以捕获观测到的 SST 的数据分布并生成高质量的 SST 数据。随后,训练编码器以确保生成的潜在代码保留观测到的 SST 中的语义/物理信息。我们认为,通过对抗学习,先验网络(由编码器和生成器组成)可以纠正输入数据中的错误部分,因为物理知识已经嵌入在先验网络中。因此,在第三步中,当数值模型数据被输入先验网络时,嵌入的物理知识可以纠正数值模型数据中的错误成分。




C. 第 2 阶段:使用增强数据进行 SST 预测


ConvLSTM 是一种预测时空数据的有效工具。它是一种循环神经网络,在输入到状态和状态到状态的转换中都包含卷积块。与传统的 LSTM 层不同,ConvLSTM 不仅保留了顺序关系,还从数据中提取了空间特征。通过这种方式,我们可以利用它来捕获稳健的时空特征。ConvLSTM 的目标函数如下:



物理增强的SST数据被输入到ConvLSTM模型中进行SST预测,如下所示:



生成器获得的权重在算法 2 中被重用,其中只有生成器权重是固定的。引入的编码器和鉴别器在观察到的 SST 上经历另一个训练过程。它们的权重分别基于等式 2 和等式 3 更新。训练后,编码器生成的代码将体现学习到的物理知识。


最后,利用上述预训练模型,得到基于物理知识的强化数据。



重复使用算法 2 中的生成器和编码器,并利用数值模型 SST 来生成物理增强数值模型数据。


在算法 3 中,利用物理知识增强的数据来训练时空 ConvLSTM 模型以进行 SST 预测。本文分别预测第二天、未来 3 天和未来 7 天的 SST。对于这部分,我们进行了消融研究以有效利用增强数据。