作者:
(1)孟雨欣;
(2)高峰;
(3)埃里克·里加尔;
(4)董冉;
(5)董俊宇;
(6)千渡。
A.生成对抗网络
2014 年,Goodfellow 等人 [16] 提出了一种以对抗方式训练的生成模型新框架。在他们的方法中,同时训练生成模型 G 和判别模型 D。模型 G 通过模型 D 间接捕获输入数据的分布并生成相似的数据。而模型 D 则估计其输入样本来自训练数据而非模型 G 的概率。G 的训练过程由 D 的概率误差驱动。在这个对抗过程中,G 和 D 引导学习并逐渐增强彼此的能力,以实现优异的性能。
GAN 已经在物理相关的任务中得到应用。例如,Yang 等 [17] 应用基于物理的 GAN 处理高维问题并求解随机微分方程,Lutjens ¨ 等 [18] 利用 GAN 学习数值模型数据中的特征生成更真实的沿海洪水数据,Zheng 等 [19] 利用 GAN 学习到的潜在物理规律推断未知的空间数据。然而,这些工作都是用 GAN 代替整个数值模型来执行他们的模型,这与我们的工作有很大不同。在本文中,我们采用 GAN 模型将物理知识从观测数据转移到数值模型数据中,以纠正和改进数值模型中的物理特征。此外,现有方法仅学习确定性模型,而不考虑编码器生成的代码是否与 GAN 学习到的语义知识相符。
B.卷积长短期记忆
2015 年,ConvLSTM [20] 被提出用于解决降水预报问题。ConvLSTM 的网络结构能够像经典卷积神经网络 (CNN) [21] 一样捕捉局部空间特征,同时构建从长短期记忆 (LSTM) 块继承的序列关系。此外,作者进行了实验,表明 ConvLSTM 在时空关系上的表现优于 LSTM。除了天气预报任务外,ConvLSTM 还可以应用于各种时空序列预测问题,例如动作识别 [22]、[23]。
C. 海面温度预测
Lins 等 [24] 使用 SVM 研究了热带大西洋的 SST。Patil 等 [25] 采用人工神经网络预测海面温度,但仅在预测时间在 1 至 5 天的情况下表现良好,随后准确率下降。Zhang 等 [26] 将 LSTM 应用于
预测海表温度。Yang等[27]通过构建全连接长短期记忆模型预测海表温度。从另一个角度看,Patil等[28]利用小波神经网络预测逐日海表温度,而Quala等[29]提出了斑块级神经网络方法进行海表温度预测。然而,这些方法仅仅依赖于数据,而忽略了背后的物理知识。Ham等[15]采用迁移学习对ENSO进行预测和分类。本文进行了对比实验,结果表明我们的方法在减小短期误差的同时,也降低了长期偏差。
D.数据增强
Shorten 等人 [30] 回顾了深度学习中图像数据增强的最新技术。数据增强的目的是增强神经网络的表示能力,更好地学习原始数据的分布。近年来,两种数据增强技术被广泛使用:数据变换和重采样。数据变换方法包括几何变换 [31]、颜色空间变换 [32]–[34]、随机擦除 [35]–[37]、对抗训练 [38]–[41] 和风格迁移 [42]–[45]。重采样技术特别强调新的实例组合,例如图像混合 [46]–[48]、特征空间增强 [49]、[50] 和生成对抗网络 (GAN) [16]。几何变换可以获得良好的性能,例如图像翻转、裁剪、旋转、平移和噪声注入 [51]。[30] 中的实验结果表明随机裁剪技术表现良好。颜色空间变换内存消耗大、计算时间长。随机擦除技术可以通过使用遮挡掩模来提高网络在遮挡情况下的鲁棒性。虽然对抗训练也可以提高鲁棒性,但有限数量的自然对抗样本在实践中极大地限制了网络的性能。神经风格迁移方法仅对特定任务有效,实际应用有限。特征空间增强实现了在特征空间中插值表示的能力。基于 GAN 的增强技术已被用于实现当前最先进的网络性能 [52]。然而,目前还没有一种有效的数据增强方法能够利用数值模型和深度学习的优点。本文旨在提出一种基于物理知识的新型数据增强技术。所提出的技术比基于 GAN 的增强取得了更好的性能。