222 讀數

深度神经网络海面温度预测：实验结果与分析

经过 Oceanography: Everything You Need to Study the Ocean10m2024/05/29

太長; 讀書

在本文中，研究人员通过将历史观测中的物理知识转移到数值模型来增强 SST 预测。

作者：

（1）孟雨欣；

（2）高峰；

（3）埃里克·里加尔；

（4）董冉；

（5）董俊宇；

（6）千渡。

链接表

四、实验结果与分析

A. 研究区域和实验设置

南海位于西太平洋，中国大陆南部，面积约350万平方公里，平均深度1212米。本文选取的研究区域为（3.99°N∼24.78°N，98.4°E∼124.4°E）。

我们使用 GHRSST（高分辨率海面温度组织）[55] 的高分辨率卫星遥感数据作为观测数据。GHRSST 提供各种海面温度数据，包括卫星扫描带坐标、网格数据和无间隙网格产品。在此，我们采用了无间隙网格产品，该产品是在最佳插值框架内结合互补卫星和现场观测而生成的。选择 HYCOM [56] 作为数值模型。它们的空间分辨率分别为 1/20°×1/20° 和 1/12°×1/12°。时间分辨率为一天。2007 年 5 月至 2013 年 12 月的数据用于训练，而 2014 年 1 月至 2014 年 12 月的其余数据用于测试。值得注意的是，我们使用 GHRSST 提供的无云数据。数据是由可以穿透云层的微波仪器捕获的。因此，数据完全覆盖了研究区域。此外，GHRSST SST产品中每个像素的精确时间是相同的。

使用 Z 分数标准化进行预处理，如下所示：

其中，x 表示 GHRSST 和 HYCOM 模型 SST，z 表示归一化数据，µ 和 σ 分别表示平均值和标准差。我们将数据转换为 256 × 256 的方形热力图。

更具体地说，在先前网络训练的第一步中使用 GHRSST 数据和 512 维随机向量。输入 GHRSST 数据的大小为 N × H × W，其中 N 表示批次大小，H 表示输入数据的高度，W 表示输入数据的宽度。对于先前网络的第二阶段，我们仅使用 GHRSST 数据进行编码器训练。两个阶段的输入和输出的大小均为 N × H × W。类似地，在先前网络训练的第三步中，HYCOM SST 数据被输入到预训练模型中。这里，输入和输出的大小都是 N × H × W。在我们的实现中，我们将 N 设置为 2430，而 H 和 W 都设置为 256。

我们在配备 8 个 GPU 的 NVIDIA GeForce 2080Ti 上进行了大量的实验。先前的网络使用与 [53] 中提到的相同的网络结构和配置，从历史观测数据中获取物理知识。然后将获得的物理知识转移到数值模型数据中，以便恢复和改进数值模型中的错误组件。本文使用的 ConvLSTM 模型的配置与 Shi 的工作 [20] 中的 ConvLSTM 模型相同。本文以 GHRSST SST 数据集作为比较和评估的基准。

B. 过去日数对海表温度预测的影响

如第三节 C 所述，t 表示用于预测的过去天数。它是影响 SST 预测性能的关键参数。在本文中，我们尝试预测未来一天、三天和七天的 SST。我们进行了广泛的实验，以找到

为未来 SST 预测选择合适的过去天数。采用均方根误差 (RMSE) 和判定系数 (R2) 作为评估标准。RMSE 值越低，R2 值越高，结果越准确。

表一列出了分别使用过去一天、三天和五天的数据对第二天的预测结果。可以看出，所提出的模型在使用过去五天的数据时表现最好，其中RMSE和R2结果分别为0.3618和0.9967。它们比其他方案略好。与其他两种方案相比，RMSE和R2值分别提高了0.0086、0.001和0.0028、0.0006。因此，未来一天的SST预测将采用过去五天的数据。

表2分析了t对未来三天海表温度预测的影响。可以看出，历史数据使用的时间越长，预测效果越好。使用过去7天的数据的RMSE值表现最好，比使用过去5天的数据提高了0.0025。同时，使用过去7天的数据的R2与其他两种方案相比表现最好。因此，未来三天的海表温度预测采用过去7天的数据。

表三列出了未来七天海表温度预测的实验结果。可以看出，使用过去十天的数据进行的预测结果效果最好。因此，我们利用过去十天的数据进行未来七天的海表温度预测。

C. 消融研究

为了验证先前网络和 GAN 训练的有效性，我们进行了消融实验。如图 3 所示，设计了两个变体进行比较，如下所示：

• 方案A.替换先验网络和ConvLSTM的顺序，先将数值模型SST数据输入到ConvLSTM中，再将输出输入到训练好的先验网络中。

• 方案B.原有网络没有训练好，具体来说，原有网络训练中省略了GAN模型训练（图2中的第一步）。

实验结果如表4所示。可以看出，我们的方法取得了最好的RMSE和R2值。具体来说，所提出的方法优于方案A，这表明先验网络和ConvLSTM的正确排序可以提高SST预测性能。很明显，先验网络有效地恢复了数值模型数据中的错误成分，恢复的数据在SST预测中表现更好。此外，所提出的方法比方案B具有更好的性能，这表明GAN建模是必不可少的步骤。GAN建模可以学习观测到的SST的数据分布，并帮助先验网络从观测到的SST中捕获更好的物理信息。综上所述，在所提出的方法中，我们使用对抗学习进行先验网络预训练，可以有效地将观测到的SST数据的物理知识转移到先验网络中。它可以指导快速的训练收敛，并提高SST预测性能。

D.实验结果与讨论

图 4 将预测的下一日 SST 与观测到的真实数据进行了比较。我们可以看出，我们的方法的预测结果与观测数据非常吻合。同样，图 5 和图 6 分别显示了未来三天和七天的观测数据和相应的预测 SST。可视化结果表明，所提出的方法可以为 SST 预测生成稳健可靠的结果。

图 7 显示了未来一天的 SST 预测散点图。可以观察到数据点

大致均匀分布在红线附近。图8和图9分别是未来3天和未来7天的预测结果散点图。散点图证明了所提方法对SST预测的有效性。

为了验证所提方法的有效性，我们将所提方法与七种密切相关的方法进行了比较：ConvLSTM [20]、Hybrid-NN [14]、Hybrid-TL [15]、Gen-END [57]、VAE-GAN [58]、Tra-NM 和 Tra-ASL。这些方法的研究区域为（3.99°N∼24.78°N，98.4°E∼124.4°E）。所有这些方法都使用过去 5 天的训练数据进行接下来 1 天的预测，使用过去 7 天的数据进行接下来 3 天的预测，使用过去 10 天的数据进行接下来 7 天的预测。

第三节 C 部分讨论了 ConvLSTM，它是一种有效的 SST 预测时空模型。HybridNN 利用观测数据和数值模型数据之间的差异来指导深度神经网络的训练。Hybrid-TL 通过迁移学习结合了数值模型和神经网络的优点。GenEND 是一种可用于 SST 预测的生成编码器。VAE-GAN 集成了变分自动编码器和

GAN，它可以捕获用于 SST 预测的高级语义特征。HYCOM SST 数据用于训练 ConvLSTM 模型，以进行接下来的 1 天、3 天和 7 天的预测（称为 Tra-NM）。Tra-ASL 是一种传统的同化方法，它利用多种类型数据（观测数据和数值模型数据）之间的相关性。

首先利用 GHRSST 数据训练 ConvLSTM 模型，作为基线。这是一种广泛用于 SST 预测的数据驱动方法。Hybrid-NN、HybridTL、Gen-END 和 VAE-GAN 使用 GHRSST 和 HYCOM 数据进行训练。HYCOM 同化数据 [56]

，空间分辨率为1/12°×1/12°。我们的方法通过引入历史观测数据的物理知识来改进和纠正数值模式数据中的不正确成分。校正后的数值模式数据称为物理增强数据。为了与物理增强数据进行比较，同样使用HYCOM同化数据（Tra-ASL）和HYCOM数据（Tra-NM）来训练ConvLSTM模型。

ConvLSTM、Hybrid-NN、Tra-NM、Tra-ASL在未来1天、3天、7天预测的训练时间分别为1.8、4.4、8.2小时。Hybrid-TL方法对ConvLSTM模型进行了两次训练，三项任务的训练时长分别为3.6、8.8、16.4小时。VAE-GAN需要181.6、184.2、188.4小时进行训练，而Gen-END方法所需的时间几乎相同，三项SST预测任务分别需要196.8、199.3、203.2小时。

表五列出了未来 1 天、3 天和 7 天的 SST 预测结果。很明显，与其他方法相比，TraNM 方法的结果不尽如人意。这可能是由于 HYCOM 数据中的不正确成分对 SST 预测性能产生了不利影响。Hybrid-NN 方法的表现也很差，因为它的平均 RMSE 值在所有模型中排名第二低。对于未来 1 天的 SST 预测，Hybrid-TL 模型的表现优于 ConvLSTM，但对于其他两个任务则不然。我们的方法实现了最佳 RMSE 值和最高 R2 值。与 ConvLSTM 模型相比，我们的方法的平均 RMSE 值得到了有效改善。它表明引入物理知识

从观测数据中恢复数值模式数据中的错误成分，从而提高SST预测精度。

图10给出了未来一天SST预测、观测SST数据及其差异的可视化结果。可以看出，整个南海区域的预测结果与观测SST数据高度相似。图11展示了未来三天SST预测的可视化结果。可以观察到在北部湾和南海其他边缘区域存在一些明显的差异值。图12展示了未来七天SST预测的可视化结果。可以发现，未来七天的预测中，主要的差异值主要集中在北部湾，并且差异值大于其他两个任务的结果。

E. 限制与讨论

从图7到图9可以看出，中段SST存在一些不准确之处，这在图13中进行了可视化。明亮的像素表示SST预测误差较大，而暗像素表示SST预测准确。可以看出，这些点主要位于台湾海峡的西北部，预测的海面温度低于观测数据。预测误差主要由ConvLSTM模型和陆地掩模引起。在我们的实现中，陆地掩模被应用于研究区域。ConvLSTM利用了整个研究区域的时空特征。台湾海峡西北部的特征在一定程度上受到陆地掩模的影响，因此导致预测误差。如果可以获得更高分辨率的训练数据，该地区的预测精度将进一步提高。