著者:
(1)孟宇新
(2)馮高
(3)エリック・リガル
(4)ラン・ドン
(5)董俊宇
(6)千度
伝統的に、数値モデルは、物理方程式を表現することで海洋のダイナミクスをシミュレートするために海洋学の研究で導入されてきました。しかし、海洋のダイナミクスに関連する多くの要因は明確に定義されていないようです。私たちは、観測データから物理的な知識を転送することで、海面温度 (SST) を予測する際の数値モデルの精度をさらに向上できると主張します。最近、地球観測技術の進歩により、データが飛躍的に増加しています。その結果、増え続ける過去の観測データを利用して数値モデルを改善および補完する方法を模索することが不可欠です。この目的のために、私たちは過去の観測から物理的な知識を数値モデルに転送する SST 予測の方法を紹介します。具体的には、エンコーダと生成的敵対ネットワーク (GAN) を組み合わせて、観測データから物理的な知識を取得します。次に、数値モデル データを事前トレーニング済みモデルに入力して、物理強化データを生成します。このデータは、SST 予測に使用できます。実験結果では、提案された方法がいくつかの最先端のベースラインと比較して SST 予測パフォーマンスを大幅に向上させることを示しています。
索引用語— 海面温度、物理的知識、生成的敵対ネットワーク、数値モデル
数値モデルは、海洋のダイナミクスを予測するための伝統的な数学的計算方法である。世界気候研究計画(WCRP)の統計によると、研究コミュニティは40を超える海洋数値モデルを開発しており、それぞれに独自の利点と特徴がある。たとえば、地域海洋モデルシステム(ROMS)[1]には強力な生態学的随伴モジュールがあり、高速海洋大気モデル(FOAM)[2]は地球規模の海洋大気結合研究に非常に効果的であり、有限体積沿岸海洋モデル(FVCOM)[3]は海岸線の境界と海底地形を正確にフィッティングすることができる。ハイブリッド座標海洋モデル(HYCOM)[4]は、3種類の自己適応座標を実装できる。これらの数値モデルは互換性がなく、その使用は特定のアプリケーションに依存する。数値モデルで説明される海洋ダイナミクスのさまざまなプロセスは、簡略化された方程式と
海洋に関する理解が限られているため、海洋のパラメータを適切に把握することができません。実際の海洋の動きや変化は非常に多様で複雑なため、特定の現象の原因を特定することは非常に困難です。したがって、海洋ダイナミクスの研究における数値モデルの性能を向上させるには、過去のデータから新しい関係や知識を探すことが非常に重要です。この論文では、数値モデルを改善できる能力を物理的知識と呼びます。歴史的データには、これまで発見されていなかった物理的知識が含まれている可能性があると想定しています。
ディープラーニングは、非常に複雑な機能を学習し、元のデータをはるかに高いレベルの抽象化に変換する優れた能力を備えています。[5]で、Lecunらはディープラーニングの基本原理と主な利点について説明しました。最近、ディープラーニングは、海洋生物多様性の監視[6]、[7]、ソナー画像でのターゲット識別[8]、[9]、海氷密接度の予測[10]など、さまざまなタスクに適用されています。たとえば、Bermantら[6]は、畳み込みニューラルネットワーク(CNN)を使用して、マッコウクジラの音響データから生成されたスペクトログラムを分類しました。Allkenら[7]は、合成データを活用してトレーニングデータ拡張を行い、魚種分類用のCNNモデルを開発しました。Limaら[8]は、履歴データでトレーニングされたディープCNNモデルから知識を抽出する、自動海面認識のためのディープ転移学習法を提案しました。Xuら[9]は、ディープジェネレーションネットワークと転移学習を組み合わせたソナー難破船検出のアプローチを提示しました。Renら[10]は、ディープラーニングが海洋生物多様性の監視にどのように役立つかを検討しました。 [10]は、海氷の密集度を1週間前に高精度で予測できる完全畳み込みネットワークを備えたエンコーダー-デコーダーフレームワークを提案しました。深層学習ベースの手法を海洋研究に適用することで、分類と予測のパフォーマンスが大幅に向上しました。
数値モデルにおける物理的知識が不完全であることと、ニューラルネットワークの一般化性能が弱いことから、数値モデルとニューラルネットワークの利点を組み合わせて予測性能を向上させる取り組みがいくつかあります。地理科学では、これは3つの異なる方法で実現できます[11]。1)ニューラルネットワークを介して数値モデルのパラメータを学習する。ニューラルネットワークは、詳細な高解像度モデルから観測されたシーンを最適に記述できますが、多くのパラメータは推測が難しく、推定が困難です。Brenowitzら[12]は、統一された物理パラメータ化に基づいてディープニューラルネットワークをトレーニングし、放射と積雲対流の影響を説明しました。2)数値モデルをニューラルネットワークに置き換えます。このようにして、ディープニューラルネットワークアーキテクチャは、指定された物理的一貫性を捉えることができます。Pannekouckeら[13]は、プラグアンドプレイツールを使用して物理方程式をニューラルネットワークアーキテクチャに変換しました。3)数値モデルと観測データ間の出力の不一致を分析します。ニューラルネットワークは、モデルの不正確さのパターンを識別、視覚化、理解し、モデルの偏差を動的に修正するために使用できます。Patil et al. [14]は、数値モデルの結果と観測データの間の不一致を適用して、海面温度(SST)を予測するニューラルネットワークをトレーニングしました。Ham et al. [15]は、転移学習に基づいて畳み込みニューラルネットワークをトレーニングしました。彼らは最初に数値モデルデータでモデルをトレーニングし、次に再解析データを使用してモデルを較正しました。ただし、3番目のアプローチは、予測日が長くなるにつれて予測パフォーマンスが低下するという長期的なバイアスの問題があることがわかりました。
上記の問題に対処するため、本研究では、図 1 に示すように、生成的敵対的ネットワーク (GAN) を使用して、過去の観測データから物理的知識を数値モデル データに転送します。従来の数値モデルとは異なり、提案手法では、数値モデル データの物理的部分を修正して予測性能を向上させることができます。具体的には、図 2 に示すように、まずエンコーダーと GAN で構成された事前ネットワーク モデルを使用して、観測データから物理的特徴を取得します。その後、数値モデル データを事前学習済みモデルに入力して、物理的に強化された SST を取得します。その後、物理的に強化された SST を使用して、SST を予測するための時空間モデルを学習しました。一方、新しく生成されたデータを最大限に活用するために、アブレーション実験を実施しました。
この論文の主な貢献は次の3つです。
• 私たちの知る限りでは、SST 予測に GAN を使用して、過去の観測データから数値モデル データに物理的な知識を転送したのは私たちが初めてです。
• 物理的な知識に基づいて強化されたデータと予測結果の差を利用して、トレーニング中にモデルの重みを調整しました。
• 実験結果は、提案手法が数値モデルにおける物理的知識の不足を補い、予測精度を向上できることを示しています。
論文の残りの部分は次のように構成されています。セクション II では、私たちの方法に関連する文献レビューを紹介し、セクション III では私たちの方法の設計について詳しく説明します。次に、セクション IV で実験結果を示します。最後にセクション V でこの論文を締めくくります。
この論文はCC 4.0ライセンスの下でarxivで公開されています。