著者:
(1)孟宇新
(2)馮高
(3)エリック・リガル
(4)ラン・ドン
(5)董俊宇
(6)千度
A. 生成的敵対ネットワーク
2014年にGoodfellowら[16]は、敵対的な方法で訓練された生成モデルの新しいフレームワークを提唱しました。彼らの方法では、生成モデルGと識別モデルDが同時に訓練されました。モデルGは、モデルDを介して入力データの分布を間接的に捕捉し、類似データを生成するために適用されました。一方、モデルDは、入力サンプルがモデルGではなく訓練データから来た確率を推定します。Gの訓練プロセスは、Dの確率誤差によって駆動されました。この敵対的プロセスでは、GとDが学習を導き、徐々に互いの能力を強化して優れたパフォーマンスを達成します。
GANは物理関連のタスクに適用されてきました。たとえば、Yang et al. [17]は物理学に基づいたGANを高次元の問題に適用して確率微分方程式を解き、Lutjens ¨ et al. [18]はGANを使用して数値モデルデータの特徴を学習することでより現実的な沿岸洪水データを生成し、Zheng et al. [19]はGANによって学習された潜在的な物理法則を使用して未知の空間データを推測しました。ただし、これらの研究はGANを使用して数値モデル全体を置き換えることでモデルを実行しており、これは私たちの研究とはまったく異なります。本稿では、GANモデルを採用して観測データから数値モデルデータに物理的知識を転送し、数値モデルの物理的特徴を修正および改善します。また、既存の方法では、エンコーダーによって生成されたコードがGANによって学習された意味知識に準拠しているかどうかを考慮せずに、決定論的モデルのみを学習します。
B. 畳み込み長期短期記憶
2015年、降水量予測を解決するためにConvLSTM [20]が提案されました。ConvLSTMのネットワーク構造は、古典的な畳み込みニューラルネットワーク(CNN)[21]と同様にローカルな空間的特徴を捉えながら、長短期記憶(LSTM)ブロックから継承された連続的な関係を構築することができます。さらに、著者らは、ConvLSTMが空間的・時間的関係においてLSTMよりも優れたパフォーマンスを発揮できることを示す実験を行いました。天気予報タスクとは別に、ConvLSTMは、行動認識[22]、[23]など、さまざまな空間的・時間的連続予測問題に適用できます。
C. 海面温度予測
Linsら[24]はSVMを用いて熱帯大西洋のSSTを調査した。Patilら[25]は人工ニューラルネットワークを用いて海面水温を予測した。これは1日から5日のリードタイムで予測する場合にのみ良好な結果を示したが、その後は精度が低下した。Zhangら[26]はLSTMを
SSTを予測する。Yangら[27]は、完全に接続されたLSTMモデルを構築することでSSTを予測した。別の観点から、Patilら[28]はウェーブレットニューラルネットワークを使用して毎日のSSTを予測し、Qualaら[29]はSST予測にパッチレベルのニューラルネットワーク法を提案した。しかし、これらの方法はデータのみに依存し、その背後にある物理的な知識を無視している。Hamら[15]は転移学習を採用してENSOを予測し、分類した。本研究では比較実験を行い、その結果は私たちの方法が短期的な誤差だけでなく長期的なバイアスも削減することを示しています。
D. データ拡張
Shorten et al. [30]は、ディープラーニングのための画像データ拡張の最新技術をレビューしました。データ拡張の目的は、ニューラルネットワークの表現能力を高め、元のデータの分布をよりよく学習することです。近年、データ変換と再サンプリングという2種類のデータ拡張技術が一般的に使用されています。データ変換アプローチには、幾何学的変換[31]、色空間変換[32]–[34]、ランダム消去[35]–[37]、敵対的トレーニング[38]–[41]、スタイル転送[42]–[45]が含まれます。再サンプリング技術は、画像ミックスアップ[46]–[48]、特徴空間拡張[49]、[50]、生成的敵対ネットワーク(GAN)[16]などの新しいインスタンス構成に特に重点を置いています。幾何学的変換は、画像の反転、切り取り、回転、変換、ノイズ注入などの優れたパフォーマンスを得ることができます[51]。 [30]の実験結果では、ランダムクロッピング技術が良好に機能したことが示されています。色空間変換は、メモリ消費量が多く、計算時間が長いという問題があります。ランダム消去技術は、マスクを使用することで、オクルージョンの場合のネットワークの堅牢性を向上させることができます。敵対的トレーニングでも堅牢性を向上させることができますが、自然の敵対的サンプルの数が限られているため、実際にはネットワークのパフォーマンスが大きく制限されます。ニューラルスタイル転送アプローチは特定のタスクにのみ有効ですが、実際の適用は限られています。特徴空間拡張は、特徴空間で表現を補間する機能を実装します。GANベースの拡張技術は、現在の最先端のネットワークパフォーマンスを実現するために適用されています[52]。しかし、数値モデルとディープラーニングのメリットを活用できる効果的なデータ拡張方法は存在しません。本稿では、物理的な知識に基づいた新しいデータ拡張技術を提案することを目的としています。提案された技術は、GANベースの拡張よりも優れたパフォーマンスを実現します。
この論文はCC 4.0ライセンスの下でarxivで公開されています。