Auteurs:
(1) Yuxin Meng;
(2) Feng Gao;
(3) Éric Rigall;
(4) Ran Dong;
(5) Junyu Dong;
(6) Qian Du.
Le modèle numérique peut prédire ensemble la distribution spatiale de la SST et ses téléconnexions mondiales. Il fonctionne bien avec des avances courtes pour la prédiction de la SST. Néanmoins, nous soutenons que le transfert des connaissances physiques à partir des données observées peut encore améliorer les performances du modèle numérique pour la prédiction de la SST. À cette fin, nous adoptons les GAN pour acquérir les connaissances physiques des données observées.
Zhu et coll. [53] ont proposé une méthode d'inversion GAN qui non seulement reconstruit fidèlement les données d'entrée, mais garantit également que le code latent inversé est sémantiquement significatif. Ils ont démontré que l’apprentissage des valeurs des pixels de l’image cible seul est insuffisant et que les caractéristiques apprises sont incapables de représenter l’image au niveau sémantique. Inspirés par ce travail, nous concevons un encodeur dans GAN pour apprendre des connaissances physiques à partir des données observées, appelé réseau antérieur. Ce réseau antérieur apprend non seulement les valeurs de pixels des données cibles observées, mais capture également les informations physiques. Cela améliore efficacement la précision de la prédiction SST.
Ensuite, nous présentons la méthode proposée comme suit : 1) Aperçu de la méthode, 2) Réseau préalable, 3) Prédiction SST avec des données améliorées.
A. Aperçu de la méthode
Dans cette sous-section, nous résumons la méthode de prédiction SST proposée et décrivons en détail les entrées et les sorties de chaque étape. Comme l'illustre la figure 2, la méthode de prédiction SST proposée comprend deux étapes : une formation préalable du réseau et une prédiction SST avec des données améliorées.
1) Formation préalable au réseau. Cette étape se compose de trois étapes. Dans un premier temps, le SST observé (données GHRST) est utilisé pour la formation du modèle GAN. Dans la deuxième étape, le générateur pré-entraîné et les données GHRSST sont utilisés pour entraîner l'encodeur. Dans la troisième étape, le générateur et l'encodeur pré-entraînés sont combinés dans le réseau précédent. Le réseau préalable est utilisé pour transférer les connaissances physiques des données observées vers le modèle numérique. Le modèle numérique SST (données HYCOM) est ensuite introduit dans le réseau précédent pour améliorer ses représentations de caractéristiques.
2) Prédiction SST avec des données améliorées. Les données améliorées par la physique sont introduites dans le modèle ConvLSTM pour la prédiction de la SST. La SST du lendemain, des 3 prochains jours et des 7 prochains jours est prédite séparément.
Il est à noter que la plupart des travaux existants [26] [27] n'utilisent les données observées que pour l'entraînement ConvLSTM. En revanche, notre méthode tire parti des données physiques améliorées pour la formation ConvLSTM. Ensuite, nous décrivons en détail la formation préalable du réseau et la prédiction SST avec des données améliorées.
B. Étape 1 : Formation préalable au réseau
Nous construisons un réseau préalable pour apprendre les connaissances physiques dans les données observées et maintenir ses informations sémantiques/physiques constantes après la formation. Comme l'illustre la figure 2, la formation réseau préalable comprend trois étapes : la formation du modèle GAN, la formation des encodeurs et la génération de données améliorées par la physique. Ensuite, nous fournissons des descriptions détaillées de chaque étape.
Formation sur le modèle GAN. Le modèle GAN est utilisé pour apprendre la distribution des données à partir du SST observé. La fonction objectif est la suivante :
Le processus de formation du modèle GAN est résumé dans l'algorithme 1. Nous entraînons le modèle sur la SST observée jusqu'à ce que le générateur G capture les caractéristiques physiques des données SST observées.
où F(·) représente l'extraction de fonctionnalités via le réseau VGG. Le réseau VGG signifie le réseau proposé par Visual Geometry Group [54], et il s'agit d'un réseau neuronal convolutif profond classique.
La formation du codeur est décrite dans l'algorithme 2. Les paramètres du générateur G sont fixes, tandis que les paramètres du codeur E et du discriminateur D sont mis à jour sur la base de l'équation. 2 et équation. 3, respectivement.
La motivation de l'étape 1 est de construire un réseau préalable capable de rectifier les composants incorrects dans les données du modèle numérique. À cette fin, nous concevons d'abord un modèle GAN qui capture la distribution des données du SST observé et peut générer des données SST de haute qualité. Par la suite, l'encodeur est entraîné pour garantir que les codes latents générés préservent les informations sémantiques/physiques dans le SST observé. Nous soutenons que grâce à l’apprentissage contradictoire, le réseau antérieur (constitué de l’encodeur et du générateur) peut rectifier les parties incorrectes des données d’entrée, puisque les connaissances physiques ont été intégrées dans le réseau antérieur. Par conséquent, lors de la troisième étape, lorsque les données du modèle numérique sont introduites dans le réseau précédent, les connaissances physiques intégrées peuvent corriger les composants incorrects dans les données du modèle numérique.
C. Étape 2 : Prédiction de la SST avec des données améliorées
ConvLSTM est un outil efficace pour prédire les données spatiotemporelles. Il s'agit d'un réseau neuronal récurrent qui intègre des blocs convolutionnels dans les transitions entrée-état et état-état. Contrairement à la couche LSTM traditionnelle, ConvLSTM préserve non seulement la relation séquentielle, mais extrait également les caractéristiques spatiales des données. De cette façon, nous pouvons l’exploiter pour capturer des caractéristiques spatio-temporelles robustes. La fonction objectif de ConvLSTM est formulée comme suit :
Les données SST améliorées par la physique sont introduites dans le modèle ConvLSTM pour la prédiction SST comme suit :
Les poids obtenus par le générateur sont réutilisés dans l'algorithme 2, où seuls les poids du générateur sont fixes. L'encodeur introduit et le discriminateur subissent un autre processus de formation sur le SST observé. Leurs poids sont mis à jour sur la base de l'équation. 2 et équation. 3, respectivement. Après la formation, le code généré par l’encodeur incarnerait les connaissances physiques acquises.
Enfin, nous acquérons les données renforcées sur la base de connaissances physiques en utilisant le modèle pré-entraîné ci-dessus. Les poids de
le générateur et l'encodeur de l'algorithme 2 sont réutilisés et le modèle numérique SST est exploité pour produire des données de modèle numérique renforcées par la physique.
Dans l'algorithme 3, les données physiques améliorées sont exploitées pour former un modèle spatio-temporel ConvLSTM pour la prédiction de la SST. Dans cet article, la SST du lendemain, des 3 prochains jours et des 7 prochains jours sont prédites séparément. Pour cette partie, nous avons mené une étude d’ablation afin d’utiliser efficacement les données renforcées.
Cet article est disponible sur arxiv sous licence CC 4.0.