paint-brush
Réseau neuronal profond pour la prévision de la température de la surface de la mer : résumé et introductionpar@oceanography
169 lectures

Réseau neuronal profond pour la prévision de la température de la surface de la mer : résumé et introduction

Trop long; Pour lire

Dans cet article, les chercheurs améliorent la prévision de la SST en transférant les connaissances physiques des observations historiques vers les modèles numériques.
featured image - Réseau neuronal profond pour la prévision de la température de la surface de la mer : résumé et introduction
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Auteurs:

(1) Yuxin Meng;

(2) Feng Gao;

(3) Éric Rigall;

(4) Ran Dong;

(5) Junyu Dong;

(6) Qian Du.

Tableau des liens

Abstrait

Traditionnellement, des modèles numériques ont été déployés dans les études océanographiques pour simuler la dynamique des océans en représentant des équations physiques. Cependant, de nombreux facteurs liés à la dynamique des océans semblent mal définis. Nous soutenons que le transfert de connaissances physiques à partir de données observées pourrait encore améliorer la précision des modèles numériques lors de la prévision de la température de surface de la mer (SST). Récemment, les progrès des technologies d’observation de la Terre ont donné lieu à une croissance monumentale des données. Par conséquent, il est impératif d’explorer les moyens d’améliorer et de compléter les modèles numériques en utilisant les quantités toujours croissantes de données d’observation historiques. À cette fin, nous introduisons une méthode de prédiction de la SST qui transfère les connaissances physiques des observations historiques vers les modèles numériques. Plus précisément, nous utilisons une combinaison d'un encodeur et d'un réseau contradictoire génératif (GAN) pour capturer des connaissances physiques à partir des données observées. Les données du modèle numérique sont ensuite introduites dans le modèle pré-entraîné pour générer des données physiques améliorées, qui peuvent ensuite être utilisées pour la prédiction SST. Les résultats expérimentaux démontrent que la méthode proposée améliore considérablement les performances de prédiction de la SST par rapport à plusieurs lignes de base de l'état de l'art.


Termes de l'index — Température de surface de la mer, connaissances physiques, réseau antagoniste génératif, modèle numérique

INTRODUCTION

Les modèles numériques constituent une méthode de calcul mathématique traditionnelle pour la prévision de la dynamique des océans. Selon les statistiques du Programme mondial de recherche sur le climat (WCRP), la communauté des chercheurs a développé plus de 40 modèles numériques océaniques, chacun présentant ses propres avantages et caractéristiques. Par exemple, le système de modèles océaniques régionaux (ROMS) [1] possède un puissant module adjoint écologique, le modèle rapide océan-atmosphère (FOAM) [2] est très efficace dans les études globales couplées océan-atmosphère, le modèle océanique côtier à volumes finis (FVCOM) [3] est capable d'ajuster avec précision la limite du littoral et la topographie sous-marine. Le modèle océanique de coordonnées hybrides (HYCOM) [4] peut implémenter trois variétés de coordonnées auto-adaptatives. Ces modèles numériques ne sont pas interchangeables et leur utilisation dépend de l'application spécifique. Il convient de noter que les différents processus de la dynamique des océans décrits dans les modèles numériques reposent sur des équations simplifiées et


Fig. 1. Comparaison conceptuelle du modèle numérique et de la méthode proposée pour la prévision de la température de surface de la mer (SST). (a) Modèle numérique. (b) Méthode proposée pour la prédiction de la SST. Le réseau antagoniste génératif est utilisé pour transférer les connaissances physiques des données historiques observées vers le modèle numérique, améliorant ainsi les performances de prédiction de la SST.


paramètres en raison de notre compréhension limitée de l’océan. Les mouvements et changements dans l’océan réel sont si divers et complexes qu’identifier les sources d’un certain phénomène devient un véritable défi. Par conséquent, la recherche de nouvelles relations ou connaissances à partir de données historiques est d’une importance cruciale pour améliorer les performances des modèles numériques dans l’étude de la dynamique des océans. Dans cet article, nous appelons connaissance physique la capacité qui peut améliorer le modèle numérique. Nous supposons que les données historiques peuvent posséder des connaissances physiques jusqu'ici inconnues.


L’apprentissage profond a la capacité remarquable d’apprendre des fonctions très complexes, transformant les données originales en un niveau d’abstraction bien plus élevé. Dans [5], Lecun et al. a décrit les principes fondamentaux et les principaux avantages de l’apprentissage profond. Récemment, l'apprentissage profond a été appliqué à diverses tâches, telles que la surveillance de la biodiversité marine [6], [7], l'identification de cibles dans les images sonar [8], [9] et la prévision de la concentration de glace de mer [10]. Par exemple, Bermant et al. [6] ont utilisé des réseaux de neurones convolutifs (CNN) pour classer les spectrogrammes générés à partir des données acoustiques des cachalots. Allken et coll. [7] ont développé un modèle CNN pour la classification des espèces de poissons, exploitant des données synthétiques pour l'augmentation des données de formation. Lima et coll. [8] ont proposé une méthode d'apprentissage par transfert profond pour la reconnaissance automatique du front de mer, extrayant des connaissances à partir de modèles CNN profonds formés sur des données historiques. Xu et coll. [9] ont présenté une approche combinant des réseaux de génération profonde et un apprentissage par transfert pour la détection d'épaves par sonar. Ren et coll. [10] ont proposé un cadre codeur-décodeur avec des réseaux entièrement convolutionnels capables de prédire la concentration de glace de mer une semaine à l'avance avec une grande précision. Grâce à l’application de méthodes basées sur l’apprentissage profond à la recherche océanique, des améliorations significatives ont été obtenues en termes de performances de classification et de prévision.


En raison des connaissances physiques incomplètes des modèles numériques et des faibles performances de généralisation des réseaux de neurones, des efforts sont déployés pour améliorer les performances de prédiction en combinant les avantages du modèle numérique et des réseaux neuronaux. En science géographique, cela peut être réalisé de trois manières différentes [11] : 1) Apprendre les paramètres du modèle numérique via des réseaux de neurones. Les réseaux de neurones peuvent décrire de manière optimale la scène observée à partir du modèle détaillé à haute résolution, mais de nombreux paramètres sont difficiles à déduire, ce qui rend leur estimation difficile. Brenowitz et coll. [12] ont formé un réseau neuronal profond basé sur un paramétrage physique unifié et ont expliqué l'influence du rayonnement et de la convection des cumulus. 2) Remplacement du modèle numérique par un réseau de neurones. De cette manière, l’architecture du réseau neuronal profond peut capturer la cohérence physique spécifiée. Pannekoucke et coll. [13] ont traduit des équations physiques en architectures de réseaux neuronaux à l'aide d'un outil plug-and-play. 3) Analyser l'inadéquation des résultats entre le modèle numérique et les données d'observation. Les réseaux de neurones peuvent être utilisés pour identifier, visualiser et comprendre les modèles d'inexactitudes du modèle et corriger dynamiquement l'écart du modèle. Patil et coll. [14] ont appliqué l'écart entre les résultats du modèle numérique et les données d'observation pour entraîner un réseau neuronal afin de prédire la température de la surface de la mer (SST). Ham et coll. [15] ont formé un réseau neuronal convolutionnel basé sur l'apprentissage par transfert. Ils entraînent d’abord leur modèle sur les données du modèle numérique, puis utilisent les données de réanalyse pour calibrer le modèle. Cependant, la troisième approche s’est avérée souffrir d’un problème de biais à long terme, dans lequel les performances de prédiction se détériorent à mesure que le nombre de jours de prédiction augmente.


Pour résoudre les problèmes ci-dessus, dans cette étude, nous utilisons les réseaux contradictoires génératifs (GAN) pour transférer les connaissances physiques des données historiques observées aux données du modèle numérique, comme illustré sur la figure 1. Différent du modèle numérique traditionnel, le modèle proposé La méthode peut corriger la partie physique dans les données du modèle numérique pour améliorer les performances de prédiction. Pour être plus précis, comme illustré sur la figure 2, nous avons d'abord acquis la caractéristique physique à partir des données observées en utilisant un modèle de réseau antérieur composé d'un encodeur et d'un GAN. Par la suite, nous avons obtenu le SST amélioré par la physique en transmettant les données du modèle numérique au modèle pré-entraîné. Par la suite, les SST améliorés par la physique ont été adoptés pour former un modèle spatio-temporel permettant de prédire la SST. Pendant ce temps, nous avons réalisé des expériences d’ablation pour tirer pleinement parti des nouvelles données générées.


Les principales contributions de cet article sont triples :


• Au meilleur de nos connaissances, nous sommes les premiers à transférer les connaissances physiques des données historiques observées vers les données du modèle numérique en utilisant les GAN pour la prédiction SST.


• La différence entre les données améliorées basées sur les connaissances physiques et les résultats prédits a été exploitée pour ajuster le poids du modèle pendant l'entraînement.


• Les résultats expérimentaux indiquent que la méthode proposée peut combler le manque de connaissances physiques dans le modèle numérique et améliorer la précision des prévisions.


Le reste du document est organisé comme suit. La section II présente la revue de la littérature relative à notre méthode, tandis que la conception de notre méthode est détaillée dans la section III. Ensuite, les résultats expérimentaux sont présentés dans la section IV. La section V conclut enfin cet article.


Cet article est disponible sur arxiv sous licence CC 4.0.