Auteurs:
(1) Yuxin Meng;
(2) Feng Gao;
(3) Éric Rigall;
(4) Ran Dong;
(5) Junyu Dong;
(6) Qian Du.
A. Réseau contradictoire génératif
En 2014, Goodfellow et al. [16] proposent un nouveau cadre de modèle génératif formé de manière contradictoire. Dans leur méthode, un modèle génératif G et un modèle discriminant D ont été formés simultanément. Le modèle G a été appliqué pour capturer indirectement la distribution des données d'entrée via le modèle D et générer des données similaires. Alors que le modèle D estime les probabilités que ses échantillons d'entrée proviennent de données de formation au lieu du modèle G. Le processus de formation de G a été piloté par les erreurs de probabilité de D. Dans ce processus contradictoire, G et D guident l'apprentissage et renforcent progressivement les capacités de chacun. pour atteindre des performances exceptionnelles.
Les GAN ont été appliqués à des tâches pertinentes sur le plan physique. Par exemple, Yang et al. [17] ont appliqué des GAN basés sur la physique pour traiter des problèmes de grande dimension et résolu des équations différentielles stochastiques, Lutjens ¨ et al. [18] ont produit des données plus réalistes sur les inondations côtières en utilisant les GAN pour apprendre les caractéristiques des données du modèle numérique, Zheng et al. [19] ont déduit les données spatiales inconnues avec la loi physique potentielle apprise par les GAN. Cependant, ces travaux ont réalisé leur modèle en utilisant GAN pour remplacer l'intégralité du modèle numérique, ce qui est assez différent de notre travail. Dans cet article, nous adoptons le modèle GAN pour transférer les connaissances physiques des données observées aux données du modèle numérique, afin de corriger et d'améliorer les caractéristiques physiques du modèle numérique. De plus, les méthodes existantes apprennent uniquement un modèle déterministe sans se demander si le code généré par l'encodeur est conforme aux connaissances sémantiques apprises par le GAN.
B. Mémoire convolutive à long terme et à court terme
En 2015, ConvLSTM [20] a été proposé pour résoudre la prévision immédiate des précipitations. La structure de réseau de ConvLSTM est capable de capturer des caractéristiques spatiales locales comme dans les réseaux de neurones convolutifs classiques (CNN) [21] tout en construisant une relation séquentielle, héritée des blocs de mémoire à long terme (LSTM). De plus, les auteurs ont mené des expériences pour montrer que ConvLSTM est capable de mieux fonctionner que LSTM sur les relations spatio-temporelles. Outre les tâches de prévision météorologique, ConvLSTM peut être appliqué à divers problèmes de prévision séquentielle spatio-temporelle, par exemple la reconnaissance d'actions [22], [23].
C. Prévision de la température de la surface de la mer
Lins et coll. [24] ont étudié la SST dans l'Atlantique tropical à l'aide d'un SVM. Patil et coll. [25] ont adopté un réseau neuronal artificiel pour prédire la température de la surface de la mer. Il ne fonctionne bien que dans le cas de prévisions avec un délai de 1 à 5 jours, puis la précision diminue. Zhang et coll. [26] ont appliqué le LSTM à
prédire la SST. Yang et coll. [27] ont prédit la SST en construisant un modèle LSTM entièrement connecté. D'un autre point de vue, Patil et al. [28] ont utilisé un réseau neuronal d'ondelettes pour prédire la SST quotidienne, tandis que Quala et al. [29] ont proposé une méthode de réseau neuronal au niveau du patch pour la prédiction de la SST. Cependant, ces méthodes s’appuient uniquement sur des données et ignorent les connaissances physiques qui les sous-tendent. Ham et coll. [15] ont adopté l'apprentissage par transfert pour prédire les ENSO et les classer. Dans ce travail, nous menons des expériences comparatives et les résultats montrent que notre méthode réduit les erreurs à court terme ainsi que les biais à long terme.
D. Augmentation des données
Shorten et coll. [30] ont passé en revue les techniques récentes d’augmentation des données d’image pour l’apprentissage en profondeur. Le but de l’augmentation des données est d’améliorer la capacité de représentation des réseaux de neurones et de mieux connaître la distribution des données originales. Ces dernières années, deux types de techniques d’augmentation des données ont été couramment utilisées : la transformation des données et le rééchantillonnage. L'approche de transformation des données comprend la transformation géométrique [31], la transformation de l'espace colorimétrique [32]–[34], l'effacement aléatoire [35]–[37], l'entraînement contradictoire [38]–[41] et le transfert de style [42]–[45. ]. La technique de rééchantillonnage met particulièrement l'accent sur la nouvelle composition d'instances, telle que le mélange d'images [46]–[48], l'amélioration de l'espace des fonctionnalités [49], [50] et le réseau contradictoire génératif (GAN) [16]. La transformation géométrique peut acquérir de belles performances, telles que le retournement d'image, le recadrage, la rotation, la translation et l'injection de bruit [51]. Les résultats expérimentaux de [30] ont montré que la technique de recadrage aléatoire fonctionnait bien. La transformation de l'espace colorimétrique souffre d'une consommation de mémoire importante et d'un temps de calcul long. Les techniques d'effacement aléatoire peuvent améliorer la robustesse du réseau dans les cas d'occlusion en utilisant des masques. Bien que la formation contradictoire puisse également améliorer la robustesse, le nombre fini d’échantillons contradictoires naturels limite largement les performances du réseau dans la pratique. L’approche de transfert de style neuronal n’est efficace que pour des tâches spécifiques, alors que son application pratique est limitée. L'augmentation de l'espace de fonctionnalités met en œuvre la capacité d'interpoler des représentations dans l'espace de fonctionnalités. Des techniques d'augmentation basées sur le GAN ont été appliquées pour atteindre les performances réseau de pointe actuelles [52]. Cependant, il n’existe pas de méthode efficace d’augmentation des données qui pourrait exploiter les mérites du modèle numérique et de l’apprentissage profond. Dans cet article, nous visons à proposer une nouvelle technique d’amélioration des données basée sur les connaissances physiques. La technique proposée permet d'obtenir de meilleures performances que l'augmentation basée sur le GAN.
Cet article est disponible sur arxiv sous licence CC 4.0.