paint-brush
Tiefes neuronales Netzwerk zur Vorhersage der Meeresoberflächentemperatur: Vorgeschlagene Methodevon@oceanography
107 Lesungen

Tiefes neuronales Netzwerk zur Vorhersage der Meeresoberflächentemperatur: Vorgeschlagene Methode

Zu lang; Lesen

In diesem Artikel verbessern Forscher die SST-Vorhersage, indem sie physikalisches Wissen aus historischen Beobachtungen auf numerische Modelle übertragen.
featured image - Tiefes neuronales Netzwerk zur Vorhersage der Meeresoberflächentemperatur: Vorgeschlagene Methode
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Autoren:

(1) Yuxin Meng;

(2) Feng Gao;

(3) Eric Rigall;

(3) Der Vorsitzende;

(3) Johannes B.;

(6) Qian Du.

Linktabelle

III. VORGESCHLAGENE METHODE

Ein numerisches Modell kann die räumliche Verteilung der SST und ihre globalen Fernverbindungen zusammen vorhersagen. Es funktioniert gut bei kurzen Vorlaufzeiten für die SST-Vorhersage. Dennoch argumentieren wir, dass die Übertragung des physikalischen Wissens aus den beobachteten Daten die Leistung des numerischen Modells für die SST-Vorhersage weiter verbessern kann. Zu diesem Zweck verwenden wir GANs, um das physikalische Wissen in den beobachteten Daten zu erlernen.


Zhu et al. [53] schlugen eine GAN-Inversionsmethode vor, die nicht nur die Eingabedaten originalgetreu rekonstruiert, sondern auch sicherstellt, dass der invertierte latente Code semantisch sinnvoll ist. Sie zeigten, dass das Lernen der Pixelwerte des Zielbildes allein nicht ausreicht und dass die gelernten Merkmale nicht in der Lage sind, das Bild auf semantischer Ebene darzustellen. Inspiriert von dieser Arbeit entwerfen wir einen Encoder in GAN, um physikalisches Wissen aus den beobachteten Daten zu lernen, das als vorheriges Netzwerk bezeichnet wird. Dieses vorherige Netzwerk lernt nicht nur die Pixelwerte der beobachteten Zieldaten, sondern erfasst auch die physikalischen Informationen. Es verbessert effektiv die SST-Vorhersagegenauigkeit.


Als nächstes stellen wir die vorgeschlagene Methode wie folgt vor: 1) Übersicht über die Methode, 2) Vorheriges Netzwerk, 3) SST-Vorhersage mit erweiterten Daten.


A. Überblick über die Methode


In diesem Unterabschnitt fassen wir die vorgeschlagene SST-Vorhersagemethode zusammen und beschreiben die Eingabe und Ausgabe jeder Phase im Detail. Wie in Abb. 2 dargestellt, besteht die vorgeschlagene SST-Vorhersagemethode aus zwei Phasen: Vorheriges Netzwerktraining und SST-Vorhersage mit verbesserten Daten.


1) Vorheriges Netzwerktraining. Diese Phase besteht aus drei Schritten. Im ersten Schritt wird die beobachtete SST (GHRST-Daten) für das GAN-Modelltraining verwendet. Im zweiten Schritt werden der vortrainierte Generator und die GHRSST-Daten verwendet, um den Encoder zu trainieren. Im dritten Schritt werden der vortrainierte Generator und der Encoder im vorherigen Netzwerk kombiniert. Das vorherige Netzwerk wird verwendet, um das physikalische Wissen aus den beobachteten Daten auf das numerische Modell zu übertragen. Die SST des numerischen Modells (HYCOM-Daten) wird dann in das vorherige Netzwerk eingespeist, um dessen Merkmalsdarstellungen zu verbessern.


2) SST-Vorhersage mit verbesserten Daten. Die physikalisch verbesserten Daten werden zur SST-Vorhersage in das ConvLSTM-Modell eingespeist. Die SST des nächsten Tages, der nächsten 3 Tage und der nächsten 7 Tage werden separat vorhergesagt.


Es ist zu beachten, dass die meisten bestehenden Arbeiten [26] [27] nur die beobachteten Daten für das ConvLSTM-Training verwenden. Im Gegensatz dazu nutzt unsere Methode physikverstärkte Daten für das ConvLSTM-Training. Als nächstes beschreiben wir das vorherige Netzwerktraining und die SST-Vorhersage mit verbesserten Daten im Detail.


B. Phase 1: Vorherige Netzwerkschulung


Wir konstruieren ein Vorabnetzwerk, um das physikalische Wissen in den beobachteten Daten zu erlernen und seine semantischen/physikalischen Informationen nach dem Training konstant zu halten. Wie in Abb. 2 dargestellt, besteht das Vorabnetzwerktraining aus drei Schritten: GAN-Modelltraining, Encodertraining und physikalisch verbesserte Datengenerierung. Als Nächstes liefern wir detaillierte Beschreibungen der einzelnen Schritte.


GAN-Modelltraining. Das GAN-Modell wird verwendet, um die Datenverteilung aus der beobachteten SST zu lernen. Die Zielfunktion lautet wie folgt:



Der Trainingsprozess des GAN-Modells ist in Algorithmus 1 zusammengefasst. Wir trainieren das Modell über die beobachtete SST, bis der Generator G die physikalischen Merkmale aus den beobachteten SST-Daten erfasst.



wobei F(·) die Merkmalsextraktion über das VGG-Netzwerk darstellt. Das VGG-Netzwerk steht für das von der Visual Geometry Group [54] vorgeschlagene Netzwerk und ist ein klassisches tiefes Convolutional Neural Network.


Das Encoder-Training wird in Algorithmus 2 beschrieben. Die Parameter des Generators G sind fest, während die Parameter des Encoders E und des Diskriminators D basierend auf Gleichung 2 bzw. Gleichung 3 aktualisiert werden.


Die Motivation von Phase 1 besteht darin, ein Vornetzwerk zu konstruieren, das die falschen Komponenten in den numerischen Modelldaten korrigieren kann. Zu diesem Zweck entwickeln wir zunächst ein GAN-Modell, das die Datenverteilung aus der beobachteten SST erfasst und qualitativ hochwertige SST-Daten generieren kann. Anschließend wird der Encoder trainiert, um zu gewährleisten, dass die generierten latenten Codes die semantischen/physikalischen Informationen in der beobachteten SST bewahren. Wir argumentieren, dass das Vornetzwerk (bestehend aus Encoder und Generator) durch kontroverses Lernen die falschen Teile in den Eingabedaten korrigieren kann, da das physikalische Wissen in das Vornetzwerk eingebettet wurde. Folglich kann im dritten Schritt, wenn die numerischen Modelldaten in das Vornetzwerk eingespeist werden, das eingebettete physikalische Wissen die falschen Komponenten in den numerischen Modelldaten korrigieren.




C. Phase 2: SST-Vorhersage mit verbesserten Daten


ConvLSTM ist ein effektives Tool zur Vorhersage räumlich-zeitlicher Daten. Es handelt sich um ein rekurrierendes neuronales Netzwerk, das Faltungsblöcke sowohl in die Input-to-State- als auch in die State-to-State-Übergänge einbezieht. Anders als die traditionelle LSTM-Schicht bewahrt ConvLSTM nicht nur die sequentielle Beziehung, sondern extrahiert auch räumliche Merkmale aus den Daten. Auf diese Weise können wir es nutzen, um robuste räumlich-zeitliche Merkmale zu erfassen. Die Zielfunktion von ConvLSTM wird wie folgt formuliert:



Die physikalisch verbesserten SST-Daten werden zur SST-Vorhersage wie folgt in das ConvLSTM-Modell eingespeist:



Die vom Generator erhaltenen Gewichte werden in Algorithmus 2 wiederverwendet, wobei nur die Generatorgewichte festgelegt sind. Der eingeführte Encoder und der Diskriminator durchlaufen einen weiteren Trainingsprozess über die beobachtete SST. Ihre Gewichte werden basierend auf Gleichung 2 bzw. Gleichung 3 aktualisiert. Nach dem Training würde der vom Encoder generierte Code das erlernte physikalische Wissen verkörpern.


Schließlich erfassen wir die Daten, die auf physikalischem Wissen basieren, mit dem oben vortrainierten Modell. Die Gewichte von



Der Generator und der Encoder aus Algorithmus 2 werden wiederverwendet und das numerische Modell SST wird genutzt, um physikgestützte numerische Modelldaten zu erzeugen.


In Algorithmus 3 werden die mit physikalischem Wissen angereicherten Daten genutzt, um ein räumlich-zeitliches ConvLSTM-Modell zur SST-Vorhersage zu trainieren. In diesem Artikel werden die SST des nächsten Tages, der nächsten 3 Tage und der nächsten 7 Tage separat vorhergesagt. Für diesen Teil haben wir eine Ablationsstudie durchgeführt, um die angereicherten Daten effektiv nutzen zu können.