paint-brush
Tiefes neuronales Netzwerk zur Vorhersage der Meeresoberflächentemperatur: Experimentelle Ergebnisse und Analysevon@oceanography
202 Lesungen

Tiefes neuronales Netzwerk zur Vorhersage der Meeresoberflächentemperatur: Experimentelle Ergebnisse und Analyse

Zu lang; Lesen

In diesem Artikel verbessern Forscher die SST-Vorhersage, indem sie physikalisches Wissen aus historischen Beobachtungen auf numerische Modelle übertragen.
featured image - Tiefes neuronales Netzwerk zur Vorhersage der Meeresoberflächentemperatur: Experimentelle Ergebnisse und Analyse
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Autoren:

(1) Yuxin Meng;

(2) Feng Gao;

(3) Eric Rigall;

(3) Der Vorsitzende;

(3) Johannes B.;

(6) Qian Du.

Linktabelle

IV. EXPERIMENTELLE ERGEBNISSE UND ANALYSE

A. Studienbereich und Versuchseinstellungen


Das Südchinesische Meer liegt im westlichen Pazifik im Süden des chinesischen Festlands. Seine Fläche beträgt etwa 3,5 Millionen Quadratkilometer bei einer durchschnittlichen Tiefe von 1.212 Metern. In diesem Artikel ist das ausgewählte Untersuchungsgebiet (3,99°N∼24,78°N, 98,4°E∼124,4°E).


Wir verwenden die hochauflösenden Satellitenfernerkundungsdaten von GHRSST (Group for High Resolution Sea Surface Temperature) [55] als Beobachtungsdaten. GHRSST bietet eine Vielzahl von Daten zur Meeresoberflächentemperatur, darunter Satelliten-Schwadkoordinaten, Gitterdaten und lückenlose Gitterprodukte. Hier haben wir lückenlose Gitterprodukte verwendet, die durch die Kombination komplementärer Satelliten- und Vor-Ort-Beobachtungen in einem Rahmen der optimalen Interpolation erzeugt werden. Als numerisches Modell wurde HYCOM [56] ausgewählt. Ihre räumlichen Auflösungen betragen 1/20°×1/20° bzw. 1/12°×1/12°. Die zeitliche Auflösung beträgt einen Tag. Die Daten von Mai 2007 bis Dezember 2013 werden zu Trainingszwecken verwendet, während die restlichen Daten von Januar 2014 bis Dezember 2014 zu Testzwecken verwendet werden. Es ist zu beachten, dass wir wolkenlose Daten von GHRSST verwenden. Die Daten wurden mit Mikrowelleninstrumenten erfasst, die Wolken durchdringen können. Daher decken die Daten das gesamte Untersuchungsgebiet ab. Darüber hinaus ist die genaue Zeit jedes Pixels im GHRSST-SST-Produkt gleich.


Die Z-Score-Standardisierung wurde wie folgt zur Vorverarbeitung verwendet:



wobei x das GHRSST- und HYCOM-Modell SST bezeichnet, z die normalisierten Daten, µ und σ den Mittelwert bzw. die Standardabweichung. Wir haben die Daten in 256 × 256 quadratische Heatmaps umgewandelt.


Genauer gesagt werden die GHRSST-Daten und der 512-dimensionale Zufallsvektor im ersten Schritt des vorherigen Netzwerktrainings verwendet. Die Größe der GHRSST-Eingabedaten beträgt N × H × W, wobei N die Batchgröße, H die Höhe der Eingabedaten und W die Breite der Eingabedaten darstellt. Für die zweite Phase des vorherigen Netzwerks verwenden wir nur GHRSST-Daten für das Encodertraining. Die Größen der Eingaben und Ausgaben für beide Phasen betragen N × H × W. In ähnlicher Weise werden im dritten Schritt des vorherigen Netzwerktrainings die HYCOM SST-Daten in das vorab trainierte Modell eingespeist. Hier betragen die Größen sowohl der Eingaben als auch der Ausgaben N × H × W. In unseren Implementierungen setzen wir N auf 2430, während H und W beide auf 256 gesetzt sind.


Abb. 3. Darstellung von drei Modellen, die in der Ablationsstudie verwendet wurden. (a) Schema A: Die SST-Daten des numerischen Modells werden zuerst in das ConvLSTM eingespeist, und dann wird die Ausgabe in das gut trainierte vorherige Netzwerk eingespeist. Die Reihenfolge des vorherigen Netzwerks und des ConvLSTM wird ersetzt. (b) Schema B: Das vorherige Netzwerk wurde nicht gut trainiert. Insbesondere wurde das GAN-Modelltraining im vorherigen Netzwerk ausgelassen. (c) Die vorgeschlagene Methode.


Wir haben umfangreiche Experimente auf einer NVIDIA GeForce 2080Ti mit 8 GPUs durchgeführt. Das vorherige Netzwerk verwendet dieselbe Netzwerkstruktur und -konfiguration wie in [53] erwähnt, um das physikalische Wissen aus den historischen Beobachtungsdaten zu gewinnen. Anschließend wird das gewonnene physikalische Wissen auf die Daten des numerischen Modells übertragen, um die fehlerhaften Komponenten im numerischen Modell wiederherzustellen und zu verbessern. Die Konfiguration für das in diesem Artikel verwendete ConvLSTM-Modell ist dieselbe wie die des ConvLSTM-Modells in Shis Arbeit [20]. Der GHRSST SST-Datensatz wird in diesem Artikel als Benchmark für Vergleich und Bewertung verwendet.


B. Einflüsse der vergangenen Tageszahl auf die SST-Vorhersage


Wie in Abschnitt III. C erwähnt, bezeichnet t die Anzahl der vergangenen Tage, die für die Vorhersage verwendet werden. Dies ist ein kritischer Parameter, der die SST-Vorhersageleistung beeinflussen kann. In diesem Artikel versuchen wir, die SST für den nächsten eintägigen, dreitägigen und siebentägigen Zeitraum vorherzusagen. Wir haben umfangreiche Experimente durchgeführt, um die


TABELLE I EXPERIMENTELLE ERGEBNISSE VERSCHIEDENER ANZAHL VERGANGENER TAGE FÜR DIE NÄCHSTE EINTÄGIGE SST-VORHERSAGE


TABELLE II EXPERIMENTELLE ERGEBNISSE VERSCHIEDENER ANZAHL VERGANGENER TAGE FÜR DIE SST-VORHERSAGE FÜR DIE NÄCHSTEN DREI TAGE


TABELLE IIIEXPERIMENTELLE ERGEBNISSE VERSCHIEDENER ANZAHL VERGANGENER TAGE FÜR DIE NÄCHSTE SIEBEN-TÄGIGE SST-VORHERSAGE


richtige Anzahl vergangener Tage für die zukünftige SST-Vorhersage. Als Bewertungskriterien werden der mittlere quadratische Fehler (RMSE) und der Determinationskoeffizient (R2) verwendet. Niedrigere RMSE- und höhere R2-Werte weisen auf genauere Ergebnisse hin.


Tabelle I listet die Vorhersageergebnisse für den nächsten Tag auf, wobei die Daten der letzten fünf Tage, der letzten drei Tage und der letzten fünf Tage separat verwendet werden. Es lässt sich beobachten, dass das vorgeschlagene Modell die besten Ergebnisse liefert, wenn die Daten der letzten fünf Tage verwendet werden, wobei die RMSE- und R2-Ergebnisse 0,3618 bzw. 0,9967 betragen. Sie sind etwas besser als die anderen Schemata. Im Vergleich zu den anderen beiden Schemata verbessern sich die RMSE- und R2-Werte um 0,0086, 0,001 und 0,0028, 0,0006. Daher werden die Daten der letzten fünf Tage für die nächste eintägige SST-Vorhersage übernommen.


Wir analysieren die Einflüsse von t für die nächste dreitägige SST-Vorhersage in Tabelle II. Es ist ersichtlich, dass die Vorhersageleistung umso besser ist, je länger historische Daten verwendet wurden. Der RMSE-Wert unter Verwendung der Daten der letzten sieben Tage erzielt die beste Leistung. Er ist um 0,0025 besser als der Wert unter Verwendung der Daten der letzten fünf Tage. Unterdessen erzielt R2 unter Verwendung der Daten der letzten sieben Tage im Vergleich zu den beiden anderen Schemata die beste Leistung. Daher wurden die Daten der letzten sieben Tage für die nächste dreitägige SST-Vorhersage verwendet.


Die experimentellen Ergebnisse der nächsten siebentägigen SST-Vorhersage sind in Tabelle III dargestellt. Wie man sehen kann, erzielen die Vorhersageergebnisse unter Verwendung der Daten der letzten zehn Tage die besten Ergebnisse. Daher nutzen wir die Daten der letzten zehn Tage für die nächste siebentägige SST-Vorhersage.


TABELLE IVEXPERIMENTELLE ERGEBNISSE (DURCHSCHNITT ± STD) VON ABLATIONSSTUDIEN IM DURCHSCHNITT ÜBER 10 ZUFÄLLIGE DURCHFÜHRUNGEN


C. Ablationsstudie


Um die Wirksamkeit des vorherigen Netzwerk- und GAN-Trainings zu überprüfen, führen wir Ablationsexperimente durch. Wie in Abb. 3 dargestellt, werden zwei Varianten zum Vergleich wie folgt entworfen:


• Schema A. Die Abfolge des vorherigen Netzwerks und des ConvLSTM wird ersetzt. Die SST-Daten des numerischen Modells werden zuerst in das ConvLSTM eingespeist und dann wird die Ausgabe in das gut trainierte vorherige Netzwerk eingespeist.


• Schema B. Das vorherige Netzwerk wurde nicht gut trainiert. Insbesondere wurde das GAN-Modelltraining (der erste Schritt in Abb. 2) beim vorherigen Netzwerktraining ausgelassen.


Die experimentellen Ergebnisse sind in Tabelle IV aufgeführt. Wie man sehen kann, erreicht unsere Methode die besten RMSE- und R2-Werte. Insbesondere übertrifft die vorgeschlagene Methode Schema A, was zeigt, dass die richtige Abfolge des vorherigen Netzwerks und ConvLSTM die SST-Vorhersageleistung steigern kann. Es ist offensichtlich, dass das vorherige Netzwerk die falschen Komponenten der numerischen Modelldaten effektiv wiederherstellt und die wiederhergestellten Daten bei der SST-Vorhersage besser abschneiden. Darüber hinaus weist die vorgeschlagene Methode eine bessere Leistung als Schema B auf, was zeigt, dass die GAN-Modellierung ein wesentlicher Schritt ist. Die GAN-Modellierung kann die Datenverteilung der beobachteten SST erlernen und hilft dem vorherigen Netzwerk, bessere physikalische Informationen aus der beobachteten SST zu erfassen. Zusammenfassend lässt sich sagen, dass wir bei der vorgeschlagenen Methode kontroverses Lernen für das Vortraining des vorherigen Netzwerks verwenden, wodurch physikalisches Wissen aus den beobachteten SST-Daten effektiv auf das vorherige Netzwerk übertragen werden kann. Es kann eine schnelle Trainingskonvergenz leiten und die SST-Vorhersageleistung verbessern.


D. Experimentelle Ergebnisse und Diskussion


Abb. 4 vergleicht die für den nächsten Tag prognostizierte SST mit den beobachteten Ground-Truth-Daten. Wir können sehen, dass die von unserer Methode prognostizierten Ergebnisse gut mit den beobachteten Daten übereinstimmen. In ähnlicher Weise werden die beobachteten Daten und die entsprechende prognostizierte SST für die nächsten drei Tage bzw. sieben Tage in Abb. 5 bzw. Abb. 6 angezeigt. Die visualisierten Ergebnisse zeigen, dass die vorgeschlagene Methode robuste und zuverlässige Ergebnisse für die SST-Prognose liefern kann.


Ein Streudiagramm der SST-Vorhersage für den nächsten Tag ist in Abb. 7 dargestellt. Man kann beobachten, dass die Datenpunkte


Abb. 4. Ergebnisse der SST-Vorhersage für den nächsten Tag im Vergleich zu den beobachteten Ground-Truth-Daten.


Abb. 5. Ergebnisse der SST-Vorhersage für die nächsten drei Tage im Vergleich zu den beobachteten Ground-Truth-Daten.


Abb. 6. Ergebnisse der SST-Vorhersage für die nächsten sieben Tage im Vergleich zu den beobachteten Ground-Truth-Daten.


Abb. 7. Streudiagramm zum Vergleich der nächsten eintägigen SST-Vorhersage mit den entsprechenden beobachteten Daten


Abb. 8. Streudiagramm, das die SST-Vorhersage für die nächsten drei Tage mit den entsprechenden beobachteten Daten vergleicht


ungefähr gleichmäßig verteilt in der Nähe der roten Linie. Abb. 8 und Abb. 9 sind Streudiagramme der Vorhersageergebnisse für die nächsten drei bzw. sieben Tage. Die Streudiagramme demonstrieren die Wirksamkeit der vorgeschlagenen Methode zur SST-Vorhersage.


Um die Wirksamkeit der vorgeschlagenen Methode zu überprüfen, vergleichen wir die vorgeschlagene Methode mit sieben eng verwandten Methoden: ConvLSTM [20], Hybrid-NN [14], Hybrid-TL [15], Gen-END [57], VAE-GAN [58], Tra-NM und Tra-ASL. Das Untersuchungsgebiet für diese Methoden ist (3,99°N∼24,78°N, 98,4°E∼ 124,4°E). Alle diese Methoden verwendeten die Trainingsdaten der letzten 5 Tage für die nächste 1-Tages-Vorhersage, die Daten der letzten 7 Tage für die nächste 3-Tages-Vorhersage und die Daten der letzten 10 Tage für die nächste 7-Tages-Vorhersage.


ConvLSTM wird in Abschnitt III. C besprochen und ist ein effektives räumlich-zeitliches Modell zur SST-Vorhersage. HybridNN nutzt die Diskrepanz zwischen den beobachteten Daten und den numerischen Modelldaten, um das Training tiefer neuronaler Netzwerke zu steuern. Hybrid-TL kombiniert die Vorteile numerischer Modelle und neuronaler Netzwerke durch Transferlernen. GenEND ist ein generativer Encoder, der zur SST-Vorhersage verwendet werden kann. VAE-GAN integriert Variational Autoencoder und


Abb. 9. Streudiagramm, das die nächste siebentägige SST-Vorhersage mit den entsprechenden beobachteten Daten vergleicht


GAN und kann hochrangige semantische Merkmale für die SST-Vorhersage erfassen. HYCOM SST-Daten werden verwendet, um das ConvLSTM-Modell für die nächste 1-Tages-, 3-Tages- und 7-Tages-Vorhersage (Tra-NM genannt) zu trainieren. Tra-ASL ist eine traditionelle Assimilationsmethode und nutzt die Korrelationen zwischen mehreren Datentypen (beobachtete Daten und numerische Modelldaten).


Die GHRSST-Daten werden zunächst verwendet, um ein ConvLSTM-Modell zu trainieren, das als Basis dient. Es handelt sich um einen weit verbreiteten datengesteuerten Ansatz zur SST-Vorhersage. Hybrid-NN, HybridTL, Gen-END und VAE-GAN verwenden die GHRSST- und HYCOM-Daten zum Training. Die HYCOM-Assimilationsdaten [56]


TABELLE VSST VORHERSAGEERGEBNISSE VERSCHIEDENER METHODEN


Abb. 10. Visualisierte Ergebnisse für die nächste eintägige SST-Vorhersage.


Abb. 11. Visualisierte Ergebnisse für die SST-Vorhersage für die nächsten drei Tage. Die erste Spalte zeigt die Ergebnisse der vorhergesagten SST. Die tatsächlich beobachteten SST-Daten werden in der zweiten Spalte angezeigt. Die Unterschiede stellen wir in der dritten Spalte dar.


werden hier mit einer räumlichen Auflösung von 1/12°×1/12° verwendet. Unsere Methode verbessert und korrigiert die falschen Komponenten in den numerischen Modelldaten, indem sie physikalisches Wissen aus den historischen Beobachtungsdaten einführt. Die korrigierten numerischen Modelldaten werden als physikverstärkte Daten bezeichnet. Zum Vergleich mit den physikverstärkten Daten werden HYCOM-Assimilationsdaten (Tra-ASL) und HYCOM-Daten (Tra-NM) in ähnlicher Weise zum Trainieren des ConvLSTM-Modells verwendet.


Die Trainingszeiten von ConvLSTM, Hybrid-NN, Tra-NM und Tra-ASL für die nächsten 1-Tages-, 3-Tages- und 7-Tages-Vorhersagen betragen 1,8, 4,4 bzw. 8,2 Stunden. Die Hybrid-TL-Methode trainierte das ConvLSTM-Modell zweimal und die Trainingsdauer beträgt für die drei Aufgaben 3,6, 8,8 bzw. 16,4 Stunden. Das VAE-GAN benötigt 181,6, 184,2 und 188,4 Stunden für das Training, während die Gen-END-Methode mit 196,8, 199,3 bzw. 203,2 Stunden für drei SST-Vorhersageaufgaben fast die gleiche Zeit benötigt.


Die Ergebnisse für die nächsten 1-Tages-, 3-Tages- und 7-Tages-SST-Vorhersagen sind in Tabelle V dargestellt. Es ist offensichtlich, dass die TraNM-Methode im Vergleich zu den anderen Methoden unbefriedigende Ergebnisse liefert. Dies liegt wahrscheinlich an den falschen Komponenten in den HYCOM-Daten, die sich nachteilig auf die SST-Vorhersageleistung auswirken. Die Hybrid-NN-Methode liefert ebenfalls eine schlechte Leistung, da ihre durchschnittlichen RMSE-Werte die zweitniedrigsten unter den Modellen sind. Das Hybrid-TL-Modell liefert für die nächsten 1-Tages-SST-Vorhersagen eine bessere Leistung als das ConvLSTM, jedoch nicht für die beiden anderen Aufgaben. Unsere Methode erreicht die besten RMSE-Werte und die höchsten R2-Werte. Im Vergleich zum ConvLSTM-Modell sind die durchschnittlichen RMSE-Werte unserer Methode effektiv verbessert. Es zeigt, dass die Einführung physikalischer Kenntnisse


Abb. 12. Visualisierte Ergebnisse für die nächste siebentägige SST-Vorhersage. Die erste Reihe zeigt die Ergebnisse der vorhergesagten SST. Die tatsächlich beobachteten SST-Daten werden in der zweiten Reihe angezeigt. Die Unterschiede stellen wir in der dritten Reihe dar.


Aus den beobachteten Daten lassen sich die falschen Komponenten in den numerischen Modelldaten wiederherstellen und so die Genauigkeit der SST-Vorhersage verbessern.


Abbildung 10 zeigt die visualisierten Ergebnisse für die nächste eintägige SST-Vorhersage, die beobachteten SST-Daten und deren Unterschiede. Es ist ersichtlich, dass die vorhergesagten Ergebnisse den beobachteten SST-Daten im gesamten Gebiet des Südchinesischen Meeres sehr ähnlich sind. Abbildung 11 zeigt die visualisierten Ergebnisse für die nächste dreitägige SST-Vorhersage. Es ist zu beobachten, dass es im Golf von Tonkin und in anderen Randgebieten des Südchinesischen Meeres einige signifikante Differenzwerte gibt. Abbildung 12 zeigt die visualisierten Ergebnisse für die nächste siebentägige SST-Vorhersage. Es zeigt sich, dass sich die größten Differenzwerte für die nächste siebentägige Vorhersage hauptsächlich auf den Golf von Tonkin konzentrieren und größer sind als die Ergebnisse für die beiden anderen Aufgaben.


E. Einschränkung und Diskussion


In Abb. 7 bis Abb. 9 ist zu erkennen, dass es einige Ungenauigkeiten im mittleren SST-Bereich gibt, die in Abb. 13 visualisiert sind. Helle Pixel zeigen große SST-Vorhersagefehler an, während dunkle Pixel genaue SST-Vorhersagen anzeigen. Wie man sehen kann, befinden sich diese Punkte hauptsächlich im nordwestlichen Teil der Taiwanstraße, wo die vorhergesagte Meeresoberflächentemperatur niedriger ist als die beobachteten Daten. Der Vorhersagefehler wird hauptsächlich durch das ConvLSTM-Modell und die Landmaske verursacht. In unseren Implementierungen wird die Landmaske auf das Untersuchungsgebiet angewendet. Das ConvLSTM nutzt die räumlichen und zeitlichen Merkmale des gesamten Untersuchungsgebiets. Die Merkmale des nordwestlichen Teils der Taiwanstraße werden in gewissem Maße von der Landmaske beeinflusst und führen daher zu Vorhersagefehlern. Wenn Trainingsdaten mit höherer Auflösung erhalten werden könnten, würde die Genauigkeit der Vorhersagen in dieser Region weiter verbessert.


Abb. 13. Visualisierung des SST-Vorhersagefehlers.


In Abb. 11 und 12 ist zu erkennen, dass es mit dem Vorlauftag nicht zu einer signifikanten Zunahme der Fehler kommt. Dies kann daran liegen, dass unsere Methode eine ausreichende Menge an Trainingsdaten verwendet und die tiefen neuronalen Netzwerke in der Lage sind, die zeitlichen Merkmale effektiv zu erfassen. Darüber hinaus ist auch die Persistenz der SST ein wichtiger Faktor.