paint-brush
Tiefes neuronales Netzwerk zur Vorhersage der Meeresoberflächentemperatur: Zusammenfassung und Einführungvon@oceanography
213 Lesungen

Tiefes neuronales Netzwerk zur Vorhersage der Meeresoberflächentemperatur: Zusammenfassung und Einführung

Zu lang; Lesen

In diesem Artikel verbessern Forscher die SST-Vorhersage, indem sie physikalisches Wissen aus historischen Beobachtungen auf numerische Modelle übertragen.
featured image - Tiefes neuronales Netzwerk zur Vorhersage der Meeresoberflächentemperatur: Zusammenfassung und Einführung
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Autoren:

(1) Yuxin Meng;

(2) Feng Gao;

(3) Eric Rigall;

(3) Der Vorsitzende;

(3) Johannes B.;

(6) Qian Du.

Linktabelle

Abstrakt

Traditionell werden in ozeanografischen Studien numerische Modelle eingesetzt, um die Meeresdynamik durch die Darstellung physikalischer Gleichungen zu simulieren. Viele Faktoren, die die Meeresdynamik betreffen, scheinen jedoch nicht klar definiert zu sein. Wir argumentieren, dass die Übertragung physikalischer Erkenntnisse aus Beobachtungsdaten die Genauigkeit numerischer Modelle bei der Vorhersage der Meeresoberflächentemperatur (SST) weiter verbessern könnte. In jüngster Zeit haben die Fortschritte in der Erdbeobachtungstechnologie zu einem enormen Datenwachstum geführt. Daher ist es zwingend erforderlich, nach Möglichkeiten zu suchen, numerische Modelle unter Verwendung der immer größer werdenden Mengen historischer Beobachtungsdaten zu verbessern und zu ergänzen. Zu diesem Zweck führen wir eine Methode zur SST-Vorhersage ein, die physikalische Erkenntnisse aus historischen Beobachtungen auf numerische Modelle überträgt. Insbesondere verwenden wir eine Kombination aus einem Encoder und einem generativen kontradiktorischen Netzwerk (GAN), um physikalische Erkenntnisse aus den Beobachtungsdaten zu erfassen. Die numerischen Modelldaten werden dann in das vorab trainierte Modell eingespeist, um physikverstärkte Daten zu generieren, die dann zur SST-Vorhersage verwendet werden können. Experimentelle Ergebnisse zeigen, dass die vorgeschlagene Methode die SST-Vorhersageleistung im Vergleich zu mehreren hochmodernen Basislinien erheblich verbessert.


Indexbegriffe — Meeresoberflächentemperatur, physikalisches Wissen, generatives kontradiktorisches Netzwerk, numerisches Modell

I. EINLEITUNG

N UMERISCHE Modelle sind eine traditionelle mathematische Berechnungsmethode zur Vorhersage der Ozeandynamik. Laut den Statistiken des World Climate Research Program (WCRP) hat die Forschungsgemeinschaft mehr als 40 numerische Ozeanmodelle entwickelt, von denen jedes seine eigenen Vorteile und Eigenschaften hat. Beispielsweise verfügt das regionale Ozeanmodellsystem (ROMS) [1] über ein leistungsstarkes ökologisches Adjungierungsmodul, das schnelle Ozeanatmosphärenmodell (FOAM) [2] ist hochwirksam bei globalen gekoppelten Ozean-Atmosphären-Studien, das finite-volume Küstenozeanmodell (FVCOM) [3] ist in der Lage, die Küstenlinie und die Unterwassertopographie genau anzupassen. Das hybride Koordinatenozeanmodell (HYCOM) [4] kann drei Arten von selbstadaptiven Koordinaten implementieren. Diese numerischen Modelle sind nicht austauschbar und ihre Verwendung hängt von der spezifischen Anwendung ab. Es ist zu beachten, dass die verschiedenen Prozesse der Ozeandynamik, die in numerischen Modellen beschrieben werden, auf vereinfachten Gleichungen basieren und


Abb. 1. Konzeptioneller Vergleich des numerischen Modells und der vorgeschlagenen Methode zur Vorhersage der Meeresoberflächentemperatur (SST). (a) Numerisches Modell. (b) Vorgeschlagene Methode zur SST-Vorhersage. Ein generatives kontradiktorisches Netzwerk wird verwendet, um das physikalische Wissen aus den historisch beobachteten Daten auf das numerische Modell zu übertragen und so die SST-Vorhersageleistung zu verbessern.


Parameter aufgrund unseres begrenzten Verständnisses des Ozeans. Die Bewegungen und Veränderungen im echten Ozean sind so vielfältig und komplex, dass die Identifizierung der Quellen eines bestimmten Phänomens zu einer echten Herausforderung wird. Daher ist die Suche nach neuen Beziehungen oder Erkenntnissen aus historischen Daten von entscheidender Bedeutung, um die Leistung numerischer Modelle bei der Untersuchung der Ozeandynamik zu verbessern. In diesem Artikel bezeichnen wir die Fähigkeit, die das numerische Modell verbessern kann, als physikalisches Wissen. Wir gehen davon aus, dass die historischen Daten möglicherweise bisher unentdecktes physikalisches Wissen enthalten.


Deep Learning verfügt über die bemerkenswerte Fähigkeit, hochkomplexe Funktionen zu erlernen und die Originaldaten auf eine viel höhere Abstraktionsebene zu transformieren. In [5] beschrieben Lecun et al. die grundlegenden Prinzipien und die wichtigsten Vorteile von Deep Learning. In jüngster Zeit wurde Deep Learning für eine Vielzahl von Aufgaben eingesetzt, wie etwa zur Überwachung der Meeresbiodiversität [6], [7], zur Zielidentifizierung in Sonarbildern [8], [9] und zur Vorhersage der Meereiskonzentration [10]. Beispielsweise setzten Bermant et al. [6] Convolutional Neural Networks (CNNs) ein, um aus akustischen Daten von Pottwalen generierte Spektrogramme zu klassifizieren. Allken et al. [7] entwickelten ein CNN-Modell zur Klassifizierung von Fischarten und nutzten dabei synthetische Daten zur Erweiterung der Trainingsdaten. Lima et al. [8] schlugen eine Methode des Deep Transfer Learning zur automatischen Erkennung von Meeresfronten vor, die Wissen aus Deep-CNN-Modellen extrahiert, die mit historischen Daten trainiert wurden. Xu et al. [9] stellten einen Ansatz vor, der Deep Generation Networks und Transfer Learning zur Sonar-Erkennung von Schiffswracks kombiniert. Ren et al. [10] schlug ein Encoder-Decoder-Framework mit vollständig konvolutionellen Netzwerken vor, das die Meereiskonzentration eine Woche im Voraus mit hoher Genauigkeit vorhersagen kann. Durch die Anwendung von Deep-Learning-basierten Methoden in der Meeresforschung wurden erhebliche Verbesserungen hinsichtlich der Klassifizierungs- und Vorhersageleistung erzielt.


Aufgrund des unvollständigen physikalischen Wissens in numerischen Modellen und der schwachen Generalisierungsleistung neuronaler Netzwerke gibt es einige Bemühungen, die Vorhersageleistung durch Kombination der Vorteile numerischer Modelle und neuronaler Netzwerke zu verbessern. In der Geographie kann dies auf drei verschiedene Arten erreicht werden [11]: 1) Erlernen der Parameter des numerischen Modells durch neuronale Netzwerke. Neuronale Netzwerke können die beobachtete Szene optimal aus dem detaillierten hochauflösenden Modell beschreiben, aber viele Parameter sind schwer abzuleiten, was ihre Schätzung herausfordernd macht. Brenowitz et al. [12] trainierten ein tiefes neuronales Netzwerk basierend auf einer einheitlichen physikalischen Parametrisierung und erklärten den Einfluss von Strahlung und Cumuluskonvektion. 2) Ersetzen des numerischen Modells durch ein neuronales Netzwerk. Auf diese Weise kann die Architektur des tiefen neuronalen Netzwerks die angegebene physikalische Konsistenz erfassen. Pannekoucke et al. [13] übersetzten physikalische Gleichungen mithilfe eines Plug-and-Play-Tools in neuronale Netzwerkarchitekturen. 3) Analysieren der Ausgabe-Nichtübereinstimmung zwischen dem numerischen Modell und den Beobachtungsdaten. Neuronale Netzwerke können verwendet werden, um die Muster der Modellungenauigkeiten zu identifizieren, zu visualisieren und zu verstehen und die Abweichungen des Modells dynamisch zu korrigieren. Patil et al. [14] nutzten die Diskrepanz zwischen den Ergebnissen des numerischen Modells und den Beobachtungsdaten, um ein neuronales Netzwerk zu trainieren, das die Meeresoberflächentemperatur (SST) vorhersagen kann. Ham et al. [15] trainierten ein Convolutional Neural Network auf der Grundlage von Transferlernen. Sie trainierten ihr Modell zunächst anhand der numerischen Modelldaten und verwendeten dann Reanalysedaten, um das Modell zu kalibrieren. Allerdings wurde festgestellt, dass der dritte Ansatz unter einem langfristigen Verzerrungsproblem leidet, bei dem die Vorhersageleistung mit zunehmender Anzahl von Vorhersagetagen nachlässt.


Um die oben genannten Probleme zu lösen, verwenden wir in dieser Studie die Generative Adversarial Networks (GANs), um das physikalische Wissen aus den historischen Beobachtungsdaten auf die Daten des numerischen Modells zu übertragen, wie in Abb. 1 dargestellt. Im Unterschied zu herkömmlichen numerischen Modellen kann die vorgeschlagene Methode den physikalischen Teil der Daten des numerischen Modells korrigieren, um die Vorhersageleistung zu verbessern. Genauer gesagt haben wir, wie in Abb. 2 dargestellt, zuerst die physikalischen Merkmale aus den Beobachtungsdaten ermittelt, indem wir ein vorheriges Netzwerkmodell verwendet haben, das aus einem Encoder und einem GAN besteht. Danach haben wir die physikalisch verbesserten SST erhalten, indem wir die Daten des numerischen Modells in das vorab trainierte Modell eingespeist haben. Anschließend wurden die physikalisch verbesserten SST übernommen, um ein räumlich-zeitliches Modell zur Vorhersage der SST zu trainieren. In der Zwischenzeit haben wir Ablationsexperimente durchgeführt, um die neu generierten Daten voll auszunutzen.


Die wichtigsten Beiträge dieses Papiers sind dreifacher Natur:


• Nach bestem Wissen sind wir die Ersten, die durch die Verwendung von GANs zur SST-Vorhersage physikalisches Wissen aus den historischen Beobachtungsdaten auf die Daten numerischer Modelle übertragen.


• Die Unterschiede zwischen den auf physikalischem Wissen basierenden, verbesserten Daten und den vorhergesagten Ergebnissen wurden genutzt, um die Gewichtung des Modells während des Trainings anzupassen.


• Die experimentellen Ergebnisse zeigen, dass unsere vorgeschlagene Methode den Mangel an physikalischem Wissen im numerischen Modell schließen und die Vorhersagegenauigkeit verbessern kann.


Der Rest des Dokuments ist wie folgt gegliedert. Abschnitt II stellt die Literaturübersicht zu unserer Methode vor, während unser Methodendesign in Abschnitt III detailliert beschrieben wird. Anschließend werden die experimentellen Ergebnisse in Abschnitt IV gezeigt. Abschnitt V schließt dieses Dokument schließlich ab.