paint-brush
海面温度予測のためのディープニューラルネットワーク:実験結果と分析@oceanography
210 測定値

海面温度予測のためのディープニューラルネットワーク:実験結果と分析

長すぎる; 読むには

この論文では、研究者らは、過去の観測から得た物理的知識を数値モデルに移すことで、SST 予測を強化しています。
featured image - 海面温度予測のためのディープニューラルネットワーク:実験結果と分析
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

著者:

(1)孟宇新

(2)馮高

(3)エリック・リガル

(4)ラン・ドン

(5)董俊宇

(6)千度

リンク一覧

IV. 実験結果と分析

A. 研究地域と実験設定


南シナ海は中国本土南部の西太平洋に位置し、面積は約350万平方キロメートル、平均水深は1,212メートルです。本論文では、選択された研究領域は(3.99°N〜24.78°N、98.4°E〜124.4°E)です。


観測データとしては、GHRSST(高解像度海面水温グループ)[55]の高解像度衛星リモートセンシングデータを使用する。GHRSSTは、衛星スワス座標、グリッドデータ、ギャップフリーグリッド製品など、さまざまな海面水温データを提供する。ここでは、最適補間フレームワーク内で補完的な衛星観測と現場観測を組み合わせることで生成されるギャップフリーグリッド製品を採用した。数値モデルにはHYCOM [56]を選択した。その空間解像度は、それぞれ1/20°×1/20°と1/12°×1/12°である。時間解像度は1日である。2007年5月から2013年12月までのデータはトレーニングに使用され、残りの2014年1月から2014年12月までのデータはテストに使用されている。GHRSSTが提供する雲のないデータを使用していることに留意する必要がある。データは、雲を透過できるマイクロ波機器によってキャプチャされた。したがって、データは調査地域全体をカバーしています。さらに、GHRSST SST 製品の各ピクセルの正確な時間は同じです。


Z スコア標準化は次のように前処理に利用されました。



ここで、x は GHRSST と HYCOM モデルの SST、z は正規化されたデータ、µ と σ はそれぞれ平均値と標準偏差を表します。データを 256 × 256 の正方形のヒート マップに変換しました。


具体的には、事前ネットワーク トレーニングの最初のステップで、GHRSST データと 512 次元のランダム ベクトルが使用されます。入力 GHRSST データのサイズは N × H × W です。ここで、N はバッチ サイズ、H は入力データの高さ、W は入力データの幅を表します。事前ネットワークの 2 番目のステージでは、エンコーダー トレーニングに GHRSST データのみを使用します。両方のステージの入力と出力のサイズは N × H × W です。同様に、事前ネットワーク トレーニングの 3 番目のステップでは、HYCOM SST データが事前トレーニング済みモデルに入力されます。ここで、入力と出力の両方のサイズは N × H × W です。実装では、N を 2430 に設定し、H と W は両方とも 256 に設定しています。


図 3. アブレーション研究で使用された 3 つのモデルの図解。(a) スキーム A: 数値モデルの SST データが最初に ConvLSTM に入力され、次に出力が十分にトレーニングされた事前ネットワークに入力されます。事前ネットワークと ConvLSTM のシーケンスが置き換えられます。(b) スキーム B: 事前ネットワークは十分にトレーニングされていません。具体的には、事前ネットワークでの GAN モデルのトレーニングが省略されています。(c) 提案された方法。


我々は8つのGPUを搭載したNVIDIA GeForce 2080Tiで広範囲な実験を行った。このネットワークは[53]で述べたのと同じネットワーク構造と構成を使用して、過去の観測データから物理的な知識を獲得する。次に、得られた物理的な知識を数値モデルデータに転送し、数値モデル内の誤ったコンポーネントを復元して改善する。この論文で使用されているConvLSTMモデルの構成は、Shiの研究[20]のConvLSTMモデルと同じである。この論文では、GHRSST SSTデータセットを比較と評価のベンチマークとして利用している。


B. 過去日数による海面水温予測への影響


セクションIII.Cで述べたように、tは予測に使用される過去の日数を表します。これはSST予測のパフォーマンスに影響を与える重要なパラメータです。この論文では、今後1日、3日、7日間のSSTを予測します。


表 I 過去日数を変えた翌日の海面水温予測の実験結果


表 II 過去3日間の海面水温予測における異なる日数の実験結果


表 III 過去7日間の海面水温予測における異なる日数の実験結果


将来の SST 予測に適切な過去の日数。評価基準として、二乗平均平方根誤差 (RMSE) と決定係数 (R2) が適用されます。RMSE 値が低く、R2 値が高いほど、結果の精度が高くなります。


表 I は、過去 1 日、3 日、5 日のデータをそれぞれ使用して翌日の予測結果を一覧表示しています。提案モデルは過去 5 日間のデータを使用した場合に最もパフォーマンスが高く、RMSE と R2 の結果はそれぞれ 0.3618 と 0.9967 であることがわかります。これらは他の方式よりもわずかに優れています。他の 2 つの方式と比較すると、RMSE と R2 の値はそれぞれ 0.0086、0.001、0.0028、0.0006 向上しています。したがって、過去 5 日間のデータが次の 1 日間の SST 予測に採用されます。


表 II では、今後 3 日間の SST 予測に対する t の影響を分析しています。より長い履歴データを使用するほど、予測性能が向上することがわかります。過去 7 日間のデータを使用した RMSE 値が最高のパフォーマンスを達成しています。過去 5 日間のデータを使用した場合と比較して 0.0025 向上しています。一方、R2 は、過去 7 日間のデータを使用した場合、他の 2 つの方式と比較して最高のパフォーマンスを発揮します。したがって、過去 7 日間のデータが今後 3 日間の SST 予測に使用されました。


今後 7 日間の SST 予測の実験結果を表 III に示します。過去 10 日間のデータを使用した予測結果が最高のパフォーマンスを達成していることがわかります。したがって、今後 7 日間の SST 予測には過去 10 日間のデータを活用します。


表IV アブレーション研究の実験結果(平均±標準偏差)10回のランダム実行の平均


C. アブレーション研究


事前ネットワークと GAN トレーニングの有効性を検証するために、アブレーション実験を実施します。図 3 に示すように、比較のために次の 2 つのバリアントが設計されています。


• スキーム A.事前ネットワークと ConvLSTM のシーケンスが置き換えられます。数値モデルの SST データは最初に ConvLSTM に入力され、次に出力は十分にトレーニングされた事前ネットワークに入力されます。


• スキームB:事前ネットワークが十分にトレーニングされていません。具体的には、事前ネットワークトレーニングにおけるGANモデルのトレーニング(図2の最初のステップ)が省略されています。


実験結果を表IVに示します。ご覧のとおり、私たちの方法は最高のRMSEとR2値を達成しています。具体的には、提案方法はスキームAよりも優れており、事前ネットワークとConvLSTMの正しいシーケンスがSST予測パフォーマンスを高めることができることを示しています。事前ネットワークが数値モデルデータの誤ったコンポーネントを効果的に復元し、復元されたデータがSST予測でより優れたパフォーマンスを発揮することは明らかです。さらに、提案方法はスキームBよりも優れたパフォーマンスを発揮し、GANモデリングが重要なステップであることを示しています。GANモデリングは、観測されたSSTのデータ分布を学習でき、事前ネットワークが観測されたSSTからより優れた物理情報を取得できるようにします。要約すると、提案方法では、事前ネットワークの事前トレーニングに敵対的学習を使用し、観測されたSSTデータから事前ネットワークに物理的知識を効果的に転送できます。これにより、トレーニングの収束が速くなり、SST予測パフォーマンスが向上します。


D. 実験結果と考察


図 4 は、今後 1 日間の SST 予測値と観測された地上データを比較したものです。この方法の予測結果が観測データとよく一致していることがわかります。同様に、観測データと、今後 3 日間および 7 日間の対応する SST 予測値が、それぞれ図 5 と図 6 に表示されています。視覚化された結果は、提案された方法が SST 予測に堅牢で信頼性の高い結果を生成できることを示しています。


今後1日間のSST予測の散布図を図7に示す。データポイントは


図4. 今後1日間のSST予測結果と観測された地上真実データの比較。


図 5. 今後 3 日間の SST 予測結果と観測された地上真実データの比較。


図 6. 今後 7 日間の SST 予測結果と観測された地上真実データの比較。


図7. 翌日の海面水温予測と対応する観測データを比較した散布図


図8. 今後3日間のSST予測と対応する観測データを比較した散布図


赤い線の近くにほぼ均等に分布しています。図8と図9は、それぞれ今後3日間と今後7日間の予測結果の散布図です。散布図は、SST予測における提案手法の有効性を示しています。


提案手法の有効性を検証するために、提案手法を7つの密接に関連する手法であるConvLSTM [20]、Hybrid-NN [14]、Hybrid-TL [15]、Gen-END [57]、VAE-GAN [58]、Tra-NM、Tra-ASLと比較する。これらの手法の研究対象領域は(3.99°N〜24.78°N、98.4°E〜124.4°E)である。これらの手法はすべて、今後1日間の予測には過去5日間のトレーニングデータを使用し、今後3日間の予測には過去7日間のデータを、今後7日間の予測には過去10日間のデータを使用した。


ConvLSTMはセクションIII.Cで説明されており、SST予測に効果的な空間時間モデルです。HybridNNは、観測データと数値モデルデータ間の不一致を利用して、ディープニューラルネットワークのトレーニングをガイドします。Hybrid-TLは、転移学習を通じて数値モデルとニューラルネットワークの利点を組み合わせます。GenENDは、SST予測に使用できる生成エンコーダです。VAE-GANは、変分オートエンコーダと


図9. 今後7日間のSST予測と対応する観測データを比較した散布図


GAN は、SST 予測のための高レベルの意味的特徴を捉えることができます。HYCOM SST データは、今後 1 日、3 日、7 日の予測 (Tra-NM と呼ばれる) のための ConvLSTM モデルのトレーニングに使用されます。Tra-ASL は従来の同化手法であり、複数の種類のデータ (観測データと数値モデル データ) 間の相関関係を活用します。


GHRSSTデータは、まずベースラインとなるConvLSTMモデルのトレーニングに利用されます。これは、SST予測に広く使用されているデータ駆動型アプローチです。Hybrid-NN、HybridTL、Gen-END、VAE-GANは、GHRSSTとHYCOMデータをトレーニングに使用しています。HYCOM同化データ[56]


表 VSST 予測結果のさまざまな方法


図10 今後1日間のSST予測の視覚化結果。


図11。今後3日間のSST予測の視覚化された結果。最初の列は予測されたSSTの結果を示しています。地上で観測されたSSTデータは2列目に表示されます。3列目にそれらの差を示します。


ここでは、空間解像度 1/12°×1/12° のが使用されています。私たちの方法は、過去の観測データから得た物理的な知識を導入することで、数値モデル データ内の誤ったコンポーネントを改善し、修正します。修正された数値モデル データは、物理強化データと呼ばれます。物理強化データと比較するために、HYCOM 同化データ (Tra-ASL) と HYCOM データ (Tra-NM) が同様に ConvLSTM モデルのトレーニングに使用されます。


ConvLSTM、Hybrid-NN、Tra-NM、Tra-ASL の今後 1 日、3 日、7 日の予測のトレーニング時間は、それぞれ 1.8、4.4、8.2 時間です。Hybrid-TL 方式では、ConvLSTM モデルを 2 回トレーニングし、3 つのタスクのトレーニング時間はそれぞれ 3.6、8.8、16.4 時間です。VAE-GAN のトレーニングには 181.6、184.2、188.4 時間かかり、Gen-END 方式では、3 つの SST 予測タスクにそれぞれ 196.8、199.3、203.2 時間かかり、ほぼ同じ時間がかかります。


今後 1 日、3 日、7 日間の SST 予測の結果を表 V に示します。TraNM 法は他の方法に比べて満足のいく結果が得られないことがわかります。これは、HYCOM データ内の不正確なコンポーネントが原因である可能性が高く、これが SST 予測のパフォーマンスに悪影響を及ぼしています。Hybrid-NN 法もパフォーマンスが低く、平均 RMSE 値はモデルの中で 2 番目に低い値です。Hybrid-TL モデルは、今後 1 日の SST 予測では ConvLSTM よりも優れていますが、他の 2 つのタスクではそうではありません。私たちの方法は、最高の RMSE 値と最高の R2 値を達成しています。ConvLSTM モデルと比較して、私たちの方法の平均 RMSE 値は効果的に改善されています。これは、物理的な知識を導入することで、


図 12。今後 7 日間の SST 予測の視覚化された結果。最初の行は予測された SST の結果を示しています。地上で観測された SST データは 2 行目に表示されます。3 行目にはそれらの差を示します。


観測データから数値モデルデータ内の不正確な成分を復元できるため、SST予測の精度が向上します。


図 10 は、今後 1 日間の SST 予測、観測された SST データ、およびそれらの差異の視覚化結果をそれぞれ示しています。予測結果は、南シナ海全域にわたって観測された SST データと非常に類似していることがわかります。図 11 は、今後 3 日間の SST 予測の視覚化結果を示しています。トンキン湾と南シナ海の他の周辺領域で、いくつかの有意な差異値があることが観察されます。図 12 は、今後 7 日間の SST 予測の視覚化結果を示しています。今後 7 日間の予測では、主要な差異値が主にトンキン湾に集中しており、他の 2 つのタスクの結果よりも大きいことがわかります。


E. 制限と議論


図 7 から図 9 では、中程度の SST に若干の不正確さがあることがわかります。これは図 13 に視覚化されています。明るいピクセルは SST 予測誤差が大きいことを示し、暗いピクセルは正確な SST 予測を示します。ご覧のように、これらのポイントは主に台湾海峡の北西部に位置しており、予測された海面温度は観測データよりも低くなっています。予測誤差は主に ConvLSTM モデルと陸地マスクによって発生します。私たちの実装では、陸地マスクが研究領域に適用されます。ConvLSTM は、研究領域全体の空間的および時間的特徴を利用します。台湾海峡の北西部の特徴は、ある程度陸地マスクの影響を受けているため、予測誤差が発生します。より高解像度のトレーニング データを取得できれば、この地域の予測精度はさらに向上します。


図13. SST予測誤差の可視化。


図 11 と 12 では、リード日による誤差の大幅な増加がないことがわかります。これは、私たちの方法が十分な量のトレーニング データを使用し、ディープ ニューラル ネットワークが時間的特徴を効果的に捉えることができるためと考えられます。さらに、SST の持続性も重要な要素です。


この論文はCC 4.0ライセンスの下でarxivで公開されています