paint-brush
Deniz Yüzeyi Sıcaklığı Tahmini için Derin Sinir Ağı: Deneysel Sonuçlar ve Analizile@oceanography
210 okumalar

Deniz Yüzeyi Sıcaklığı Tahmini için Derin Sinir Ağı: Deneysel Sonuçlar ve Analiz

Çok uzun; Okumak

Bu yazıda araştırmacılar, fiziksel bilgiyi tarihsel gözlemlerden sayısal modellere aktararak SST tahminini geliştirmektedir.
featured image - Deniz Yüzeyi Sıcaklığı Tahmini için Derin Sinir Ağı: Deneysel Sonuçlar ve Analiz
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Yazarlar:

(1) Yuxin Meng;

(2) Feng Gao;

(3) Eric Rigall;

(4) Ran Dong;

(5) Junyu Dong;

(6) Qian Du.

Bağlantı Tablosu

IV. DENEYSEL SONUÇLAR VE ANALİZ

A. Çalışma Alanı ve Deney Ayarları


Güney Çin Denizi, Çin anakarasının güneyinde, Batı Pasifik Okyanusunda yer almaktadır. Alanı yaklaşık 3,5 milyon kilometrekare olup ortalama derinliği 1.212 metredir. Bu yazıda seçilen çalışma alanı (3,99°K∼24,78°K, 98,4°D∼124,4°D)'dir.


Gözlemlenen veriler olarak GHRSST'den (Yüksek Çözünürlüklü Deniz Yüzeyi Sıcaklığı Grubu) [55] yüksek çözünürlüklü uydu uzaktan algılama verilerini kullanıyoruz. GHRSST, uydu alanı koordinatları, ızgaralı veriler ve aralıksız ızgaralı ürünler dahil olmak üzere çeşitli deniz yüzeyi sıcaklığı verileri sağlar. Burada, tamamlayıcı uydu ve yerinde gözlemlerin Optimal İnterpolasyon çerçevesinde birleştirilmesiyle oluşturulan boşluksuz ızgaralı ürünleri kullandık. Sayısal model olarak HYCOM [56] seçilmiştir. Uzaysal çözünürlükleri sırasıyla 1/20°×1/20° ve 1/12°×1/12°'dir. Zamansal çözümleme bir gündür. Mayıs 2007'den Aralık 2013'e kadar olan veriler eğitim için kullanılırken, Ocak 2014'ten Aralık 2014'e kadar kalan veriler test için kullanıldı. GHRSST tarafından sağlanan bulutsuz verileri kullandığımızı belirtmek gerekir. Veriler, bulutların arasından geçebilen mikrodalga cihazlarıyla yakalandı. Bu nedenle veriler çalışma alanını tam olarak kapsamaktadır. Ayrıca GHRSST SST ürünündeki her pikselin doğru zamanı aynıdır.


Ön işleme için Z-puanı standardizasyonu şu şekilde kullanıldı:



burada x, GHRSST ve HYCOM modeli SST'yi, z normalleştirilmiş verileri, µ ve σ sırasıyla ortalama değeri ve standart sapmayı belirtir. Verileri 256×256 kare şeklinde ısı haritalarına dönüştürdük.


Daha spesifik olarak, GHRSST verileri ve 512 boyutlu rastgele vektör, önceki ağ eğitiminin ilk adımında kullanılır. Giriş GHRSST verilerinin boyutu N × H × W'dir; burada N toplu iş boyutunu temsil eder, H giriş verilerinin yüksekliğini ve W giriş verilerinin genişliğini belirtir. Önceki ağın ikinci aşamasında, kodlayıcı eğitimi için yalnızca GHRSST verilerini kullanıyoruz. Her iki aşama için giriş ve çıkış boyutları N × Y × G'dir. Benzer şekilde, önceki ağ eğitiminin üçüncü adımında HYCOM SST verileri, önceden eğitilmiş modele beslenir. Burada hem girişlerin hem de çıkışların boyutları N × H × W'dir. Uygulamalarımızda N'yi 2430, H ve W'nin her ikisini de 256 olarak ayarladık.


Şekil 3. Ablasyon çalışmasında kullanılan üç modelin gösterimi. (a) Şema A: Sayısal model SST verileri ilk önce ConvLSTM'ye beslenir ve ardından çıktı, iyi eğitilmiş önceki ağa beslenir. Önceki ağ ve ConvLSTM sırası değiştirilir. (b) Şema B: Önceki ağ iyi eğitilmemişti. Özellikle, önceki ağdaki GAN modeli eğitimi ihmal edilmiştir. (c) Önerilen yöntem.


8 GPU'lu NVIDIA GeForce 2080Ti üzerinde kapsamlı deneyler yaptık. Önceki ağ, geçmiş gözlemlenen verilerden fiziksel bilgiyi elde etmek için [53]'te bahsedilen aynı ağ yapısını ve konfigürasyonunu kullanır. Daha sonra elde edilen fiziksel bilgi, sayısal modeldeki hatalı bileşenlerin onarılması ve iyileştirilmesi amacıyla sayısal model verilerine aktarılır. Bu yazıda kullanılan ConvLSTM modelinin konfigürasyonu Shi'nin çalışmasındaki ConvLSTM modeliyle aynıdır [20]. GHRSST SST veri seti, bu yazıda karşılaştırma ve değerlendirme için referans noktası olarak kullanılmıştır.


B. Geçmiş Gün Sayısının SST Tahminine Etkileri


Bölüm III'te belirtildiği gibi. C, t tahmin için kullanılan geçmiş günlerin sayısını belirtir. SST tahmin performansını etkileyebilecek kritik bir parametredir. Bu yazıda bir sonraki bir günlük, üç günlük ve yedi günlük SST'yi tahmin etmeye çalışıyoruz. Bulmak için kapsamlı deneyler uyguladık.


TABLO I SONRAKİ BİR GÜNLÜK SST TAHMİNİ İÇİN FARKLI SAYIDA GEÇMİŞ GÜNLERİN DENEYSEL SONUÇLARI


TABLO II SONRAKİ ÜÇ GÜNLÜK SST TAHMİNİ İÇİN FARKLI SAYIDA GEÇMİŞ GÜNLERİN DENEYSEL SONUÇLARI


TABLO III SONRAKİ YEDİ GÜNLÜK SST TAHMİNİ İÇİN FARKLI SAYIDA GEÇMİŞ GÜNLERİN DENEYSEL SONUÇLARI


Gelecekteki SST tahmini için uygun sayıda geçmiş gün. Değerlendirme kriteri olarak Ortalama Karekök Hata (RMSE) ve belirleme katsayısı (R2) uygulanır. Daha düşük RMSE ve daha yüksek R2 değerleri daha doğru sonuçları gösterir.


Tablo I'de geçmiş bir günün, üç günün ve beş günün verileri ayrı ayrı kullanılarak bir sonraki güne ait tahmin sonuçları listelenmektedir. Önerilen modelin, RMSE ve R2 sonuçlarının sırasıyla 0,3618 ve 0,9967 olduğu son beş günün verileri kullanıldığında en iyi performansı gösterdiği gözlemlenebilir. Diğer programlardan biraz daha iyidirler. Diğer iki şemayla karşılaştırıldığında RMSE ve R2 değerleri 0,0086, 0,001 ve 0,0028, 0,0006 oranında iyileşiyor. Bu nedenle, bir sonraki bir günlük SST tahmini için son beş günün verileri benimsenmiştir.


Tablo II'de sonraki üç günlük SST tahmini için t'nin etkilerini analiz ediyoruz. Ne kadar uzun geçmiş veriler kullanılırsa o kadar iyi tahmin performansı elde edildiği görülmektedir. Son yedi günün verilerini kullanan RMSE değeri en iyi performansı elde ediyor. Son beş günün verileriyle karşılaştırıldığında 0,0025 oranında iyileşme görüldü. Bu arada R2, diğer iki şemayla karşılaştırıldığında son yedi günün verilerini kullanarak en iyi performansı gösteriyor. Bu nedenle sonraki üç günlük SST tahmini için son yedi günün verileri kullanıldı.


Sonraki yedi günlük SST tahmininin deneysel sonuçları Tablo III'te gösterilmektedir. Görüldüğü gibi son on günün verilerini kullanan tahmin sonuçları en iyi performansı elde etmektedir. Bu nedenle, sonraki yedi günlük SST tahmini için son on günün verilerini kullanıyoruz.


TABLO IV 10 RASTGELE ÇALIŞMA ÜZERİNDE ORTALAMA ALINAN ABLASYON ÇALIŞMALARININ DENEYSEL SONUÇLARI (ORTALAMA±STD)


C. Ablasyon Çalışması


Önceki ağın ve GAN eğitiminin etkinliğini doğrulamak için ablasyon deneyleri yapıyoruz. Şekil 3'te gösterildiği gibi, karşılaştırma amacıyla iki değişken aşağıdaki şekilde tasarlanmıştır:


• Şema A. Önceki ağ ve ConvLSTM sırası değiştirilir. Sayısal model SST verileri ilk önce ConvLSTM'ye beslenir ve ardından çıktı, iyi eğitilmiş önceki ağa beslenir.


• Şema B. Önceki ağ iyi eğitilmemişti. Spesifik olarak, önceki ağ eğitimindeki GAN modeli eğitimi (Şekil 2'deki ilk adım) ihmal edilmiştir.


Deney sonuçları Tablo IV'te gösterilmektedir. Görüldüğü gibi yöntemimiz en iyi RMSE ve R2 değerlerine ulaşmaktadır. Spesifik olarak önerilen yöntem, önceki ağ ve ConvLSTM'nin doğru sırasının SST tahmin performansını artırabileceğini gösteren Şema A'dan daha iyi performans göstermektedir. Önceki ağın sayısal model verilerinin yanlış bileşenlerini etkili bir şekilde geri yüklediği ve geri yüklenen verilerin SST tahmininde daha iyi performans gösterdiği açıktır. Ayrıca önerilen yöntemin Şema B'ye göre üstün performansı vardır ve bu da GAN modellemesinin önemli bir adım olduğunu göstermektedir. GAN modelleme, gözlemlenen SST'nin veri dağılımını öğrenebilir ve önceki ağın, gözlemlenen SST'den daha iyi fiziksel bilgi yakalamasına yardımcı olur. Özetlemek gerekirse, önerilen yöntemde, fiziksel bilgiyi gözlemlenen SST verilerinden önceki ağa etkili bir şekilde aktarabilen önceki ağ ön eğitimi için çekişmeli öğrenmeyi kullanıyoruz. Hızlı eğitim yakınsamasına rehberlik edebilir ve SST tahmin performansını iyileştirebilir.


D. Deneysel Sonuçlar ve Tartışma


Şekil 4, tahmin edilen sonraki bir günlük SST'yi gözlemlenen yer gerçeği verileriyle karşılaştırmaktadır. Yöntemimizin tahmin edilen sonuçlarının gözlemlenen verilerle iyi bir şekilde eşleştiğini görebiliriz. Benzer şekilde, sonraki üç gün ve yedi gün için gözlemlenen veriler ve karşılık gelen tahmin edilen SST, sırasıyla Şekil 5 ve Şekil 6'da gösterilmektedir. Görselleştirilen sonuçlar, önerilen yöntemin SST tahmini için sağlam ve güvenilir sonuçlar üretebileceğini göstermektedir.


Bir sonraki gün için SST tahmininin dağılım grafiği Şekil 7'de gösterilmektedir. Veri noktalarının şu şekilde olduğu gözlemlenebilir:


Şekil 4. Sonraki bir günlük SST tahmin sonuçlarının gözlemlenen temel gerçek verileriyle karşılaştırılması.


Şekil 5. Sonraki üç günlük SST tahmin sonuçlarının gözlemlenen temel gerçek verileriyle karşılaştırılması.


Şekil 6. Sonraki yedi günlük SST tahmin sonuçlarının gözlemlenen temel gerçek verileriyle karşılaştırılması.


Şekil 7. Bir sonraki bir günlük SST tahminini karşılık gelen gözlemlenen verilerle karşılaştıran dağılım grafiği


Şekil 8. Sonraki üç günlük SST tahminini ilgili gözlemlenen verilerle karşılaştıran dağılım grafiği


kırmızı çizginin yakınında kabaca eşit olarak dağılmıştır. Şekil 8 ve Şekil 9, sırasıyla önümüzdeki üç güne ve sonraki yedi güne ait tahmin sonuçlarının dağılım grafikleridir. Saçılma grafikleri, önerilen yöntemin SST tahmini için etkinliğini göstermektedir.


Önerilen yöntemin etkinliğini doğrulamak için önerilen yöntemi birbiriyle yakından ilişkili yedi yöntemle karşılaştırıyoruz: ConvLSTM [20], Hybrid-NN [14], Hybrid-TL [15], Gen-END [57], VAE- GAN [58], Tra-NM ve Tra-ASL. Bu yöntemler için çalışma alanı (3,99°K∼24,78°K, 98,4°D∼ 124,4°D)'dir. Bu yöntemlerin tamamında sonraki 1 günlük tahmin için son 5 günün eğitim verileri, sonraki 3 günlük tahmin için geçmiş 7 günün verileri ve sonraki 7 gün için de geçmiş 10 günün verileri kullanıldı. tahmin.


ConvLSTM Bölüm III'te tartışılmaktadır. C ve SST tahmini için etkili bir uzaysal-zamansal modeldir. HybridNN, derin sinir ağlarının eğitimine rehberlik etmek için gözlemlenen veriler ile sayısal model verileri arasındaki tutarsızlığı kullanır. Hibrit-TL, sayısal modellerin ve sinir ağlarının avantajlarını transfer öğrenimi yoluyla birleştirir. GenEND, SST tahmini için kullanılabilecek üretken bir kodlayıcıdır. VAE-GAN değişken otomatik kodlayıcıyı entegre eder ve


Şekil 9. Sonraki yedi günlük SST tahminini ilgili gözlemlenen verilerle karşılaştıran dağılım grafiği


GAN ve SST tahmini için üst düzey anlamsal özellikleri yakalayabilir. HYCOM SST verileri, ConvLSTM modelini sonraki 1 günlük, 3 günlük ve 7 günlük tahmin (Tra-NM olarak adlandırılır) için eğitmek için kullanılır. Tra-ASL geleneksel bir asimilasyon yöntemidir ve birden fazla veri türü (gözlenen veriler ve sayısal model verileri) arasındaki korelasyonlardan yararlanır.


GHRSST verileri ilk olarak temel olarak hizmet veren bir ConvLSTM modelini eğitmek için kullanılır. SST tahmini için yaygın olarak kullanılan veriye dayalı bir yaklaşımdır. Hybrid-NN, HybridTL, Gen-END ve VAE-GAN, eğitim için GHRSST ve HYCOM verilerini kullanır. HYCOM asimilasyon verileri [56]


FARKLI YÖNTEMLERE AİT TABLO VSST TAHMİN SONUÇLARI


Şekil 10. Sonraki bir günlük SST tahmininin görselleştirilmiş sonuçları.


Şekil 11. Sonraki üç günlük SST tahmininin görselleştirilmiş sonuçları. İlk sütun tahmin edilen SST'nin sonuçlarını gösterir. Gözlemlenen gerçek SST verileri ikinci sütunda gösterilmektedir. Farklarını üçüncü sütunda sunuyoruz.


burada 1/12°×1/12° uzaysal çözünürlükle kullanılır. Yöntemimiz, geçmişte gözlemlenen verilerden fiziksel bilgi sunarak sayısal model verilerindeki yanlış bileşenleri iyileştirir ve düzeltir. Düzeltilmiş sayısal model verilerine fizikle geliştirilmiş veriler denir. Fizikle geliştirilmiş verilerle karşılaştırmak için, HYCOM asimilasyon verileri (Tra-ASL) ve HYCOM verileri (Tra-NM), ConvLSTM modelini eğitmek için benzer şekilde kullanılır.


Sonraki 1 günlük, 3 günlük ve 7 günlük tahminler için ConvLSTM, Hybrid-NN, Tra-NM ve Tra-ASL'nin eğitim süreleri sırasıyla 1,8, 4,4 ve 8,2 saattir. Hybrid-TL yöntemi ConvLSTM modelini iki kez eğitmiştir ve eğitim süresi üç görev için sırasıyla 3,6, 8,8 ve 16,4 saattir. VAE-GAN, eğitim için 181,6, 184,2 ve 188,4 saat gerektirirken Gen-END yöntemi, üç SST tahmin görevi için sırasıyla 196,8, 199,3 ve 203,2 saat ile neredeyse aynı miktarda süre gerektirir.


Sonraki 1 günlük, 3 günlük ve 7 günlük SST tahmininin sonuçları Tablo V'de sunulmaktadır. TraNM yönteminin diğer yöntemlere göre tatmin edici olmayan sonuçlar verdiği açıktır. Bunun nedeni muhtemelen HYCOM verilerindeki SST tahmin performansını olumsuz yönde etkileyen yanlış bileşenlerdir. Hibrit-NN yöntemi de ortalama RMSE değerleri modeller arasında ikinci en düşük değere sahip olduğundan kötü performans gösteriyor. Hibrit-TL modeli, sonraki 1 günlük SST tahmini için ConvLSTM'den daha iyi performans gösterir ancak diğer iki görev için bu performansı göstermez. Yöntemimiz en iyi RMSE değerlerine ve en yüksek R2 değerlerine ulaşmaktadır. ConvLSTM modeliyle karşılaştırıldığında yöntemimizin ortalama RMSE değerleri etkili bir şekilde iyileştirildi. Bu, fiziksel bilginin tanıtıldığını göstermektedir.


Şekil 12. Sonraki yedi günlük SST tahmininin görselleştirilmiş sonuçları. İlk satır, tahmin edilen SST'nin sonuçlarını gösterir. Gözlemlenen gerçek SST verileri ikinci satırda gösterilmektedir. Üçüncü sırada farklılıklarını sunuyoruz.


Gözlemlenen verilerden yararlanılması, sayısal model verilerindeki yanlış bileşenleri geri yükleyebilir, böylece SST tahmin doğruluğunu artırabilir.


Şekil 10, sırasıyla bir sonraki bir günlük SST tahmini için görselleştirilmiş sonuçları, gözlemlenen SST verilerini ve bunların farklılıklarını sunmaktadır. Tahmin edilen sonuçların, Güney Çin Denizi'nin tamamında gözlemlenen SST verilerine oldukça benzer olduğu görülmektedir. Şekil 11, sonraki üç günlük SST tahmininin görselleştirilmiş sonuçlarını göstermektedir. Tonkin Körfezi ile Güney Çin Denizi'nin diğer marjinal bölgelerinde bazı önemli farklılık değerlerinin olduğu görülmektedir. Şekil 12, sonraki yedi günlük SST tahmininin görselleştirilmiş sonuçlarını göstermektedir. Gelecek yedi günlük tahmin için en büyük fark değerlerinin ağırlıklı olarak Tonkin Körfezi'nde yoğunlaştığı ve diğer iki görevin sonuçlarından daha büyük olduğu bulunmuştur.


E. Sınırlama ve Tartışma


Şekil 7'den Şekil 9'a kadar, Şekil 13'te görselleştirilen orta aralık SST'de bazı yanlışlıklar olduğu gözlemlenebilir. Parlak pikseller büyük SST tahmin hatalarını gösterirken, koyu pikseller doğru SST tahminlerini belirtir. Görülebileceği gibi bu noktalar esas olarak, tahmin edilen deniz yüzeyi sıcaklığının gözlemlenen verilerden daha düşük olduğu Tayvan Boğazı'nın kuzeybatı kesiminde yer almaktadır. Tahmin hatası esas olarak ConvLSTM modelinden ve arazi maskesinden kaynaklanmaktadır. Uygulamalarımızda çalışma alanına arazi maskesi uygulanmaktadır. ConvLSTM tüm çalışma alanının mekansal ve zamansal özelliklerinden yararlanır. Tayvan Boğazı'nın kuzeybatı kısmının özellikleri kara maskesinden bir dereceye kadar etkileniyor ve bu nedenle tahmin hatalarına neden oluyor. Daha yüksek çözünürlüklü eğitim verileri elde edilebilirse bu bölgedeki tahminlerin doğruluğu daha da artacaktır.


Şekil 13. SST tahmin hatasının görselleştirilmesi.


Şekil 11 ve 12'de kurşun günüyle birlikte hatalarda önemli bir artış olmadığı görülmektedir. Bunun nedeni, yöntemimizin yeterli miktarda eğitim verisi kullanması ve derin sinir ağlarının zamansal özellikleri etkili bir şekilde yakalayabilmesi olabilir. Ayrıca SST'nin kalıcılığı da önemli bir faktördür.