Yazarlar:
(1) Yuxin Meng;
(2) Feng Gao;
(3) Eric Rigall;
(4) Ran Dong;
(5) Junyu Dong;
(6) Qian Du.
A. Çalışma Alanı ve Deney Ayarları
Güney Çin Denizi, Çin anakarasının güneyinde, Batı Pasifik Okyanusunda yer almaktadır. Alanı yaklaşık 3,5 milyon kilometrekare olup ortalama derinliği 1.212 metredir. Bu yazıda seçilen çalışma alanı (3,99°K∼24,78°K, 98,4°D∼124,4°D)'dir.
Gözlemlenen veriler olarak GHRSST'den (Yüksek Çözünürlüklü Deniz Yüzeyi Sıcaklığı Grubu) [55] yüksek çözünürlüklü uydu uzaktan algılama verilerini kullanıyoruz. GHRSST, uydu alanı koordinatları, ızgaralı veriler ve aralıksız ızgaralı ürünler dahil olmak üzere çeşitli deniz yüzeyi sıcaklığı verileri sağlar. Burada, tamamlayıcı uydu ve yerinde gözlemlerin Optimal İnterpolasyon çerçevesinde birleştirilmesiyle oluşturulan boşluksuz ızgaralı ürünleri kullandık. Sayısal model olarak HYCOM [56] seçilmiştir. Uzaysal çözünürlükleri sırasıyla 1/20°×1/20° ve 1/12°×1/12°'dir. Zamansal çözümleme bir gündür. Mayıs 2007'den Aralık 2013'e kadar olan veriler eğitim için kullanılırken, Ocak 2014'ten Aralık 2014'e kadar kalan veriler test için kullanıldı. GHRSST tarafından sağlanan bulutsuz verileri kullandığımızı belirtmek gerekir. Veriler, bulutların arasından geçebilen mikrodalga cihazlarıyla yakalandı. Bu nedenle veriler çalışma alanını tam olarak kapsamaktadır. Ayrıca GHRSST SST ürünündeki her pikselin doğru zamanı aynıdır.
Ön işleme için Z-puanı standardizasyonu şu şekilde kullanıldı:
burada x, GHRSST ve HYCOM modeli SST'yi, z normalleştirilmiş verileri, µ ve σ sırasıyla ortalama değeri ve standart sapmayı belirtir. Verileri 256×256 kare şeklinde ısı haritalarına dönüştürdük.
Daha spesifik olarak, GHRSST verileri ve 512 boyutlu rastgele vektör, önceki ağ eğitiminin ilk adımında kullanılır. Giriş GHRSST verilerinin boyutu N × H × W'dir; burada N toplu iş boyutunu temsil eder, H giriş verilerinin yüksekliğini ve W giriş verilerinin genişliğini belirtir. Önceki ağın ikinci aşamasında, kodlayıcı eğitimi için yalnızca GHRSST verilerini kullanıyoruz. Her iki aşama için giriş ve çıkış boyutları N × Y × G'dir. Benzer şekilde, önceki ağ eğitiminin üçüncü adımında HYCOM SST verileri, önceden eğitilmiş modele beslenir. Burada hem girişlerin hem de çıkışların boyutları N × H × W'dir. Uygulamalarımızda N'yi 2430, H ve W'nin her ikisini de 256 olarak ayarladık.
8 GPU'lu NVIDIA GeForce 2080Ti üzerinde kapsamlı deneyler yaptık. Önceki ağ, geçmiş gözlemlenen verilerden fiziksel bilgiyi elde etmek için [53]'te bahsedilen aynı ağ yapısını ve konfigürasyonunu kullanır. Daha sonra elde edilen fiziksel bilgi, sayısal modeldeki hatalı bileşenlerin onarılması ve iyileştirilmesi amacıyla sayısal model verilerine aktarılır. Bu yazıda kullanılan ConvLSTM modelinin konfigürasyonu Shi'nin çalışmasındaki ConvLSTM modeliyle aynıdır [20]. GHRSST SST veri seti, bu yazıda karşılaştırma ve değerlendirme için referans noktası olarak kullanılmıştır.
B. Geçmiş Gün Sayısının SST Tahminine Etkileri
Bölüm III'te belirtildiği gibi. C, t tahmin için kullanılan geçmiş günlerin sayısını belirtir. SST tahmin performansını etkileyebilecek kritik bir parametredir. Bu yazıda bir sonraki bir günlük, üç günlük ve yedi günlük SST'yi tahmin etmeye çalışıyoruz. Bulmak için kapsamlı deneyler uyguladık.
Gelecekteki SST tahmini için uygun sayıda geçmiş gün. Değerlendirme kriteri olarak Ortalama Karekök Hata (RMSE) ve belirleme katsayısı (R2) uygulanır. Daha düşük RMSE ve daha yüksek R2 değerleri daha doğru sonuçları gösterir.
Tablo I'de geçmiş bir günün, üç günün ve beş günün verileri ayrı ayrı kullanılarak bir sonraki güne ait tahmin sonuçları listelenmektedir. Önerilen modelin, RMSE ve R2 sonuçlarının sırasıyla 0,3618 ve 0,9967 olduğu son beş günün verileri kullanıldığında en iyi performansı gösterdiği gözlemlenebilir. Diğer programlardan biraz daha iyidirler. Diğer iki şemayla karşılaştırıldığında RMSE ve R2 değerleri 0,0086, 0,001 ve 0,0028, 0,0006 oranında iyileşiyor. Bu nedenle, bir sonraki bir günlük SST tahmini için son beş günün verileri benimsenmiştir.
Tablo II'de sonraki üç günlük SST tahmini için t'nin etkilerini analiz ediyoruz. Ne kadar uzun geçmiş veriler kullanılırsa o kadar iyi tahmin performansı elde edildiği görülmektedir. Son yedi günün verilerini kullanan RMSE değeri en iyi performansı elde ediyor. Son beş günün verileriyle karşılaştırıldığında 0,0025 oranında iyileşme görüldü. Bu arada R2, diğer iki şemayla karşılaştırıldığında son yedi günün verilerini kullanarak en iyi performansı gösteriyor. Bu nedenle sonraki üç günlük SST tahmini için son yedi günün verileri kullanıldı.
Sonraki yedi günlük SST tahmininin deneysel sonuçları Tablo III'te gösterilmektedir. Görüldüğü gibi son on günün verilerini kullanan tahmin sonuçları en iyi performansı elde etmektedir. Bu nedenle, sonraki yedi günlük SST tahmini için son on günün verilerini kullanıyoruz.
C. Ablasyon Çalışması
Önceki ağın ve GAN eğitiminin etkinliğini doğrulamak için ablasyon deneyleri yapıyoruz. Şekil 3'te gösterildiği gibi, karşılaştırma amacıyla iki değişken aşağıdaki şekilde tasarlanmıştır:
• Şema A. Önceki ağ ve ConvLSTM sırası değiştirilir. Sayısal model SST verileri ilk önce ConvLSTM'ye beslenir ve ardından çıktı, iyi eğitilmiş önceki ağa beslenir.
• Şema B. Önceki ağ iyi eğitilmemişti. Spesifik olarak, önceki ağ eğitimindeki GAN modeli eğitimi (Şekil 2'deki ilk adım) ihmal edilmiştir.
Deney sonuçları Tablo IV'te gösterilmektedir. Görüldüğü gibi yöntemimiz en iyi RMSE ve R2 değerlerine ulaşmaktadır. Spesifik olarak önerilen yöntem, önceki ağ ve ConvLSTM'nin doğru sırasının SST tahmin performansını artırabileceğini gösteren Şema A'dan daha iyi performans göstermektedir. Önceki ağın sayısal model verilerinin yanlış bileşenlerini etkili bir şekilde geri yüklediği ve geri yüklenen verilerin SST tahmininde daha iyi performans gösterdiği açıktır. Ayrıca önerilen yöntemin Şema B'ye göre üstün performansı vardır ve bu da GAN modellemesinin önemli bir adım olduğunu göstermektedir. GAN modelleme, gözlemlenen SST'nin veri dağılımını öğrenebilir ve önceki ağın, gözlemlenen SST'den daha iyi fiziksel bilgi yakalamasına yardımcı olur. Özetlemek gerekirse, önerilen yöntemde, fiziksel bilgiyi gözlemlenen SST verilerinden önceki ağa etkili bir şekilde aktarabilen önceki ağ ön eğitimi için çekişmeli öğrenmeyi kullanıyoruz. Hızlı eğitim yakınsamasına rehberlik edebilir ve SST tahmin performansını iyileştirebilir.
D. Deneysel Sonuçlar ve Tartışma
Şekil 4, tahmin edilen sonraki bir günlük SST'yi gözlemlenen yer gerçeği verileriyle karşılaştırmaktadır. Yöntemimizin tahmin edilen sonuçlarının gözlemlenen verilerle iyi bir şekilde eşleştiğini görebiliriz. Benzer şekilde, sonraki üç gün ve yedi gün için gözlemlenen veriler ve karşılık gelen tahmin edilen SST, sırasıyla Şekil 5 ve Şekil 6'da gösterilmektedir. Görselleştirilen sonuçlar, önerilen yöntemin SST tahmini için sağlam ve güvenilir sonuçlar üretebileceğini göstermektedir.
Bir sonraki gün için SST tahmininin dağılım grafiği Şekil 7'de gösterilmektedir. Veri noktalarının şu şekilde olduğu gözlemlenebilir:
kırmızı çizginin yakınında kabaca eşit olarak dağılmıştır. Şekil 8 ve Şekil 9, sırasıyla önümüzdeki üç güne ve sonraki yedi güne ait tahmin sonuçlarının dağılım grafikleridir. Saçılma grafikleri, önerilen yöntemin SST tahmini için etkinliğini göstermektedir.
Önerilen yöntemin etkinliğini doğrulamak için önerilen yöntemi birbiriyle yakından ilişkili yedi yöntemle karşılaştırıyoruz: ConvLSTM [20], Hybrid-NN [14], Hybrid-TL [15], Gen-END [57], VAE- GAN [58], Tra-NM ve Tra-ASL. Bu yöntemler için çalışma alanı (3,99°K∼24,78°K, 98,4°D∼ 124,4°D)'dir. Bu yöntemlerin tamamında sonraki 1 günlük tahmin için son 5 günün eğitim verileri, sonraki 3 günlük tahmin için geçmiş 7 günün verileri ve sonraki 7 gün için de geçmiş 10 günün verileri kullanıldı. tahmin.
ConvLSTM Bölüm III'te tartışılmaktadır. C ve SST tahmini için etkili bir uzaysal-zamansal modeldir. HybridNN, derin sinir ağlarının eğitimine rehberlik etmek için gözlemlenen veriler ile sayısal model verileri arasındaki tutarsızlığı kullanır. Hibrit-TL, sayısal modellerin ve sinir ağlarının avantajlarını transfer öğrenimi yoluyla birleştirir. GenEND, SST tahmini için kullanılabilecek üretken bir kodlayıcıdır. VAE-GAN değişken otomatik kodlayıcıyı entegre eder ve
GAN ve SST tahmini için üst düzey anlamsal özellikleri yakalayabilir. HYCOM SST verileri, ConvLSTM modelini sonraki 1 günlük, 3 günlük ve 7 günlük tahmin (Tra-NM olarak adlandırılır) için eğitmek için kullanılır. Tra-ASL geleneksel bir asimilasyon yöntemidir ve birden fazla veri türü (gözlenen veriler ve sayısal model verileri) arasındaki korelasyonlardan yararlanır.
GHRSST verileri ilk olarak temel olarak hizmet veren bir ConvLSTM modelini eğitmek için kullanılır. SST tahmini için yaygın olarak kullanılan veriye dayalı bir yaklaşımdır. Hybrid-NN, HybridTL, Gen-END ve VAE-GAN, eğitim için GHRSST ve HYCOM verilerini kullanır. HYCOM asimilasyon verileri [56]
burada 1/12°×1/12° uzaysal çözünürlükle kullanılır. Yöntemimiz, geçmişte gözlemlenen verilerden fiziksel bilgi sunarak sayısal model verilerindeki yanlış bileşenleri iyileştirir ve düzeltir. Düzeltilmiş sayısal model verilerine fizikle geliştirilmiş veriler denir. Fizikle geliştirilmiş verilerle karşılaştırmak için, HYCOM asimilasyon verileri (Tra-ASL) ve HYCOM verileri (Tra-NM), ConvLSTM modelini eğitmek için benzer şekilde kullanılır.
Sonraki 1 günlük, 3 günlük ve 7 günlük tahminler için ConvLSTM, Hybrid-NN, Tra-NM ve Tra-ASL'nin eğitim süreleri sırasıyla 1,8, 4,4 ve 8,2 saattir. Hybrid-TL yöntemi ConvLSTM modelini iki kez eğitmiştir ve eğitim süresi üç görev için sırasıyla 3,6, 8,8 ve 16,4 saattir. VAE-GAN, eğitim için 181,6, 184,2 ve 188,4 saat gerektirirken Gen-END yöntemi, üç SST tahmin görevi için sırasıyla 196,8, 199,3 ve 203,2 saat ile neredeyse aynı miktarda süre gerektirir.
Sonraki 1 günlük, 3 günlük ve 7 günlük SST tahmininin sonuçları Tablo V'de sunulmaktadır. TraNM yönteminin diğer yöntemlere göre tatmin edici olmayan sonuçlar verdiği açıktır. Bunun nedeni muhtemelen HYCOM verilerindeki SST tahmin performansını olumsuz yönde etkileyen yanlış bileşenlerdir. Hibrit-NN yöntemi de ortalama RMSE değerleri modeller arasında ikinci en düşük değere sahip olduğundan kötü performans gösteriyor. Hibrit-TL modeli, sonraki 1 günlük SST tahmini için ConvLSTM'den daha iyi performans gösterir ancak diğer iki görev için bu performansı göstermez. Yöntemimiz en iyi RMSE değerlerine ve en yüksek R2 değerlerine ulaşmaktadır. ConvLSTM modeliyle karşılaştırıldığında yöntemimizin ortalama RMSE değerleri etkili bir şekilde iyileştirildi. Bu, fiziksel bilginin tanıtıldığını göstermektedir.
Gözlemlenen verilerden yararlanılması, sayısal model verilerindeki yanlış bileşenleri geri yükleyebilir, böylece SST tahmin doğruluğunu artırabilir.
Şekil 10, sırasıyla bir sonraki bir günlük SST tahmini için görselleştirilmiş sonuçları, gözlemlenen SST verilerini ve bunların farklılıklarını sunmaktadır. Tahmin edilen sonuçların, Güney Çin Denizi'nin tamamında gözlemlenen SST verilerine oldukça benzer olduğu görülmektedir. Şekil 11, sonraki üç günlük SST tahmininin görselleştirilmiş sonuçlarını göstermektedir. Tonkin Körfezi ile Güney Çin Denizi'nin diğer marjinal bölgelerinde bazı önemli farklılık değerlerinin olduğu görülmektedir. Şekil 12, sonraki yedi günlük SST tahmininin görselleştirilmiş sonuçlarını göstermektedir. Gelecek yedi günlük tahmin için en büyük fark değerlerinin ağırlıklı olarak Tonkin Körfezi'nde yoğunlaştığı ve diğer iki görevin sonuçlarından daha büyük olduğu bulunmuştur.
E. Sınırlama ve Tartışma
Şekil 7'den Şekil 9'a kadar, Şekil 13'te görselleştirilen orta aralık SST'de bazı yanlışlıklar olduğu gözlemlenebilir. Parlak pikseller büyük SST tahmin hatalarını gösterirken, koyu pikseller doğru SST tahminlerini belirtir. Görülebileceği gibi bu noktalar esas olarak, tahmin edilen deniz yüzeyi sıcaklığının gözlemlenen verilerden daha düşük olduğu Tayvan Boğazı'nın kuzeybatı kesiminde yer almaktadır. Tahmin hatası esas olarak ConvLSTM modelinden ve arazi maskesinden kaynaklanmaktadır. Uygulamalarımızda çalışma alanına arazi maskesi uygulanmaktadır. ConvLSTM tüm çalışma alanının mekansal ve zamansal özelliklerinden yararlanır. Tayvan Boğazı'nın kuzeybatı kısmının özellikleri kara maskesinden bir dereceye kadar etkileniyor ve bu nedenle tahmin hatalarına neden oluyor. Daha yüksek çözünürlüklü eğitim verileri elde edilebilirse bu bölgedeki tahminlerin doğruluğu daha da artacaktır.
Şekil 11 ve 12'de kurşun günüyle birlikte hatalarda önemli bir artış olmadığı görülmektedir. Bunun nedeni, yöntemimizin yeterli miktarda eğitim verisi kullanması ve derin sinir ağlarının zamansal özellikleri etkili bir şekilde yakalayabilmesi olabilir. Ayrıca SST'nin kalıcılığı da önemli bir faktördür.
Bu makale arxiv'de CC 4.0 lisansı altında mevcuttur .