paint-brush
Deniz Yüzeyi Sıcaklığı Tahmini için Derin Sinir Ağı: Önerilen Yöntemile@oceanography
163 okumalar

Deniz Yüzeyi Sıcaklığı Tahmini için Derin Sinir Ağı: Önerilen Yöntem

Çok uzun; Okumak

Bu yazıda araştırmacılar, fiziksel bilgiyi tarihsel gözlemlerden sayısal modellere aktararak SST tahminini geliştirmektedir.
featured image - Deniz Yüzeyi Sıcaklığı Tahmini için Derin Sinir Ağı: Önerilen Yöntem
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Yazarlar:

(1) Yuxin Meng;

(2) Feng Gao;

(3) Eric Rigall;

(4) Ran Dong;

(5) Junyu Dong;

(6) Qian Du.

Bağlantı Tablosu

III. ÖNERİLEN YÖNTEM

Sayısal model, SST'nin mekansal dağılımını ve küresel telebağlantılarını birlikte tahmin edebilir. SST tahmini için kısa yollarda iyi performans gösterir. Bununla birlikte, gözlemlenen verilerden fiziksel bilginin aktarılmasının, SST tahmini için sayısal modelin performansını daha da artırabileceğini savunuyoruz. Bu amaçla, gözlemlenen verilerdeki fiziksel bilgiyi öğrenmek için GAN'ları benimsiyoruz.


Zhu ve diğerleri. [53] yalnızca girdi verilerini aslına uygun olarak yeniden yapılandırmakla kalmayıp aynı zamanda ters çevrilmiş gizli kodun anlamsal olarak anlamlı olmasını da sağlayan bir GAN ters çevirme yöntemi önerdi. Hedef görüntünün piksel değerlerinin öğrenilmesinin tek başına yetersiz olduğunu, öğrenilen özelliklerin görüntüyü anlamsal düzeyde temsil edemediğini ortaya koymuşlardır. Bu çalışmadan ilham alarak, GAN'da, önceki ağ olarak adlandırılan, gözlemlenen verilerden fiziksel bilgiyi öğrenecek bir kodlayıcı tasarladık. Bu önceki ağ, yalnızca hedefin gözlemlediği verilerin piksel değerlerini öğrenmekle kalmıyor, aynı zamanda fiziksel bilgileri de yakalıyor. SST tahmin doğruluğunu etkili bir şekilde artırır.


Daha sonra önerilen yöntemi şu şekilde sunuyoruz: 1) Yönteme genel bakış, 2) Önceki ağ, 3) Geliştirilmiş verilerle SST tahmini.


A. Yönteme Genel Bakış


Bu alt bölümde önerilen SST tahmin yöntemini özetliyoruz ve her aşamanın girdi ve çıktısını ayrıntılı olarak açıklıyoruz. Şekil 2'de gösterildiği gibi, önerilen SST tahmin yöntemi iki aşamadan oluşur: Önceki ağ eğitimi ve geliştirilmiş verilerle SST tahmini.


1) Önceki ağ eğitimi. Bu aşama üç adımdan oluşur. İlk adımda GAN modeli eğitimi için gözlemlenen SST (GHRST verileri) kullanılır. İkinci adımda kodlayıcıyı eğitmek için önceden eğitilmiş jeneratör ve GHRSST verileri kullanılır. Üçüncü adımda, önceden eğitilmiş jeneratör ve kodlayıcı önceki ağda birleştirilir. Önceki ağ, fiziksel bilgiyi gözlemlenen verilerden sayısal modele aktarmak için kullanılır. Daha sonra sayısal model SST (HYCOM verileri), özellik temsillerini geliştirmek için önceki ağa beslenir.


2) Gelişmiş verilerle SST tahmini. Fizikle geliştirilmiş veriler, SST tahmini için ConvLSTM modeline beslenir. Ertesi günün, sonraki 3 günün ve sonraki 7 günün SST'si ayrı ayrı tahmin edilir.


Mevcut çalışmaların çoğunun [26] [27] yalnızca ConvLSTM eğitimi için gözlemlenen verileri kullandığına dikkat edilmelidir. Buna karşılık, yöntemimiz ConvLSTM eğitimi için fizikle geliştirilmiş verilerden yararlanır. Daha sonra, önceki ağ eğitimini ve gelişmiş verilerle SST tahminini ayrıntılı olarak açıklıyoruz.


B. Aşama 1: Önceki Ağ Eğitimi


Gözlemlenen verilerdeki fiziksel bilgileri öğrenmek ve eğitim sonrasında anlamsal/fiziksel bilgilerini sabit tutmak için bir ön ağ oluşturuyoruz. Şekil 2'de gösterildiği gibi, önceki ağ eğitimi üç adımdan oluşur: GAN modeli eğitimi, kodlayıcı eğitimi ve fizikle geliştirilmiş veri üretimi. Daha sonra her adımın ayrıntılı açıklamalarını sunuyoruz.


GAN Modeli Eğitimi. GAN modeli, gözlemlenen SST'den veri dağılımını öğrenmek için kullanılır. Amaç fonksiyonu aşağıdaki gibidir:



GAN modelinin eğitim süreci Algoritma 1'de özetlenmiştir. G jeneratörü, gözlemlenen SST verilerinden fiziksel özellikleri yakalayana kadar modeli, gözlemlenen SST üzerinden eğitiyoruz.



burada F(·), VGG ağı aracılığıyla özellik çıkarımını temsil eder. VGG ağı, Visual Geometry Group [54] tarafından önerilen ağı temsil eder ve klasik bir derin evrişimli sinir ağıdır.


Kodlayıcı eğitimi Algoritma 2'de açıklanmıştır. Jeneratör G'nin parametreleri sabitlenirken, kodlayıcı E ve ayırıcı D'nin parametreleri Denklem 2'ye göre güncellenir. 2 ve Denk. sırasıyla 3.


Aşama 1'in motivasyonu, sayısal model verilerindeki yanlış bileşenleri düzeltebilecek bir ön ağ oluşturmaktır. Bu amaçla öncelikle gözlemlenen SST'den veri dağılımını yakalayan ve yüksek kaliteli SST verileri üretebilen bir GAN modeli tasarlıyoruz. Daha sonra kodlayıcı, oluşturulan gizli kodların gözlemlenen SST'deki anlamsal/fiziksel bilgileri koruduğunu garanti edecek şekilde eğitilir. Fiziksel bilgi önceki ağa gömülü olduğundan, çekişmeli öğrenme yoluyla önceki ağın (kodlayıcı ve üreteçten oluşan) girdi verilerindeki yanlış parçaları düzeltebileceğini savunuyoruz. Sonuç olarak, üçüncü adımda, sayısal model verileri önceki ağa beslendiğinde, gömülü fiziksel bilgi, sayısal model verilerindeki yanlış bileşenleri düzeltebilir.




C. Aşama 2: Gelişmiş Verilerle SST Tahmini


ConvLSTM uzaysal-zamansal verileri tahmin etmek için etkili bir araçtır. Hem girdiden duruma hem de durumdan duruma geçişlerde evrişimli blokları içeren tekrarlayan bir sinir ağıdır. Geleneksel LSTM katmanından farklı olarak ConvLSTM yalnızca sıralı ilişkiyi korumakla kalmaz, aynı zamanda verilerden mekansal özellikleri de çıkarır. Bu şekilde, sağlam mekansal-zamansal özellikleri yakalamak için bundan yararlanabiliriz. ConvLSTM'nin amaç fonksiyonu aşağıdaki gibi formüle edilir:



Fizikle geliştirilmiş SST verileri, SST tahmini için ConvLSTM modeline aşağıdaki şekilde beslenir:



Jeneratör tarafından elde edilen ağırlıklar, yalnızca jeneratör ağırlıklarının sabitlendiği Algoritma 2'de yeniden kullanılır. Tanıtılan kodlayıcı ve ayırıcı, gözlemlenen SST üzerinden başka bir eğitim sürecinden geçer. Ağırlıkları Denklem'e göre güncellenir. 2 ve Denk. sırasıyla 3. Eğitimden sonra kodlayıcı tarafından oluşturulan kod, öğrenilen fiziksel bilgiyi somutlaştıracaktır.


Son olarak, yukarıdaki önceden eğitilmiş modeli kullanarak fiziksel bilgiye dayalı olarak güçlendirilmiş verileri elde ederiz. ağırlıkları



Algoritma 2'deki jeneratör ve kodlayıcı yeniden kullanılır ve fizikle güçlendirilmiş sayısal model verileri üretmek için sayısal model SST'den yararlanılır.


Algoritma 3'te, SST tahmini için uzaysal-zamansal ConvLSTM modelini eğitmek amacıyla fiziksel bilgiyle güçlendirilmiş verilerden yararlanılır. Bu yazıda ertesi günün, sonraki 3 günün ve sonraki 7 günün SST'si ayrı ayrı tahmin edilmektedir. Bu kısımda güçlendirilmiş verilerden etkin şekilde faydalanabilmek adına ablasyon çalışması gerçekleştirdik.