paint-brush
समुद्र सतह तापमान पूर्वानुमान के लिए गहन तंत्रिका नेटवर्क: पृष्ठभूमिद्वारा@oceanography
152 रीडिंग

समुद्र सतह तापमान पूर्वानुमान के लिए गहन तंत्रिका नेटवर्क: पृष्ठभूमि

बहुत लंबा; पढ़ने के लिए

इस शोधपत्र में, शोधकर्ताओं ने ऐतिहासिक अवलोकनों से भौतिक ज्ञान को संख्यात्मक मॉडलों में स्थानांतरित करके एसएसटी भविष्यवाणी को बढ़ाया है।
featured image - समुद्र सतह तापमान पूर्वानुमान के लिए गहन तंत्रिका नेटवर्क: पृष्ठभूमि
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

लेखक:

(1) युक्सिन मेंग;

(2) फेंग गाओ;

(3) एरिक रिगेल;

(4) रान डोंग;

(5) जुन्यू डोंग;

(6) कियान डू.

लिंक की तालिका

II. पृष्ठभूमि

ए. जनरेटिव एडवर्सेरियल नेटवर्क


2014 में, गुडफेलो एट अल. [16] ने प्रतिकूल तरीके से प्रशिक्षित जनरेटिव मॉडल का एक नया ढाँचा पेश किया। उनकी विधि में, एक जनरेटिव मॉडल जी और एक विभेदक मॉडल डी को एक साथ प्रशिक्षित किया गया था। मॉडल जी को मॉडल डी के माध्यम से इनपुट डेटा के वितरण को अप्रत्यक्ष रूप से पकड़ने और समान डेटा उत्पन्न करने के लिए लागू किया गया था। जबकि मॉडल डी उन संभावनाओं का अनुमान लगाता है कि इसके इनपुट नमूने मॉडल जी के बजाय प्रशिक्षण डेटा से आए हैं। जी की प्रशिक्षण प्रक्रिया डी की संभाव्यता त्रुटियों से प्रेरित थी। इस प्रतिकूल प्रक्रिया में, जी और डी सीखने का मार्गदर्शन करते हैं और धीरे-धीरे उत्कृष्ट प्रदर्शन प्राप्त करने के लिए एक-दूसरे की क्षमता को मजबूत करते हैं।


GAN को भौतिक-प्रासंगिक कार्यों में लागू किया गया है। उदाहरण के लिए, यांग एट अल [17] ने उच्च-आयामी समस्याओं से निपटने के लिए भौतिकी-सूचित GAN को लागू किया और स्टोकेस्टिक अंतर समीकरणों को हल किया, लुत्जेंस ¨ एट अल [18] ने संख्यात्मक मॉडल डेटा में सुविधाओं को सीखने के लिए GAN का उपयोग करके अधिक यथार्थवादी तटीय बाढ़ डेटा का उत्पादन किया, झेंग एट अल [19] ने GAN द्वारा सीखे गए संभावित भौतिक कानून के साथ अज्ञात स्थानिक डेटा का अनुमान लगाया। हालांकि, इन कार्यों ने पूरे संख्यात्मक मॉडल को बदलने के लिए GAN का उपयोग करके अपने मॉडल का प्रदर्शन किया, जो हमारे काम से काफी अलग है। इस पत्र में, हम संख्यात्मक मॉडल में भौतिक विशेषता को सही करने और सुधारने के लिए, देखे गए डेटा से भौतिक ज्ञान को संख्यात्मक मॉडल डेटा में स्थानांतरित करने के लिए GAN मॉडल को अपनाते हैं।


बी. कन्वोल्यूशनल लॉन्ग शॉर्ट-टर्म मेमोरी


2015 में, ConvLSTM [20] को वर्षा की अब-प्रस्तुति को हल करने के लिए प्रस्तावित किया गया था। ConvLSTM की नेटवर्क संरचना स्थानीय स्थानिक विशेषताओं को शास्त्रीय कन्वोल्यूशनल न्यूरल नेटवर्क (CNN) [21] की तरह कैप्चर करने में सक्षम है, जबकि अनुक्रमिक संबंध बनाते हुए, लॉन्ग शॉर्ट-टर्म मेमोरी (LSTM) ब्लॉक से विरासत में मिली है। इसके अलावा, लेखकों ने यह दिखाने के लिए प्रयोग किए कि ConvLSTM स्थानिक-लौकिक संबंध पर LSTM से बेहतर प्रदर्शन करने में सक्षम है। मौसम की भविष्यवाणी के कार्यों के अलावा, ConvLSTM को विभिन्न स्थानिक-लौकिक अनुक्रमिक भविष्यवाणी समस्याओं पर लागू किया जा सकता है, उदाहरण के लिए, क्रिया पहचान [22], [23]।


सी. समुद्र सतह तापमान पूर्वानुमान


लिंस एट अल. [24] ने एसवीएम का उपयोग करके उष्णकटिबंधीय अटलांटिक में एसएसटी की जांच की। पाटिल एट अल. [25] ने समुद्र की सतह के तापमान की भविष्यवाणी करने के लिए एक कृत्रिम तंत्रिका नेटवर्क को अपनाया। यह केवल 1 से 5 दिनों के लीड टाइम के साथ पूर्वानुमान के मामले में अच्छा प्रदर्शन करता है और फिर सटीकता कम हो जाती है। झांग एट अल. [26] ने एलएसटीएम को लागू किया


चित्र 2. प्रस्तावित SST भविष्यवाणी विधि का चित्रण। इसमें दो चरण होते हैं: पूर्व नेटवर्क प्रशिक्षण और संवर्धित डेटा के साथ SST भविष्यवाणी। पहले चरण में, भौतिकी-संवर्धित SST उत्पन्न करने के लिए एक पूर्व नेटवर्क को प्रशिक्षित किया जाता है। दूसरे चरण में, भौतिकी-संवर्धित SST का उपयोग ConvLSTM के माध्यम से SST भविष्यवाणी के लिए किया जाता है।


एसएसटी की भविष्यवाणी करें। यांग एट अल। [27] ने पूरी तरह से जुड़े एलएसटीएम मॉडल का निर्माण करके एसएसटी की भविष्यवाणी की। दूसरे दृष्टिकोण से, पाटिल एट अल। [28] ने दैनिक एसएसटी की भविष्यवाणी करने के लिए एक वेवलेट न्यूरल नेटवर्क का उपयोग किया, जबकि क्वाला एट अल। [29] ने एसएसटी भविष्यवाणी के लिए पैच-स्तरीय न्यूरल नेटवर्क विधि का प्रस्ताव दिया। हालांकि, ये विधियां केवल डेटा पर निर्भर करती हैं और उनके पीछे के भौतिक ज्ञान को अनदेखा करती हैं। हैम एट अल। [15] ने ईएनएसओ की भविष्यवाणी करने और उन्हें वर्गीकृत करने के लिए ट्रांसफर लर्निंग को अपनाया। इस काम में, हम तुलनात्मक प्रयोग करते हैं और परिणाम बताते हैं कि हमारी विधि अल्पकालिक त्रुटियों के साथ-साथ दीर्घकालिक पूर्वाग्रह को भी कम करती है।


D. डेटा संवर्धन


शॉर्टन एट अल. [30] ने डीप लर्निंग के लिए इमेज डेटा वृद्धि की हाल की तकनीकों की समीक्षा की। डेटा वृद्धि का उद्देश्य तंत्रिका नेटवर्क की प्रतिनिधित्व क्षमता को बढ़ाना और मूल डेटा के वितरण को बेहतर ढंग से सीखना है। हाल के वर्षों में, दो प्रकार की डेटा वृद्धि तकनीकों का आमतौर पर उपयोग किया गया है: डेटा परिवर्तन और पुन: नमूनाकरण। डेटा परिवर्तन दृष्टिकोण में ज्यामितीय परिवर्तन [31], रंग स्थान परिवर्तन [32]-[34], यादृच्छिक मिटाना [35]-[37], प्रतिकूल प्रशिक्षण [38]-[41] और शैली हस्तांतरण [42]-[45] शामिल हैं। पुन: नमूनाकरण तकनीक नई इंस्टेंस संरचना पर विशेष जोर देती है, जैसे कि इमेज मिक्सअप [46]-[48], फीचर स्पेस एन्हांसमेंट [49], [50] और जेनरेटिव एडवरसैरियल नेटवर्क (जीएएन) [16]। ज्यामितीय परिवर्तन अच्छा प्रदर्शन प्राप्त कर सकता है, जैसे कि इमेज फ्लिप, क्रॉप, रोटेशन, ट्रांसलेशन और नॉइज़ इंजेक्शन [51]। [30] में प्रयोगात्मक परिणामों से पता चला कि रैंडम क्रॉपिंग तकनीक ने अच्छा प्रदर्शन किया। कलर स्पेस ट्रांसफ़ॉर्मेशन में बड़ी मेमोरी खपत और लंबा कंप्यूटिंग समय लगता है। रैंडम इरेज़िंग तकनीक मास्क का उपयोग करके अवरोधन मामलों में नेटवर्क की मजबूती में सुधार कर सकती है। हालाँकि प्रतिकूल प्रशिक्षण भी मजबूती में सुधार कर सकता है, लेकिन प्राकृतिक प्रतिकूल नमूनों की सीमित संख्या व्यवहार में नेटवर्क के प्रदर्शन को काफी हद तक सीमित कर देती है। न्यूरल स्टाइल ट्रांसफर दृष्टिकोण केवल विशिष्ट कार्यों के लिए प्रभावी है, जबकि इसका व्यावहारिक अनुप्रयोग सीमित है। फ़ीचर स्पेस वृद्धि फ़ीचर स्पेस में अभ्यावेदन को प्रक्षेपित करने की क्षमता को लागू करती है। GAN आधारित वृद्धि तकनीकों को वर्तमान अत्याधुनिक नेटवर्क प्रदर्शन [52] को प्राप्त करने के लिए लागू किया गया है। हालाँकि, कोई प्रभावी डेटा वृद्धि विधि मौजूद नहीं है जो संख्यात्मक मॉडल और गहन शिक्षण के गुणों का फायदा उठा सके। इस पत्र में, हमारा उद्देश्य भौतिक ज्ञान के आधार पर एक नई डेटा वृद्धि तकनीक का प्रस्ताव करना है। प्रस्तावित तकनीक GAN आधारित वृद्धि की तुलना में बेहतर प्रदर्शन प्राप्त करती है।


यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।