लेखक:
(1) युक्सिन मेंग;
(2) फेंग गाओ;
(3) एरिक रिगेल;
(4) रान डोंग;
(5) जुन्यू डोंग;
(6) कियान डू.
ए. अध्ययन क्षेत्र और प्रयोग सेटिंग
दक्षिण चीन सागर पश्चिमी प्रशांत महासागर में, दक्षिणी मुख्य भूमि चीन में स्थित है। इसका क्षेत्रफल लगभग 3.5 मिलियन वर्ग किलोमीटर है और इसकी औसत गहराई 1, 212 मीटर है। इस शोधपत्र में, चयनित अध्ययन क्षेत्र (3.99°N∼24.78°N, 98.4°E∼124.4°E) है।
हम प्रेक्षित डेटा के रूप में GHRSST (ग्रुप फॉर हाई रेजोल्यूशन सी सरफेस टेम्परेचर) [55] से उच्च-रिज़ॉल्यूशन वाले सैटेलाइट रिमोट सेंसिंग डेटा का उपयोग करते हैं। GHRSST सैटेलाइट स्वाथ निर्देशांक, ग्रिडेड डेटा और गैप-फ्री ग्रिडेड उत्पादों सहित विभिन्न प्रकार के समुद्री सतह तापमान डेटा प्रदान करता है। इसमें, हमने गैप-फ्री ग्रिडेड उत्पादों को नियोजित किया है, जो एक ऑप्टिमल इंटरपोलेशन फ्रेमवर्क के भीतर पूरक सैटेलाइट और इन सीटू अवलोकनों को मिलाकर उत्पन्न होते हैं। HYCOM [56] को संख्यात्मक मॉडल के रूप में चुना गया है। उनके स्थानिक रिज़ॉल्यूशन क्रमशः 1/20°×1/20° और 1/12°×1/12° हैं। अस्थायी रिज़ॉल्यूशन एक दिन है। मई 2007 से दिसंबर 2013 तक के डेटा का उपयोग प्रशिक्षण के लिए किया जाता है इसलिए, डेटा में अध्ययन क्षेत्र का पूरा कवरेज है। इसके अलावा, GHRSST SST उत्पाद में प्रत्येक पिक्सेल का सटीक समय समान है।
प्रीप्रोसेसिंग के लिए Z-स्कोर मानकीकरण का उपयोग इस प्रकार किया गया:
जहाँ x GHRSST और HYCOM मॉडल SST को दर्शाता है, z सामान्यीकृत डेटा को दर्शाता है, µ और σ क्रमशः औसत मान और मानक विचलन को दर्शाते हैं। हमने डेटा को 256 × 256 वर्गाकार हीट मैप में परिवर्तित किया।
अधिक विशेष रूप से, GHRSST डेटा और 512-आयामी यादृच्छिक वेक्टर का उपयोग पूर्व नेटवर्क प्रशिक्षण के पहले चरण में किया जाता है। इनपुट GHRSST डेटा का आकार N × H × W है, जहाँ N बैच आकार को दर्शाता है, H इनपुट डेटा की ऊँचाई को दर्शाता है, और W इनपुट डेटा की चौड़ाई को दर्शाता है। पूर्व नेटवर्क के दूसरे चरण के लिए, हम एनकोडर प्रशिक्षण के लिए केवल GHRSST डेटा का उपयोग करते हैं। दोनों चरणों के लिए इनपुट और आउटपुट के आकार N × H × W हैं। इसी तरह, पूर्व नेटवर्क प्रशिक्षण के तीसरे चरण में, HYCOM SST डेटा को प्रीट्रेन्ड मॉडल में फीड किया जाता है। यहाँ, इनपुट और आउटपुट दोनों के आकार N × H × W हैं। हमारे कार्यान्वयन में, हम N को 2430 पर सेट करते हैं, जबकि H और W दोनों को 256 पर सेट किया जाता है।
हमने 8 GPU वाले NVIDIA GeForce 2080Ti पर व्यापक प्रयोग किए। पिछले नेटवर्क में ऐतिहासिक प्रेक्षित डेटा से भौतिक ज्ञान प्राप्त करने के लिए [53] में बताए गए समान नेटवर्क संरचना और कॉन्फ़िगरेशन का उपयोग किया जाता है। फिर प्राप्त भौतिक ज्ञान को संख्यात्मक मॉडल डेटा में स्थानांतरित किया जाता है ताकि संख्यात्मक मॉडल में गलत घटकों को पुनर्स्थापित और सुधारा जा सके। इस पेपर में उपयोग किए गए ConvLSTM मॉडल के लिए कॉन्फ़िगरेशन शि के काम [20] में ConvLSTM मॉडल के समान है। इस पेपर में तुलना और मूल्यांकन के लिए बेंचमार्क के रूप में GHRSST SST डेटासेट का उपयोग किया जाता है।
बी. एसएसटी भविष्यवाणी के लिए पिछले दिन की संख्या का प्रभाव
जैसा कि खंड III.C में बताया गया है, t भविष्यवाणी के लिए उपयोग किए गए पिछले दिनों की संख्या को दर्शाता है। यह एक महत्वपूर्ण पैरामीटर है जो SST भविष्यवाणी प्रदर्शन को प्रभावित कर सकता है। इस पेपर में, हम अगले एक-दिन, तीन-दिन और सात-दिन के SST की भविष्यवाणी करने का प्रयास करते हैं। हमने यह पता लगाने के लिए व्यापक प्रयोग लागू किए हैं कि क्या SST का पूर्वानुमान लगाना संभव है।
भविष्य के एसएसटी पूर्वानुमान के लिए पिछले दिनों की उचित संख्या। मूल माध्य वर्ग त्रुटि (आरएमएसई) और निर्धारण गुणांक (आर2) को मूल्यांकन मानदंड के रूप में लागू किया जाता है। कम आरएमएसई और उच्च आर2 मान अधिक सटीक परिणाम दर्शाते हैं।
तालिका I में पिछले एक दिन, तीन दिन और पांच दिन के डेटा का अलग-अलग उपयोग करके अगले दिन के लिए पूर्वानुमान के परिणाम सूचीबद्ध किए गए हैं। यह देखा जा सकता है कि प्रस्तावित मॉडल पिछले पांच दिनों के डेटा का उपयोग करते समय सबसे अच्छा प्रदर्शन करता है, जहां RMSE और R2 परिणाम क्रमशः 0.3618 और 0.9967 हैं। वे अन्य योजनाओं की तुलना में थोड़े बेहतर हैं। अन्य दो योजनाओं की तुलना में, RMSE और R2 मान 0.0086, 0.001 और 0.0028, 0.0006 तक सुधरते हैं। इसलिए, अगले एक दिन के SST पूर्वानुमान के लिए पिछले पांच दिनों के डेटा को अपनाया जाता है।
हम तालिका II में अगले तीन-दिवसीय SST पूर्वानुमान के लिए t के प्रभावों का विश्लेषण करते हैं। यह देखा जा सकता है कि जितना लंबा ऐतिहासिक डेटा इस्तेमाल किया गया, उतना ही बेहतर पूर्वानुमान प्रदर्शन हासिल हुआ। पिछले सात दिनों के डेटा का उपयोग करके RMSE मान सबसे अच्छा प्रदर्शन प्राप्त करता है। पिछले पाँच दिनों के डेटा का उपयोग करने की तुलना में इसमें 0.0025 का सुधार हुआ है। इस बीच, R2 अन्य दो योजनाओं की तुलना में पिछले सात दिनों के डेटा का उपयोग करके सबसे अच्छा प्रदर्शन करता है। इसलिए, अगले तीन-दिवसीय SST पूर्वानुमान के लिए पिछले सात दिनों के डेटा का उपयोग किया गया।
अगले सात-दिन के एसएसटी पूर्वानुमान के प्रायोगिक परिणाम तालिका III में दर्शाए गए हैं। जैसा कि देखा जा सकता है कि पिछले दस दिनों के डेटा का उपयोग करके पूर्वानुमान परिणाम सबसे अच्छा प्रदर्शन प्राप्त करते हैं। इसलिए, हम अगले सात-दिन के एसएसटी पूर्वानुमान के लिए पिछले दस दिनों के डेटा का उपयोग करते हैं।
सी. एब्लेशन अध्ययन
पिछले नेटवर्क और GAN प्रशिक्षण की प्रभावशीलता को सत्यापित करने के लिए, हम एब्लेशन प्रयोग करते हैं। जैसा कि चित्र 3 में दर्शाया गया है, तुलना के लिए दो वेरिएंट इस प्रकार डिज़ाइन किए गए हैं:
• योजना A. पूर्व नेटवर्क और ConvLSTM का अनुक्रम प्रतिस्थापित किया जाता है। संख्यात्मक मॉडल SST डेटा को पहले ConvLSTM में फीड किया जाता है, और फिर आउटपुट को अच्छी तरह से प्रशिक्षित पूर्व नेटवर्क में फीड किया जाता है।
• योजना बी. पिछले नेटवर्क को अच्छी तरह से प्रशिक्षित नहीं किया गया है। विशेष रूप से, पिछले नेटवर्क प्रशिक्षण में GAN मॉडल प्रशिक्षण (चित्र 2 में पहला चरण) को छोड़ दिया गया है।
प्रयोगात्मक परिणाम तालिका IV में दिखाए गए हैं। जैसा कि देखा जा सकता है कि हमारी विधि सर्वोत्तम RMSE और R2 मान प्राप्त करती है। विशेष रूप से, प्रस्तावित विधि स्कीम A से बेहतर प्रदर्शन करती है, जो दर्शाती है कि पूर्व नेटवर्क और ConvLSTM का सही अनुक्रम SST भविष्यवाणी प्रदर्शन को बढ़ा सकता है। यह स्पष्ट है कि पूर्व नेटवर्क संख्यात्मक मॉडल डेटा के गलत घटकों को प्रभावी ढंग से पुनर्स्थापित करता है, और पुनर्स्थापित डेटा SST भविष्यवाणी में बेहतर प्रदर्शन करता है। इसके अलावा, प्रस्तावित विधि में स्कीम B की तुलना में बेहतर प्रदर्शन है, जो दर्शाता है कि GAN मॉडलिंग एक आवश्यक कदम है। GAN मॉडलिंग देखे गए SST के डेटा वितरण को सीख सकता है, और पूर्व नेटवर्क को देखे गए SST से बेहतर भौतिक जानकारी प्राप्त करने में मदद करता है। संक्षेप में, प्रस्तावित विधि में, हम पूर्व नेटवर्क प्रीट्रेनिंग के लिए प्रतिकूल सीखने का उपयोग करते हैं, जो देखे गए SST डेटा से पूर्व नेटवर्क में भौतिक ज्ञान को प्रभावी ढंग से स्थानांतरित कर सकता है। यह तेजी से प्रशिक्षण अभिसरण का मार्गदर्शन कर सकता है, और SST भविष्यवाणी प्रदर्शन में सुधार कर सकता है।
डी. प्रायोगिक परिणाम और चर्चा
चित्र 4 में अगले एक दिन के पूर्वानुमानित SST की तुलना प्रेक्षित ग्राउंड ट्रुथ डेटा से की गई है। हम देख सकते हैं कि हमारी विधि के पूर्वानुमानित परिणाम प्रेक्षित डेटा से अच्छी तरह मेल खाते हैं। इसी तरह, अगले तीन दिनों और सात दिनों के लिए प्रेक्षित डेटा और संबंधित पूर्वानुमानित SST को क्रमशः चित्र 5 और चित्र 6 में प्रदर्शित किया गया है। दृश्यमान परिणाम संकेत देते हैं कि प्रस्तावित विधि SST पूर्वानुमान के लिए मजबूत और विश्वसनीय परिणाम उत्पन्न कर सकती है।
अगले एक दिन के लिए एसएसटी भविष्यवाणी पर एक स्कैटर प्लॉट चित्र 7 में चित्रित किया गया है। यह देखा जा सकता है कि डेटा बिंदु हैं
लाल रेखा के पास मोटे तौर पर समान रूप से वितरित। चित्र 8 और चित्र 9 क्रमशः अगले तीन दिनों और अगले सात दिनों के पूर्वानुमान परिणामों के स्कैटर प्लॉट हैं। स्कैटर प्लॉट एसएसटी भविष्यवाणी के लिए प्रस्तावित विधि की प्रभावशीलता को प्रदर्शित करते हैं।
प्रस्तावित विधि की प्रभावशीलता को सत्यापित करने के लिए, हम प्रस्तावित विधि की तुलना सात निकट से संबंधित विधियों से करते हैं: ConvLSTM [20], Hybrid-NN [14], Hybrid-TL [15], Gen-END [57], VAE-GAN [58], Tra-NM, और Tra-ASL। इन विधियों के लिए अध्ययन क्षेत्र (3.99°N∼24.78°N, 98.4°E∼ 124.4°E) है। इन सभी विधियों ने अगले 1-दिन की भविष्यवाणी के लिए पिछले 5 दिनों के प्रशिक्षण डेटा का उपयोग किया, अगले 3-दिन की भविष्यवाणी के लिए पिछले 7 दिनों के डेटा का उपयोग किया, और अगले 7-दिन की भविष्यवाणी के लिए पिछले 10 दिनों के डेटा का उपयोग किया।
ConvLSTM की चर्चा सेक्शन III.C में की गई है, और यह SST भविष्यवाणी के लिए एक प्रभावी स्थानिक-अस्थायी मॉडल है। HybridNN गहरे तंत्रिका नेटवर्क के प्रशिक्षण को निर्देशित करने के लिए देखे गए डेटा और संख्यात्मक मॉडल डेटा के बीच विसंगति का उपयोग करता है। हाइब्रिड-TL ट्रांसफ़र लर्निंग के माध्यम से संख्यात्मक मॉडल और तंत्रिका नेटवर्क के लाभों को जोड़ता है। GenEND एक जनरेटिव एनकोडर है जिसका उपयोग SST भविष्यवाणी के लिए किया जा सकता है। VAE-GAN वैरिएशनल ऑटोएनकोडर और को एकीकृत करता है
GAN, और यह SST भविष्यवाणी के लिए उच्च-स्तरीय अर्थपूर्ण विशेषताओं को कैप्चर कर सकता है। HYCOM SST डेटा का उपयोग अगले 1-दिन, 3-दिन और 7-दिन की भविष्यवाणी (जिसे Tra-NM कहा जाता है) के लिए ConvLSTM मॉडल को प्रशिक्षित करने के लिए किया जाता है। Tra-ASL एक पारंपरिक आत्मसात विधि है और यह कई प्रकार के डेटा (अवलोकित डेटा और संख्यात्मक मॉडल डेटा) के बीच सहसंबंधों का फायदा उठाती है।
GHRSST डेटा का उपयोग सबसे पहले ConvLSTM मॉडल को प्रशिक्षित करने के लिए किया जाता है, जो बेसलाइन के रूप में कार्य करता है। यह SST भविष्यवाणी के लिए व्यापक रूप से उपयोग किया जाने वाला डेटा-संचालित दृष्टिकोण है। हाइब्रिड-एनएन, हाइब्रिडटीएल, जेन-एंड और वीएई-जीएएन प्रशिक्षण के लिए GHRSST और HYCOM डेटा का उपयोग करते हैं। HYCOM आत्मसात डेटा [56]
यहाँ 1/12°×1/12° के स्थानिक रिज़ॉल्यूशन के साथ उपयोग किया जाता है। हमारी विधि ऐतिहासिक प्रेक्षित डेटा से भौतिक ज्ञान को शामिल करके संख्यात्मक मॉडल डेटा में गलत घटकों को सुधारती और सुधारती है। सही किए गए संख्यात्मक मॉडल डेटा को भौतिकी-संवर्धित डेटा कहा जाता है। भौतिकी-संवर्धित डेटा के साथ तुलना करने के लिए, HYCOM आत्मसात डेटा (Tra-ASL) और HYCOM डेटा (Tra-NM) का उपयोग ConvLSTM मॉडल को प्रशिक्षित करने के लिए समान रूप से किया जाता है।
अगले 1-दिन, 3-दिन और 7-दिन की भविष्यवाणियों के लिए ConvLSTM, Hybrid-NN, Tra-NM और Tra-ASL का प्रशिक्षण समय क्रमशः 1.8, 4.4 और 8.2 घंटे है। Hybrid-TL विधि ने ConvLSTM मॉडल को दो बार प्रशिक्षित किया, और तीन कार्यों के लिए प्रशिक्षण अवधि क्रमशः 3.6, 8.8 और 16.4 घंटे है। VAE-GAN को प्रशिक्षण के लिए 181.6, 184.2 और 188.4 घंटे की आवश्यकता होती है, जबकि Gen-END विधि को लगभग समान समय की आवश्यकता होती है, जिसमें तीन SST भविष्यवाणी कार्यों के लिए क्रमशः 196.8, 199.3 और 203.2 घंटे लगते हैं।
अगले 1-दिन, 3-दिन और 7-दिन के SST पूर्वानुमान के परिणाम तालिका V में प्रस्तुत किए गए हैं। यह स्पष्ट है कि TraNM विधि अन्य विधियों की तुलना में असंतोषजनक परिणाम देती है। यह संभवतः HYCOM डेटा में गलत घटकों के कारण है, जो SST पूर्वानुमान प्रदर्शन को प्रतिकूल रूप से प्रभावित करते हैं। हाइब्रिड-NN विधि भी खराब प्रदर्शन करती है, क्योंकि इसके औसत RMSE मान मॉडलों में दूसरे सबसे कम हैं। हाइब्रिड-TL मॉडल अगले 1-दिन के SST पूर्वानुमान के लिए ConvLSTM से बेहतर प्रदर्शन करता है, लेकिन अन्य दो कार्यों के लिए नहीं। हमारी विधि सर्वोत्तम RMSE मान और उच्चतम R2 मान प्राप्त करती है। ConvLSTM मॉडल की तुलना में, हमारी विधि के औसत RMSE मान प्रभावी रूप से बेहतर हुए हैं। यह दर्शाता है कि भौतिक ज्ञान को शामिल करने से
प्रेक्षित डेटा से संख्यात्मक मॉडल डेटा में गलत घटकों को पुनर्स्थापित किया जा सकता है, जिससे एसएसटी भविष्यवाणी सटीकता में सुधार हो सकता है।
चित्र 10 में अगले एक-दिवसीय एसएसटी पूर्वानुमान, अवलोकित एसएसटी डेटा और उनके अंतर के लिए क्रमशः दृश्यमान परिणाम प्रस्तुत किए गए हैं। यह देखा जा सकता है कि पूर्वानुमानित परिणाम दक्षिण चीन सागर के पूरे क्षेत्र में अवलोकित एसएसटी डेटा के समान हैं। चित्र 11 में अगले तीन-दिवसीय एसएसटी पूर्वानुमान के लिए दृश्यमान परिणाम प्रदर्शित किए गए हैं। यह देखा गया है कि टोंकिन की खाड़ी और दक्षिण चीन सागर के अन्य सीमांत क्षेत्रों में कुछ महत्वपूर्ण अंतर मान हैं। चित्र 12 में अगले सात-दिवसीय एसएसटी पूर्वानुमान के लिए दृश्यमान परिणाम दिखाए गए हैं। यह पाया गया है कि प्रमुख अंतर मान मुख्य रूप से अगले सात-दिवसीय पूर्वानुमान के लिए टोंकिन की खाड़ी पर केंद्रित हैं, और वे दो अन्य कार्यों के परिणामों से बड़े हैं।
ई. सीमा और चर्चा
चित्र 7 से चित्र 9 तक, यह देखा जा सकता है कि मध्य-श्रेणी के SST में कुछ अशुद्धियाँ हैं, जिन्हें चित्र 13 में दिखाया गया है। चमकीले पिक्सेल बड़ी SST भविष्यवाणी त्रुटियों को इंगित करते हैं, जबकि गहरे पिक्सेल सटीक SST भविष्यवाणियों को दर्शाते हैं। जैसा कि देखा जा सकता है, ये बिंदु मुख्य रूप से ताइवान स्ट्रेट के उत्तर-पश्चिमी भाग में स्थित हैं, जहाँ अनुमानित समुद्री सतह का तापमान देखे गए डेटा से कम है। भविष्यवाणी त्रुटि मुख्य रूप से ConvLSTM मॉडल और भूमि मास्क के कारण होती है। हमारे कार्यान्वयन में, भूमि मास्क को अध्ययन क्षेत्र पर लागू किया जाता है। ConvLSTM पूरे अध्ययन क्षेत्र की स्थानिक और लौकिक विशेषताओं का फायदा उठाता है। ताइवान स्ट्रेट के उत्तर-पश्चिमी भाग की विशेषताएं कुछ हद तक भूमि मास्क से प्रभावित होती हैं
चित्र 11 और 12 में, यह देखा जा सकता है कि लीड डे के साथ त्रुटियों में कोई महत्वपूर्ण वृद्धि नहीं हुई है। यह इस तथ्य के कारण हो सकता है कि हमारी विधि पर्याप्त मात्रा में प्रशिक्षण डेटा का उपयोग करती है, और डीप न्यूरल नेटवर्क प्रभावी रूप से अस्थायी विशेषताओं को पकड़ने में सक्षम हैं। इसके अलावा, एसएसटी की दृढ़ता भी एक महत्वपूर्ण कारक है।
यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।