लेखक:
(1) युक्सिन मेंग;
(2) फेंग गाओ;
(3) एरिक रिगेल;
(4) रान डोंग;
(5) जुन्यू डोंग;
(6) कियान डू.
संख्यात्मक मॉडल SST और उसके वैश्विक टेलीकनेक्शन के स्थानिक वितरण की एक साथ भविष्यवाणी कर सकता है। यह SST भविष्यवाणी के लिए शॉर्ट-लीड पर अच्छा प्रदर्शन करता है। फिर भी, हम तर्क देते हैं कि देखे गए डेटा से भौतिक ज्ञान को स्थानांतरित करने से SST भविष्यवाणी के लिए संख्यात्मक मॉडल के प्रदर्शन में और सुधार हो सकता है। इस उद्देश्य के लिए, हम देखे गए डेटा में भौतिक ज्ञान सीखने के लिए GAN को अपनाते हैं।
झू एट अल. [53] ने एक GAN व्युत्क्रम विधि प्रस्तावित की जो न केवल इनपुट डेटा को ईमानदारी से फिर से बनाती है, बल्कि यह भी सुनिश्चित करती है कि उलटा अव्यक्त कोड अर्थपूर्ण रूप से सार्थक हो। उन्होंने प्रदर्शित किया कि केवल लक्ष्य छवि के पिक्सेल मानों को सीखना अपर्याप्त है, और सीखी गई विशेषताएँ अर्थपूर्ण स्तर पर छवि का प्रतिनिधित्व करने में असमर्थ हैं। इस कार्य से प्रेरित होकर, हमने GAN में एक एनकोडर डिज़ाइन किया है जो देखे गए डेटा से भौतिक ज्ञान सीखता है, जिसे पूर्व नेटवर्क कहा जाता है। यह पूर्व नेटवर्क न केवल लक्ष्य देखे गए डेटा के पिक्सेल मानों को सीखता है, बल्कि भौतिक जानकारी भी कैप्चर करता है। यह प्रभावी रूप से SST भविष्यवाणी सटीकता में सुधार करता है।
इसके बाद, हम प्रस्तावित विधि को निम्नानुसार प्रस्तुत करते हैं: 1) विधि का अवलोकन, 2) पूर्व नेटवर्क, 3) संवर्धित डेटा के साथ एसएसटी भविष्यवाणी।
A. विधि का अवलोकन
इस उपखंड में, हम प्रस्तावित एसएसटी पूर्वानुमान विधि का सारांश प्रस्तुत करते हैं और प्रत्येक चरण के इनपुट और आउटपुट का विस्तार से वर्णन करते हैं। जैसा कि चित्र 2 में दर्शाया गया है, प्रस्तावित एसएसटी पूर्वानुमान विधि में दो चरण शामिल हैं: पूर्व नेटवर्क प्रशिक्षण और संवर्धित डेटा के साथ एसएसटी पूर्वानुमान।
1) पूर्व नेटवर्क प्रशिक्षण। इस चरण में तीन चरण होते हैं। पहले चरण में, GAN मॉडल प्रशिक्षण के लिए देखे गए SST (GHRST डेटा) का उपयोग किया जाता है। दूसरे चरण में, प्रीट्रेन्ड जनरेटर और GHRSST डेटा का उपयोग एनकोडर को प्रशिक्षित करने के लिए किया जाता है। तीसरे चरण में, प्रीट्रेन्ड जनरेटर और एनकोडर को पूर्व नेटवर्क में संयोजित किया जाता है। पूर्व नेटवर्क का उपयोग प्रेक्षित डेटा से संख्यात्मक मॉडल में भौतिक ज्ञान को स्थानांतरित करने के लिए किया जाता है। संख्यात्मक मॉडल SST (HYCOM डेटा) को फिर इसके फीचर प्रतिनिधित्व को बढ़ाने के लिए पूर्व नेटवर्क में फीड किया जाता है।
2) संवर्धित डेटा के साथ एसएसटी पूर्वानुमान। एसएसटी पूर्वानुमान के लिए भौतिकी-संवर्धित डेटा को ConvLSTM मॉडल में डाला जाता है। अगले दिन, अगले 3 दिन और अगले 7 दिनों के एसएसटी का अलग-अलग पूर्वानुमान लगाया जाता है।
यह ध्यान दिया जाना चाहिए कि अधिकांश मौजूदा कार्य [26] [27] केवल ConvLSTM प्रशिक्षण के लिए देखे गए डेटा का उपयोग करते हैं। इसके विपरीत, हमारी विधि ConvLSTM प्रशिक्षण के लिए भौतिकी-संवर्धित डेटा का लाभ उठाती है। इसके बाद, हम विस्तृत रूप से संवर्धित डेटा के साथ पूर्व नेटवर्क प्रशिक्षण और एसएसटी भविष्यवाणी का वर्णन करते हैं।
बी. चरण 1: पूर्व नेटवर्क प्रशिक्षण
हम प्रेक्षित डेटा में भौतिक ज्ञान सीखने के लिए एक पूर्व नेटवर्क का निर्माण करते हैं और प्रशिक्षण के बाद इसकी अर्थपूर्ण/भौतिक जानकारी को स्थिर रखते हैं। जैसा कि चित्र 2 में दर्शाया गया है, पूर्व नेटवर्क प्रशिक्षण में तीन चरण शामिल हैं: GAN मॉडल प्रशिक्षण, एनकोडर प्रशिक्षण, और भौतिकी-संवर्धित डेटा निर्माण। आगे हम प्रत्येक चरण का विस्तृत विवरण प्रदान करते हैं।
GAN मॉडल प्रशिक्षण। GAN मॉडल का उपयोग प्रेक्षित SST से डेटा वितरण सीखने के लिए किया जाता है। उद्देश्य फ़ंक्शन इस प्रकार है:
GAN मॉडल की प्रशिक्षण प्रक्रिया को एल्गोरिथम 1 में संक्षेपित किया गया है। हम मॉडल को अवलोकित SST पर तब तक प्रशिक्षित करते हैं जब तक कि जनरेटर G अवलोकित SST डेटा से भौतिक विशेषताओं को कैप्चर नहीं कर लेता।
जहाँ F(·) VGG नेटवर्क के माध्यम से फ़ीचर एक्सट्रैक्शन को दर्शाता है। VGG नेटवर्क विज़ुअल जियोमेट्री ग्रुप [54] द्वारा प्रस्तावित नेटवर्क के लिए है, और यह एक क्लासिकल डीप कन्वोल्यूशनल न्यूरल नेटवर्क है।
एनकोडर प्रशिक्षण का वर्णन एल्गोरिथम 2 में किया गया है। जनरेटर G के पैरामीटर स्थिर हैं, जबकि एनकोडर E और डिस्क्रिमिनेटर D के पैरामीटर क्रमशः समीकरण 2 और समीकरण 3 के आधार पर अद्यतन किए जाते हैं।
चरण 1 का उद्देश्य एक पूर्व नेटवर्क का निर्माण करना है जो संख्यात्मक मॉडल डेटा में गलत घटकों को सुधार सकता है। इस उद्देश्य के लिए, हम सबसे पहले एक GAN मॉडल तैयार करते हैं जो देखे गए SST से डेटा वितरण को कैप्चर करता है और उच्च गुणवत्ता वाला SST डेटा उत्पन्न कर सकता है। इसके बाद, एनकोडर को यह गारंटी देने के लिए प्रशिक्षित किया जाता है कि उत्पन्न अव्यक्त कोड देखे गए SST में अर्थपूर्ण/भौतिक जानकारी को संरक्षित करते हैं। हम तर्क देते हैं कि प्रतिकूल सीखने के माध्यम से, पूर्व नेटवर्क (एनकोडर और जनरेटर से मिलकर) इनपुट डेटा में गलत भागों को सुधार सकता है, क्योंकि भौतिक ज्ञान को पूर्व नेटवर्क में एम्बेड किया गया है। नतीजतन, तीसरे चरण में, जब संख्यात्मक मॉडल डेटा को पूर्व नेटवर्क में फीड किया जाता है, तो एम्बेडेड भौतिक ज्ञान संख्यात्मक मॉडल डेटा में गलत घटकों को सही कर सकता है।
सी. चरण 2: संवर्धित डेटा के साथ एसएसटी भविष्यवाणी
ConvLSTM स्थानिक-कालिक डेटा की भविष्यवाणी करने के लिए एक प्रभावी उपकरण है। यह एक आवर्तक तंत्रिका नेटवर्क है जो इनपुट-टू-स्टेट और स्टेट-टू-स्टेट संक्रमण दोनों में कन्वोल्यूशनल ब्लॉक को शामिल करता है। पारंपरिक LSTM परत के विपरीत, ConvLSTM न केवल अनुक्रमिक संबंध को संरक्षित करता है बल्कि डेटा से स्थानिक विशेषताओं को भी निकालता है। इस तरह, हम मजबूत स्थानिक-कालिक विशेषताओं को पकड़ने के लिए इसका लाभ उठा सकते हैं। ConvLSTM का उद्देश्य फ़ंक्शन निम्नानुसार तैयार किया गया है:
भौतिकी-संवर्धित SST डेटा को SST पूर्वानुमान के लिए ConvLSTM मॉडल में निम्नानुसार फीड किया जाता है:
जनरेटर द्वारा प्राप्त भार को एल्गोरिथ्म 2 में पुनः उपयोग किया जाता है, जहाँ केवल जनरेटर भार तय होते हैं। प्रस्तुत एनकोडर और डिस्क्रिमिनेटर देखे गए एसएसटी पर एक और प्रशिक्षण प्रक्रिया से गुजरते हैं। उनके भार क्रमशः समीकरण 2 और समीकरण 3 के आधार पर अपडेट किए जाते हैं। प्रशिक्षण के बाद, एनकोडर द्वारा उत्पन्न कोड सीखे गए भौतिक ज्ञान को मूर्त रूप देगा।
अंत में, हम उपरोक्त पूर्व-प्रशिक्षित मॉडल का उपयोग करके भौतिक ज्ञान के आधार पर पुष्ट डेटा प्राप्त करते हैं।
एल्गोरिथम 2 से जनरेटर और एनकोडर का पुनः उपयोग किया जाता है और संख्यात्मक मॉडल एसएसटी का उपयोग भौतिकी-प्रबलित संख्यात्मक मॉडल डेटा का उत्पादन करने के लिए किया जाता है।
एल्गोरिथम 3 में, भौतिक ज्ञान-संवर्धित डेटा का उपयोग SST पूर्वानुमान के लिए स्थानिक-कालिक ConvLSTM मॉडल को प्रशिक्षित करने के लिए किया जाता है। इस पेपर में, अगले दिन, अगले 3 दिनों और अगले 7 दिनों के SST का अलग-अलग पूर्वानुमान लगाया गया है। इस भाग के लिए, हमने प्रबलित डेटा का प्रभावी ढंग से उपयोग करने के लिए एक एब्लेशन अध्ययन किया।
यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।