लेखक : Remi Lam (Google DeepMind) Alvaro Sanchez-Gonzalez (Google DeepMind) Matthew Willson (Google DeepMind) Peter Wirnsberger (Google DeepMind) Meire Fortunato (Google DeepMind) Ferran Alet (Google DeepMind) Suman Ravuri (Google DeepMind) Timo Ewalds (Google DeepMind) Zach Eaton-Rosen (Google DeepMind) Weihua Hu (Google DeepMind) Alexander Merose (Google Research) Stephan Hoyer (Google Research) George Holland (Google DeepMind) Oriol Vinyals (Google DeepMind) Jacklynn Stott (Google DeepMind) Alexander Pritzel (Google DeepMind) Shakir Mohamed (Google DeepMind) Peter Battaglia (Google DeepMind) लेखक : रीमी लैम (Google DeepMind) Alvaro Sanchez-Gonzalez (Google डेपमिंड) मैथ्यू विल्सन (Google DeepMind) पीटर वर्न्सबर्गर (Google DeepMind) गूगल डीपमिंड (Google DeepMind) गूगल डीपमिंड (Google DeepMind) गूगल डीपमिंड (Google DeepMind) Timo Ewalds (Google DeepMind) ज़ैक ईटन-रोसेन (Google DeepMind) गूगल डीपमिंड (Google DeepMind) अलेक्जेंडर मेरोज़ (Google Research) Stephan Hoyer (Google अनुसंधान) जॉर्ज हॉलैंड (Google DeepMind) गूगल डीपमिंड (Google DeepMind) जैकलिन स्टॉट (Google DeepMind) अलेक्जेंडर प्रिटज़ेल (Google DeepMind) गूगल डेपमिंड (Google DeepMind) पीटर Battaglia (Google DeepMind) वैश्विक मध्यवर्ती मौसम पूर्वानुमान कई सामाजिक और आर्थिक क्षेत्रों पर निर्णय लेने के लिए महत्वपूर्ण है। पारंपरिक संख्यात्मक मौसम पूर्वानुमान पूर्वानुमान पूर्वानुमान की सटीकता में सुधार करने के लिए बढ़ी हुई कंप्यूटिंग संसाधनों का उपयोग करता है, लेकिन मूल मॉडल में सुधार करने के लिए सीधे ऐतिहासिक मौसम डेटा का उपयोग नहीं कर सकता है। हम "ग्राफकास्ट" नामक एक मशीन सीखने आधारित विधि पेश करते हैं, जिसे पुनः विश्लेषण डेटा से सीधे प्रशिक्षित किया जा सकता है। यह दुनिया भर में 0.25 डिग्री संकल्प पर 10 दिनों के लिए सैकड़ों मौसम परिवर्तकों का पूर्वानुमान करता है, एक मिनट के भीतर। हम दिखाते हैं कि ग्राफकास्ट 1380 सत्यापन लक्ष्यों के 90% Keywords: मौसम पूर्वानुमान, ECMWF, ERA5, HRES, सीखने सिमुलेशन, ग्राफ न्यूरोल नेटवर्क परिचय यह 05:45 यूटीसी है, अक्टूबर, 2022 के मध्य में, इटली में बोलोना में, और यूरोपीय केंद्र मध्यम रेंज मौसम पूर्वानुमान (ईसीएमडब्ल्यूएफ) की नई उच्च प्रदर्शन कंप्यूटिंग सुविधा का काम शुरू हो गया है। पिछले कुछ घंटों के लिए, एकीकृत पूर्वानुमान प्रणाली (आईएफएस) अगले दिनों और हफ्तों के लिए पृथ्वी के मौसम की पूर्वानुमान करने के लिए परिष्कृत गणनाएं चला रही है, और इसके पहले पूर्वानुमानों को उपयोगकर्ताओं को फैलाना शुरू कर दिया गया है। आईएफएस, और आधुनिक मौसम पूर्वानुमान अधिक सामान्य रूप से, विज्ञान और इंजीनियरिंग की विजय हैं. मौसम प्रणालियों की गतिशीलता पृथ्वी पर सबसे जटिल भौतिक घटनाओं में से एक है, और हर दिन, व्यक्तियों, उद्योगों, और नीति निर्माताओं द्वारा किए गए अनगिनत निर्णयों को सटीक मौसम पूर्वानुमान पर निर्भर करते हैं, यह तय करने से पहले कि क्या एक जैकेट पहनना है या एक खतरनाक तूफान से बचने के लिए। मौसम पूर्वानुमान के लिए आज का प्रमुख दृष्टिकोण "मानव मौसम पूर्वानुमान" (एनडब्ल्यूपी) है, जिसमें सुपर कंप्यूटर का उपयोग करके मौसम के शासन संतुलनों को हल करना शामिल है। एनडब्ल्यूपी की सफलता उन कठोर और हालांकि पारंपरिक एनडब्ल्यूपी कंप्यूटर के साथ अच्छी तरह से स्केल करता है, लेकिन इसकी सटीकता ऐतिहासिक डेटा की बढ़ती मात्रा के साथ नहीं बढ़ती है. मौसम और जलवायु डेटा के विशाल आर्काइव हैं, उदाहरण के लिए, ईसीएमडब्ल्यूएफ के MARS [17], लेकिन हाल ही में तक ऐसे डेटा का उपयोग करने के लिए कुछ व्यावहारिक तरीके थे जो भविष्यवाणी मॉडल की गुणवत्ता को सीधे सुधारने के लिए थे. इसके बजाय, एनडब्ल्यूपी विधियों को बेहतर मॉडल, एल्गोरिथम, और अनुमानों को नवीन करने के लिए उच्च प्रशिक्षित विशेषज्ञों द्वारा बेहतर किया जाता है, जो समय लेने वाला और महंगा प्रक्रिया हो सकता है। मशीन सीखने-आधारित मौसम पूर्वानुमान (MLWP) पारंपरिक एनडब्ल्यूपी के लिए एक विकल्प प्रदान करता है, जहां पूर्वानुमान मॉडल सीधे ऐतिहासिक डेटा से प्रशिक्षित किए जाते हैं। यह पूर्वानुमान सटीकता में सुधार करने की क्षमता है, डेटा में पैटर्न और पैटर्न को कैप्चर करके जो स्पष्ट संतुलनों में आसानी से प्रतिनिधित्व नहीं करते हैं। एमएलडब्ल्यूपी भी आधुनिक गहराई से सीखने के हार्डवेयर का उपयोग करके अधिक कुशलता के लिए अवसर प्रदान करता है, सुपर कंप्यूटरों के बजाय, और अधिक अनुकूल गति-सटीक प्रतिस्पर्धाओं को प्रभावित करता है। हाल ही में, एमएलडब्ल्यूपी ने उन शासनों में एनडब्ल्यूपी आधार In medium-range weather forecasting, i.e., predicting atmospheric variables up to 10 days ahead, NWP-based systems like the IFS are still most accurate. The top deterministic operational system in the world is ECMWF’s High RESolution forecast (HRES), a component of IFS which produces global 10-day forecasts at 0.1° latitude/longitude resolution, in around an hour [27]. However, over the past several years, MLWP methods for medium-range forecasting have been steadily advancing, facilitated by benchmarks such as WeatherBench [27]. Deep learning architectures based on convolutional neural networks [35, 36, 28] and Transformers [24] have shown promising results at latitude/longitude resolutions coarser than 1.0°, and recent works—which use graph neural networks (GNN) [11], Fourier neural operators [25, 14], and Transformers [4]—have reported performance that begins to approach IFS’s at 1.0° and 0.25° for a handful of variables, and lead times up to seven days. ग्राफिक्स यहां हम "GraphCast" नामक वैश्विक मध्यम दूरी के मौसम पूर्वानुमान के लिए एक नया MLWP दृष्टिकोण पेश करते हैं, जो एक ही Google Cloud TPU v4 डिवाइस पर एक मिनट से भी कम समय में सटीक 10 दिनों के पूर्वानुमान का उत्पादन करता है, और उष्णकटिबंधीय साइक्लोन ट्रैक, वायुमंडलीय नदी और चरम तापमान की पूर्वानुमान सहित अनुप्रयोगों का समर्थन करता है। GraphCast इनपुट के रूप में पृथ्वी के मौसम के दो सबसे हालिया राज्यों को लेता है - वर्तमान समय और छह घंटे पहले - और अगले मौसम की स्थिति को छह घंटे पहले की भविष्यवाणी करता है। एक एकल मौसम राज्य एक 0.25 ° चौड़ाई / लंबाई ग्रिड (721 × 1440) द्वारा प्रतिनिधित्व किया जाता है, जो इक्वाटर पर लगभग 28 × 28 किलोमीटर संकल्प के अनुरूप है (चित्र 1a), जहां प्रत्येक ग्रिड बिंदु सतह और वायुमंडलीय परिवर्तकों की एक सेट का प्रतिनिधित्व करता है (चित्र 1 में सूचीबद्ध)। GraphCast को एक तंत्रिका नेटवर्क आर्किटेक्चर के रूप में लागू किया जाता है, जो "कोड-प्रोसेस-डेकोड" कॉन्फ़िगरेशन में जीएनएन पर आधारित है [1], कुल 36.7 मिलियन मापदंडों के साथ। एन्कोडर (चित्रा 1 डी) एकल जीएनएन परत का उपयोग बदलावों को मानचित्रित करने के लिए करता है (नील-मीन यूनिट-वायरेंस के लिए सामान्य) इनपुट ग्रिड पर नोड विशेषताओं के रूप में प्रतिनिधित्व किया गया एक आंतरिक "मल्टी-मेश" प्रतिनिधित्व पर सीखा नोड विशेषताओं। The multi-mesh (Figure 1g) is a graph which is spatially homogeneous, with high spatial resolution over the globe. It is defined by refining a regular icosahedron (12 nodes, 20 faces, 30 edges) iteratively six times, where each refinement divides each triangle into four smaller ones (leading to four times more faces and edges), and reprojecting the nodes onto the sphere. The multi-mesh contains the 40,962 nodes from the highest resolution mesh, and the union of all the edges created in the intermediate graphs, forming a flat hierarchy of edges with varying lengths. प्रोसेसर (आंकड़ा 1e) मल्टी-मेश पर सीखा संदेश पारित करने के लिए 16 अनजान जीएनएन परतों का उपयोग करता है, जो संदेश पारित करने के कुछ चरणों के साथ प्रभावी स्थानीय और दीर्घकालिक जानकारी प्रसारण की अनुमति देता है। डिकोडर (चित्र 1f) अंतिम प्रोसेसर परत की सीखने वाली विशेषताओं को मल्टी-मेश प्रतिनिधित्व से वापस चौड़ाई-लंबाई ग्रिड तक नक्शा देता है. यह एकल जीएनएन परत का उपयोग करता है, और आउटपुट को नवीनतम इनपुट राज्य के लिए एक शेष अद्यतन के रूप में भविष्यवाणी करता है (उत्तर आउटपुट सामान्यीकरण के साथ लक्ष्य शेष पर यूनिट-वायरेंस प्राप्त करने के लिए). अधिक वास्तुकला विवरण के लिए पूरक अनुभाग 3 देखें. मॉडल विकास के दौरान, हमने ईसीएमडब्ल्यूएफ के ईआरए 5 [10] पुनः विश्लेषण आरेख से 39 वर्षों (1979–2017) के ऐतिहासिक डेटा का उपयोग किया। एक प्रशिक्षण उद्देश्य के रूप में, हमने औसत वर्ग त्रुटि (एमएसई) को ऊर्ध्वाधर स्तर पर वजन दिया। त्रुटि को GraphCast की पूर्वानुमानित स्थिति और N ऑटोरेग्रेसिव चरणों पर Corresponding ERA5 राज्य के बीच गणना की गई। N के मूल्य को प्रशिक्षण के दौरान 1 से 12 (यानी, छह घंटे से तीन दिन) तक बढ़ाया गया था. GraphCast को ग्रेडियंट डिस्प्ले और बैकप्रोप्लेशन का उपयोग करके प्रशिक्षण उद्देश्य को कम करने के लिए प्रशिक्षित किया गया था. प्रशिक्षण वास्तविक तैनाती परिदृश्यों के अनुरूप, जहां मॉडल विकास के लिए भविष्य की जानकारी उपलब्ध नहीं है, हमने 2018 के वर्षों से जारी किए गए डेटा के आधार पर GraphCast का मूल्यांकन किया (सप्लीमेंट्स अनुभाग 5.1 देखें)। जांच के तरीके हम बड़ी संख्या में परिवर्तकों, स्तरों और लीड टाइम पर HRES के साथ इसकी सटीकता की तुलना करके व्यापक रूप से GraphCast की पूर्वानुमान कौशल की पुष्टि करते हैं। प्रत्येक ग्रिड बिंदु पर GraphCast द्वारा पूर्वानुमानित 227 परिवर्तनीय और स्तर संयोजनों में से, हमने उनमें से 69 पर HRES के मुकाबले उनकी कौशल का मूल्यांकन किया, जो WeatherBench[27] के 13 स्तरों के अनुरूप हैं और ECMWF स्कोरकार्ड से परिवर्तनीय [9]; टेबल 1 और पूरक अनुभाग 1.2 में boldface परिवर्तनीय और स्तर देखें, जिनके लिए HRES चक्र मूल्यांकन अवधि के दौरान संचालित था। नोट, हम मूल्यांकन से कुल जलन को बाहर कर देते हैं क्योंकि ERA5 जलन डेटा में ज्ञात बाधाएं हैं [15]। मुख्य पाठ में रिपोर्ट किए गए समग्र प्रदर्शन के अलावा, पूरक अनुभाग 7 अन्य परिवर्तनीय, क्षेत्रीय प्रदर्शन, चौड़ाई और दबाव इन तुलनाओं को बनाने में, दो प्रमुख विकल्प इस प्रकार हैं कि कौशल कैसे स्थापित किया जाता है: (1) तुलना के लिए आधारभूत सत्य का चयन, और (2) डेटा संतुलन विंडो का सावधानीपूर्वक गणना, जो निरीक्षणों के साथ आधारभूत डेटा का उपयोग किया जाता है। हम GraphCast का मूल्यांकन करने के लिए आधारभूत सत्य के रूप में ERA5 का उपयोग करते हैं, क्योंकि यह ERA5 डेटा को इनपुट के रूप में लेने और ERA5 डेटा को आउटपुट के रूप में भविष्यवाणी करने के लिए प्रशिक्षित किया गया था। हालांकि, ERA5 के खिलाफ HRES पूर्वानुमानों का मूल्यांकन प्रारंभिक पूर्वानुमान चरण पर गैर शून्य त्रुटि का परिणाम देगा। इसके बजाय, हमने एक "HRES पूर् मौसम पूर्वानुमान डेटा की प्रकृति के कारण, यह ERA5 और HRES डेटा संसाधन विंडो के बीच अंतरों के सावधानीपूर्वक नियंत्रण की आवश्यकता होती है। हर दिन, HRES 00z, 06z, 12z और 18z पर केंद्रित चार +/-3h विंडो का उपयोग करके निरीक्षणों को संसाधित करता है (जहां 18z 18:00 UTC का मतलब है), जबकि ERA5 दो +9h/-3h विंडो का उपयोग करता है जो 00z और 12z पर केंद्रित हैं, या समान रूप से दो +3h/-9h विंडो जो 06z और 18z पर केंद्रित हैं। हमने 06z और 18z प्रारंभिककरणों से GraphCast के पूर्वानुमानों का मूल्यांकन करने का विकल्प चुना, यह सुनिश्चित करने के लिए कि इसके 06z और 18z पर प्रारंभ किए गए HRES के पूर्वानुमान केवल 3.75 दिनों के क्षितिज के लिए चलते हैं (HRES के 00z और 12z प्रारंभिक 10 दिनों के लिए चलते हैं). इसलिए, हमारे आंकड़े डैशलाइन के साथ एक संक्रमण का संकेत देंगे, जहां लाइन से पहले 3.5 दिन 06z और 18z पर प्रारंभ किए गए HRES के साथ तुलना होते हैं, और लाइन के बाद 00z और 12z पर प्रारंभिकता के साथ तुलना होते हैं। पूर्वानुमानों की जांच हम पाते हैं कि GraphCast मौसम पूर्वानुमान कौशल HRES की तुलना में अधिक है जब 10 दिनों के पूर्वानुमानों पर एक क्षैतिज संकल्प 0.25 ° चौड़ाई / लंबाई के लिए और 13 ऊर्ध्वाधर स्तरों पर मूल्यांकन किया जाता है। चित्रा 2a-c दिखाता है कि GraphCast (ब्लू लाइनों) कैसे RMSE कौशल, RMSE कौशल स्कोर (यानी, मॉडल ए और बुनियादी लाइन बी के बीच सामान्य RMSE अंतर (RMSEA − RMSEB)/RMSEB के रूप में परिभाषित) के रूप में HRES (ब्लू लाइनों) को z500 (जीओपोटेंशनल में 500 एचपीए) "हेडलाइन" क्षेत्र में बेहतर प्रदर्शन करता है) और ACC कौशल का उपयोग करता है। z500 का उपयोग करना, जो सिनोप्टिक स्केल दबाव वितरण को एन्कोड करता है, साहित्य में आम है, क्योंकि इसमें मजबूत मौसमगत महत्व है [27]। प्लॉटों में दिखाया गया है कि GraphCast के पास सभी लीड टाइम्स में बेह चित्रा 2d ईसीएमडब्ल्यूएफ स्कोरकार्ड के समान प्रारूप में 10 दिनों के पूर्वानुमानों के दौरान सभी 1380 मूल्यांकित परिवर्तकों और दबाव स्तरों के लिए आरएमएसई कौशल स्कोर को सारांशित करता है। सेल रंग कौशल स्कोर के अनुपात में हैं, जहां नीले GraphCast को बेहतर कौशल था और लाल HRES को उच्च कौशल था का संकेत देता है। GraphCast ने 1380 लक्ष्यों के 90.3% पर आरएमएसई से बेहतर प्रदर्शन किया, और महत्वपूर्ण रूप से (पी ≤ 0.05, नामांकित नमूना आकार n ∈ {729, 730}) लक्ष्य के 89.9% पर आरएमएस को बेहतर प्रदर्शन किया। पूरक विधि और पूरक तालिका 5 के लिए प्रभावी नमूना आकार वायुमंडल के उन क्षेत्रों में जिनमें एचआरईएस ग्राफकास्ट की तुलना में बेहतर प्रदर्शन करता था (स्कोरकार्डों में लाल शीर्ष पंक्तियां), स्ट्रैटोस्फेरिया में अपरिवर्तनीय रूप से स्थानित थीं, और प्रशिक्षण में सबसे कम नुकसान का वजन था (देखें पूरक अनुभाग 7.2.2)। जब 50 एचपीए स्तर को छोड़ दिया जाता है, तो ग्राफकास्ट बाकी 1280 लक्ष्यों के 96.9% पर एचआरईएस को काफी अधिक प्रदर्शन करता है। हमने पाया कि एमएसई हानि में स्वचालित रूप से पुनरावृत्ति के चरणों की संख्या में वृद्धि अधिक लंबे नेतृत्व समय पर ग्राफकास्ट प्रदर्शन में सुधार करती है (देखें पूरक अनुभाग 7.3.2) और इसे अंतरिक्ष रूप से चिकनी आउटपुट की भविष्यवाणी करके अपनी अनिश्चितता को व्यक्त करने के लिए प्रोत्साहित करती है, जिससे लंबे नेतृत्व समय पर अपने पूर्वानुमानों को गड़बड़ करने की अनुमति मिलती है (देखें पूरक अनुभाग 7.5.3)। हालांकि, एचआरईएस के अंतर्निहित भौतिक संस्करण गड़बड़ पूर्वानुमानों का कारण नहीं बनते हैं। यह मूल्यांकन करने के लिए कि यदि एचआरईएसईएस को अपने पूर्वानुमानों को गड़बड़ने की अनु हमने GraphCast की प्रदर्शन को शीर्ष प्रतिस्पर्धी एमएल-आधारित मौसम मॉडल, Pangu-Weather [4] के साथ भी तुलना की, और पाया कि GraphCast ने प्रस्तुत किए गए 252 लक्ष्यों में से 99.2% पर इसे बेहतर प्रदर्शन किया (अधिक जानकारी के लिए पूरक अनुभाग 6 देखें)। गंभीर घटनाओं का पूर्वानुमान वैकल्पिक और लीड टाइम की एक विस्तृत श्रृंखला पर HRES के मुकाबले GraphCast की पूर्वानुमान कौशल का मूल्यांकन करने के अलावा, हम यह भी मूल्यांकन करते हैं कि इसके पूर्वानुमान गंभीर घटनाओं, जिसमें उष्णकटिबंधीय साइक्लोन, वायुमंडल नदी, और चरम तापमान शामिल हैं, पूर्वानुमान का समर्थन कैसे करते हैं. ये मुख्य नीचे के अनुप्रयोग हैं जिनके लिए GraphCast विशेष रूप से प्रशिक्षित नहीं है, लेकिन जो मानव गतिविधि के लिए बहुत महत्वपूर्ण हैं. Tropical Cyclone ट्रैक ग्राफिक्स ट्राफिक साइक्लोन पूर्वानुमानों की सटीकता में सुधार, चोटों और जीवन की हानि को रोकने में मदद कर सकता है, साथ ही आर्थिक नुकसान को कम कर सकता है [21]. एक साइक्लोन के अस्तित्व, ताकत, और ट्रैकिंग एल्गोरिथ्म को geopotential (z), क्षैतिज हवा (U/10 v, U/v) और औसत समुद्र स्तर दबाव (MsL) के पूर्वानुमानों पर लागू करके पूर्वानुमान किया जाता है। हमने एक ट्रैकिंग एल्गोरिथ्म लागू किया है जो ECMWF के प्रकाशित प्रोटोकॉल [20] पर आधारित है और GraphCast के पूर्वानुमानों पर लागू किया है, ताकि साइक्लोन ट्रैक पूर्वानुमान चित्रा 3a दिखाता है कि GraphCast में 2018-2021 के दौरान HRES की तुलना में कम औसत ट्रैक त्रुटि है। क्योंकि HRES और GraphCast के लिए प्रति ट्रैक त्रुटि संबंधित हैं, हमने दोनों मॉडल के बीच प्रति ट्रैक जोड़े गए त्रुटि अंतर को भी मापा और पाया कि GraphCast 18 घंटे से 4.75 दिनों के लिए नेतृत्व समय के लिए HRES से काफी बेहतर है, जैसा कि चित्रा 3b में दिखाया गया है। वायुमंडलीय नदी वायुमंडलीय नदी वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडलीय वायुमंडली अत्यधिक गर्मी और ठंड अत्यधिक गर्मी और ठंड सामान्य जलवायु विज्ञान [19, 16, 18], जो खतरनाक हो सकते हैं और मानव गतिविधियों को बाधित कर सकते हैं के संदर्भ में बड़े विरूपणों की विशेषता है. हम HRES और GraphCast की क्षमता का मूल्यांकन करते हैं स्थान, दिन के समय और महीने के बीच शीर्ष 2% जलवायु विज्ञान के ऊपर घटनाओं की भविष्यवाणी करने में, 12 घंटे, 5 दिन, और 10 दिन के नेतृत्व समय पर 2 टन के लिए, उत्तरी और दक्षिणी गोलार्ध के माध्यम से भूमि क्षेत्रों के लिए, गर्मियों के महीनों के दौरान। हम 2 Tecast के पूर्वानुमानों को मध्यम जलवायु विज्ञान के संबंध में अलग-अलग विचलनों को प्रतिबिंबित करने के लिए संभावित विरोधाभासों को प्रतिबिंबित करने के चित्रा 3 डी में दिखाया गया है कि GraphCast की सटीकता रिकॉर्डिंग कोर 5 और 10 दिनों के नेतृत्व समय के लिए HRES के ऊपर हैं, जिसका सुझाव है कि GraphCast की पूर्वानुमानें सामान्य रूप से लंबे क्षितिज पर चरम वर्गीकरण पर HRES से बेहतर हैं। इसके विपरीत, HRES में 12 घंटे के नेतृत्व समय पर बेहतर परिशुद्धता रिकॉर्डिंग है, जो HRES पर GraphCast की 2T कौशल स्कोर के साथ अनुरूप है, जैसा कि चित्र 2d में दिखाया गया है। प्रशिक्षण डेटा के हाल के प्रभाव GraphCast को हाल के डेटा के साथ बार-बार फिर से प्रशिक्षित किया जा सकता है, जो मूल रूप से इसे मौसम के पैटर्न को कैप्चर करने की अनुमति देता है जो समय के साथ बदलते हैं, जैसे कि ENSO चक्र और अन्य oscillations, साथ ही साथ जलवायु परिवर्तन के प्रभाव। चित्रा 4 चार संस्करणों के कौशल स्कोर (GraphCast:<2018) द्वारा सामान्य किया गया है और HRES, z500 के लिए दिखाता है. हमने पाया कि जबकि 2018 से पहले प्रशिक्षित होने पर GraphCast की प्रदर्शन अभी भी 2021 में HRES के साथ प्रतिस्पर्धी है, 2021 से पहले प्रशिक्षण इसके कौशल स्कोर को और भी बेहतर बनाता है (देखें पूरक अनुभाग 7.1.3) हम अनुमान लगाते हैं कि यह हालिया प्रभाव हाल के मौसम प्रवृत्तियों को सटीकता में सुधार के लिए कैप्चर करने की अनुमति देता है। Conclusions HRES की तुलना में GraphCast की पूर्वानुमान कौशल और दक्षता से पता चलता है कि MLWP विधियों अब पारंपरिक मौसम पूर्वानुमान विधियों के साथ प्रतिस्पर्धी हैं. इसके अलावा, GraphCast की गंभीर घटना पूर्वानुमान पर प्रदर्शन, जिसके लिए यह सीधे प्रशिक्षित नहीं किया गया था, इसकी मजबूतता और नीचे की कीमत के लिए क्षमता का प्रदर्शन करता है. हम मानते हैं कि यह मौसम पूर्वानुमान में एक मोड़ बिंदु है, जो व्यक्तियों और उद्योगों द्वारा मौसम निर्भर निर्णय लेने की विस्तृतता को मजबूत करने के लिए नए मार्गों को खोलने में मदद करता है, सस्ते पूर्वानुमान को अधिक सटीक, अधिक सुलभ और विशिष्ट अनुप्रयोगों के लिए उपयुक्त बनाता है। With 36.7 million parameters, GraphCast is a relatively small model by modern ML standards, chosen to keep the memory footprint tractable. And while HRES is released on 0.1° resolution, 137 levels, and up to 1 hour time steps, GraphCast operated on 0.25° latitude-longitude resolution, 37 vertical levels, and 6 hour time steps, because of the ERA5 training data’s native 0.25° resolution, and engineering challenges in fitting higher resolution data on hardware. Generally GraphCast should be viewed as a family of models, with the current version being the largest we can practically fit under current engineering constraints, but which have potential to scale much further in the future with greater compute resources and higher resolution data. हमारे दृष्टिकोण का एक प्रमुख सीमा यह है कि अनिश्चितता का प्रबंधन कैसे किया जाता है। हमने निर्णायक पूर्वानुमानों पर ध्यान केंद्रित किया और एचआरईएस की तुलना में, लेकिन ईसीएमडब्ल्यूएफ के आईएफएस का दूसरा ध्रुव, एकीकृत पूर्वानुमान प्रणाली, एनएनएस, विशेष रूप से 10+ दिनों के पूर्वानुमानों के लिए महत्वपूर्ण है। मौसम गतिशीलता का गैर-लाइनरता का मतलब है कि लंबे नेतृत्व समय पर अनिश्चितता बढ़ती है, जो एकल निर्णायक पूर्वानुमान द्वारा अच्छी तरह से कैप्चर नहीं की जाती है। एनएनएस इसे कई, स्टोचैस्टिक पूर्वानुमानों को उत्पन्न करके संबोधित करता है, जो भविष्य के मौसम के अनुभवी वितरण को मॉडल करते हैं, हालां यह जोर देना महत्वपूर्ण है कि डेटा-आधारित एमएलडब्ल्यूपी महत्वपूर्ण रूप से उच्च गुणवत्ता वाले डेटा की बड़ी मात्रा पर निर्भर करता है, जो एनडब्ल्यूपी के माध्यम से संसाधित किया जाता है, और कि ईसीएमडब्ल्यूएफ के मार्स आर्काइव जैसे समृद्ध डेटा स्रोतों मूल्यवान हैं। इसलिए, हमारे दृष्टिकोण को पारंपरिक मौसम पूर्वानुमान विधियों के प्रतिस्थापन के रूप में नहीं माना जाना चाहिए, जिन्हें दशकों से विकसित किया गया है, कई वास्तविक दुनिया संदर्भों में सख्ती से परीक्षण किया गया है, और कई सुविधाएं प्रदान करते हैं जिन्हें हमने अभी तक अनुसंधान नहीं किया है। मौसम पूर्वानुमान के अलावा, GraphCast जलवायु और पारिस्थितिकी, ऊर्जा, कृषि, मानव और जैविक गतिविधि, साथ ही साथ अन्य जटिल गतिशील प्रणालियों सहित अन्य महत्वपूर्ण भू-क्षेत्र-समय पूर्वानुमान समस्याओं के लिए नए दिशाओं को खोल सकता है। डेटा और सामग्री उपलब्धता GraphCast का कोड और प्रशिक्षित वजन github पर सार्वजनिक रूप से उपलब्ध हैं https://github.com/ deepmind/graphcast. इस काम में यूरोपीय सेंटर for Medium Range Forecasting (ECMWF) से सार्वजनिक रूप से उपलब्ध डेटा का उपयोग किया गया है. हम ERA5, HRES और TIGGE उत्पादों के लिए ईसीएमडब्ल्यूएफ आर्काइव (असफल वास्तविक समय) उत्पादों का उपयोग करते हैं, जिनका उपयोग क्रिएटिव कॉमन्स Attribution द्वारा नियंत्रित किया जाता है 4.0 इंटरनेशनल (CC BY 4.0). हम https://www.ncei.noaa.gov/ products/international-best-track-archive और संदर्भ [13, 12] से IBTrACS संस्करण 4 का उपयोग करते हैं। चित्रा 1 में पृथ्वी बनावट का उपयोग CC BY 4.0 के तहत किया जाता है https://www.solarsystemscope.com/ textures/. मान्यताएं वर्गीकृत क्रम में, हम Kelsey Allen, Charles Blundell, Matt Botvinick, Zied Ben Bouallegue, Michael Brenner, Rob Carver, Matthew Chantry, Marc Deisenroth, Peter Deuben, Marta Garnelo, Ryan Keisler, Dmitrii Kochkov, Christopher Mattern, Piotr Mirowski, Peter Norgaard, Ilan Price, Chongli Qin, Sébastien Racanière, Stephan Rasp, Yulia Rubanova, Kunal Shah, Jamie Smith, Daniel Worrall, और हमारे काम के बारे में सलाह और प्रतिक्रिया के लिए अल्पसंख्यक अन्य लोगों के लिए धन्यवाद करते हैं। हम ECMWF को भी अनुसंधान समुदाय को अनमोल डेटा सेट प्रदान करने के लिए धन्यवाद देते हैं। प्रारंभिक अनुभाग का शैली D. Fan et al., Science Robotics, 4 संदर्भ [1] Peter W Battaglia, Jessica B Hamrick, Victor Bapst, Alvaro Sanchez-Gonzalez, Vinicius Zambaldi, Mateusz Malinowski, Andrea Tacchetti, David Raposo, Adam Santoro, Ryan Faulkner, आदि। [2] पी. बाउर, ए. थॉर्प, और जी ब्रुनेट. संख्यात्मक मौसम पूर्वानुमान की शांत क्रांति. प्रकृति, 525, 2015. [3] Stanley G Benjamin, John M Brown, Gilbert Brunet, Peter Lynch, Kazuo Saito, and Thomas W Schlatter. 100 years of progress in forecasting and NWP applications. Meteorological Monographs, 59:13–1, 2019. [4] Kaifeng Bi, Lingxi Xie, Hengheng Zhang, Xin Chen, Xiaotao Gu, और Qi Tian. Pangu-Weather: एक तेजी से और सटीक वैश्विक मौसम पूर्वानुमान के लिए 3 डी उच्च संकल्प मॉडल. arXiv preprint arXiv:2211.02556, 2022. [5] Philippe Bougeault, Zoltan Toth, Craig Bishop, Barbara Brown, David Burridge, De Hui Chen, Beth Ebert, Manuel Fuentes, Thomas M Hamill, Ken Mylne, et al. THORPEX इंटरैक्टिव ग्रैंड ग्लोबल इंटेलिजेंस. American Meteorological Society Bulletin, 91(8):1059–1072, 2010. [6] WE Chapman, AC Subramanian, L Delle Monache, SP Xie, और FM Ralph. मशीन सीखने के साथ वायुमंडलीय नदी पूर्वानुमान में सुधार. Geophysical Research Letters, 46(17-18):10627–10635, 2019. [7] Thomas W Corringham, F Martin Ralph, Alexander Gershunov, Daniel R Cayan, और Cary A Talbot. वायुमंडलीय नदियां पश्चिमी संयुक्त राज्य अमेरिका में बाढ़ के नुकसान को चलाती हैं. विज्ञान प्रगति, 5(12):eaax4631, 2019. [8] Lasse Espeholt, Shreya Agrawal, Casper Sønderby, Manoj Kumar, Jonathan Heek, Carla Bromberg, Cenk Gazen, Rob Carver, Marcin Andrychowicz, Jason Hickey, et al. 12 घंटे के बारिश पूर्वानुमान के लिए गहरे सीखने. प्रकृति संचार, 13(1):1-10, 2022. [9] T Haiden, Martin Janousek, J Bidlot, R Buizza, Laura Ferranti, F Prates, and F Vitart. Evaluation of ECMWF forecasts, including the 2018 upgrade. European Centre for Medium Range Weather Forecasts Reading, UK, 2018. [10] हंस हर्स्बैक, बिल बेल, पॉल बेरिसफोर्ड, शोजी हिराहारा, एंड्रास हॉरनी, जोएक्विन मुनोज-साबेटर, जूलियन निकोलस, कैरोल प्यूबे, रोलुका रेडु, डिनैंड शेपर्स, आदि। एआरए 5 वैश्विक पुनः विश्लेषण। रॉयल मेट्रोलॉजिकल सोसाइटी के तिमाही पत्रिका, 146(730):1999–2049, 2020। [11] Ryan Keisler. Forecasting global weather with graph neural networks. arXiv preprint arXiv:2202.07575, 2022. [12] Kenneth R Knapp, Howard J Diamond, James P Kossin, Michael C Kruk, Carl J Schreck, et al. अंतरराष्ट्रीय जलवायु प्रबंधन (IBTrACS) परियोजना के लिए सर्वश्रेष्ठ ट्रैक दस्तावेज़, संस्करण 4. https: //doi.org/10.25921/82ty-9e16, 2018 [13] Kenneth R Knapp, Michael C Kruk, David H Levinson, Howard J Diamond, और Charles J Neumann जलवायु प्रबंधन (IBTrACS) के लिए अंतरराष्ट्रीय सर्वश्रेष्ठ ट्रैक आर्काइव जो उष्णकटिबंधीय चक्रन डेटा को एकजुट करता है। [14] Thorsten Kurth, Shashank Subramanian, Peter Harrington, Jaideep Pathak, Morteza Mardani, David Hall, Andrea Miele, Karthik Kashinath, और Animashree Anandkumar। [15] डेविड ए लैवर्स, एड्रियान सिमन्स, फ्रेजा वामबर्ग, और मार्क जेड रोडवेल. जलवायु निगरानी के लिए ईआरए 5 बारिश का एक मूल्यांकन। रॉयल मेट्रोलॉजिकल सोसाइटी के तिमाही पत्रिका, 148(748):3152–3165, 2022. [16] Ignacio Lopez-Gomez, Amy McGovern, Shreya Agrawal, and Jason Hickey. Global extreme heat forecasting using neural weather models. Artificial Intelligence for the Earth Systems, pages 1–41, 2022. [17] कार्स्टेन मास और एस्पेरेन्जा कूटरो. MARS उपयोगकर्ता दस्तावेज. https://confluence. ecmwf.int/display/UDOC/MARS+user+documentation, 2022. [18] लिनस मैगनसन. 202208 - गर्मी की लहर - ब्रिटेन. https://confluence.ecmwf.int/display/ FCST/202208+-+Heatwave+-+UK, 2022. [19] Linus Magnusson, Thomas Haiden, और डेविड Richardson. चरम मौसम घटनाओं की पुष्टि: विशिष्ट पूर्वानुमान. यूरोपीय केंद्र मध्य सीमा मौसम पूर्वानुमान, 2014. [20] Linus Magnusson, Sharanya Majumdar, Rebecca Emerton, David Richardson, Magdalena Alonso-Balmaseda, Calum Baugh, Peter Bechtold, Jean Bidlot, Antonino Bonanni, Massimo Bonavita, et al. Tropical cyclone activities at ECMWF. ECMWF Technical Memorandum, 2021. [21] एंड्रयू बी मार्टिनज़. तूफान क्षति के लिए पूर्वानुमान सटीकता महत्वपूर्ण है. अर्थशास्त्र, 8(2):18, 2020। [22] Benjamin J Moore, Paul J Neiman, F Martin Ralph, और Faye E Barthold. नाशविले, टेनेसी में भारी बाढ़ के साथ जुड़े भौतिक प्रक्रियाओं, और 1–2 मई 2010 के दौरान आसपास: एक वायुमंडलीय नदी और मोज़ास्केल कॉन्वेक्टिव सिस्टम की भूमिका. Monthly Weather Review, 140(2):358–378, 2012. [23] पॉल जे Neiman, एफ मार्टिन राल्फ, गरी एक विक, जेसिका डी लंडक्विस्ट, और माइकल डी डेटिंगर. मौसम विशेषताएं और उत्तरी अमेरिका के पश्चिमी तट को प्रभावित करने वाले वायुमंडलीय नदियों के सतह पर वर्षा प्रभाव ssm / i उपग्रह निरीक्षणों के आठ वर्षों के आधार पर. जर्नल ऑफ हाइड्रोमेटेरोलॉजी, 9(1):22-47, 2008. [24] Tung Nguyen, Johannes Brandstetter, Ashish Kapoor, Jayesh K Gupta, और Aditya Grover. ClimaX: मौसम और जलवायु के लिए एक फाउंडेशन मॉडल. arXiv preprint arXiv:2301.10343, 2023. [25] Jaideep Pathak, Shashank Subramanian, Peter Harrington, Sanjeev Raja, Ashesh Chattopad-hyay, Morteza Mardani, Thorsten Kurth, David Hall, Zongyi Li, Kamyar Azizzadenesheli, et al. Fourcastnet: एक वैश्विक डेटा-आधारित उच्च संकल्प मौसम मॉडल अनुकूलित चारियर तंत्रिका ऑपरेटरों का उपयोग करते हुए। [26] Tobias Pfaff, Meire Fortunato, Alvaro Sanchez-Gonzalez, और Peter Battaglia. Learning mesh-based simulation with graph networks. In International Conference on Learning Representations, 2021. [27] Stephan Rasp, Peter D Dueben, Sebastian Scher, Jonathan A Weyn, Soukayna Mouatadid, और Nils Thuerey. WeatherBench: डेटा-आधारित मौसम पूर्वानुमान के लिए संदर्भ डेटा सेट. जर्नल of Advances in Modeling Earth Systems, 12(11):e2020MS002203, 2020. [28] Stephan Rasp और Nils Thuerey. Data-driven medium-range weather prediction with a resnet pretrained on climate simulations: A new model for weatherbench. जर्नल of Advances in Modeling Earth Systems, 13(2):e2020MS002405, 2021. [29] Suman Ravuri, Karel Lenc, Matthew Willson, Dmitry Kangin, Remi Lam, Piotr Mirowski, Megan Fitzsimons, Maria Athanassiadou, Sheleem Kashem, Sam Madge, et al. रेडार के गहरे जनरेटर मॉडल का उपयोग करते हुए कुशल बारिश कैस्टिंग. प्रकृति, 597(7878):672–677, 2021. [30] Takaya Saito और मार्क Rehmsmeier। सटीकता याद दिलाने की जिक्र बाइनरी वर्गीकरणों को असंतुलित डेटासेट पर मूल्यांकन करते समय ROC जिक्र की तुलना में अधिक सूचनात्मक है. PloS एक, 10(3):e0118432, 2015. [31] Alvaro Sanchez-Gonzalez, Jonathan Godwin, Tobias Pfaff, Rex Ying, Jure Leskovec, and Peter Battaglia. Learning to simulate complex physics with graph networks. In International Conference on Machine Learning, pages 8459–8468. PMLR, 2020. [32] Xingjian Shi, Zhihan Gao, Leonard Lausen, Hao Wang, Dit-Yan Yeung, Wai-kin Wong, और Wang-chun Woo. निचले स्तर के लिए गहरी सीखना: एक बेंचमार्क और एक नया मॉडल। [33] कैस्पर केए Sønderby, लास Espeholt, Jonathan Heek, Mostafa Dehghani, Avital Oliver, टिम Salimans, Shreya Agrawal, Jason Hickey, और Nal Kalchbrenner। Metnet: जलवायु पूर्वानुमान के लिए एक तंत्रिका मौसम मॉडल. arXiv प्रीप्रिंट arXiv:2003.12140, 2020. [34] रिचर्ड स्विनबैंक, मैसायोकी किउडा, पियर्स बुकनेन, लिज़ी फ्रूड, थॉमस एम. हैमिल, टिम डी. ह्यूसन, जूलिया एच. केलर, मायो मत्वेदा, जॉन मथवेंन, फ्लोरियन पैपेनबर्गर, माइकल शेरर, हेलेन ए. टिटली, लॉरेंस विल्सन, और म्यूनेहिको यामागुशी। टीआईजीजीई परियोजना और इसके उपलब्धि। अमेरिकी मौसम विज्ञान समाज की पत्रिका, 97(1):49 – 67, 2016. [35] Jonathan A Weyn, Dale R Durran, और Rich Caruana. मशीनें मौसम की भविष्यवाणी करना सीख सकते हैं? गहरी सीखने का उपयोग ऐतिहासिक मौसम डेटा से ग्रिडेड 500-hPa भू-प्रभावित ऊंचाई की भविष्यवाणी करने के लिए. जर्नल of Advances in Modeling Earth Systems, 11(8):2680–2693, 2019. [36] Jonathan A Weyn, Dale R Durran, और Rich Caruana. डेटा-आधारित वैश्विक मौसम पूर्वानुमान को गहरे क्यूबिक स्पेयर पर घर्षण तंत्रिका नेटवर्क का उपयोग करके सुधार. जर्नल of Advances in Modeling Earth Systems, 12(9):e2020MS002109, 2020. 1. डेटा इस अनुभाग में, हम GraphCast को प्रशिक्षित करने और मूल्यांकन करने के लिए इस्तेमाल किए गए डेटा की एक समीक्षा देते हैं (सप्लीमेंट्स अनुभाग 1.1), एनडब्ल्यूपी बेसलाइन एचआरईएस के पूर्वानुमानों को परिभाषित करने वाले डेटा, साथ ही HRES-fc0, जिसे हम एचआरईएस के लिए जमीन सत्य के रूप में उपयोग करते हैं (सप्लीमेंट अनुभाग 1.2)। हमने प्रशिक्षण और मूल्यांकन के लिए कई डेटासेट बनाए हैं, जिनमें ECMWF के डेटा आरेखों और IBTrACS [29, 28] के उपसेट शामिल हैं। 1.1. ERA5 GraphCast को प्रशिक्षित करने और मूल्यांकन करने के लिए, हमने ECMWF के ERA5 [24]1 आर्केजिंग के एक उपसेट से हमारे डेटासेट का निर्माण किया, जो 1959 से वर्तमान तक वैश्विक मौसम का प्रतिनिधित्व करने वाले डेटा का एक बड़ा कॉर्पस है, 0.25 ° चौड़ाई / लंबाई संकल्प, और 1 घंटे की वृद्धि, सैकड़ों स्थिर, सतह, और वायुमंडलीय परिवर्तकों के लिए। हमारे ईआरए 5 डेटासेट में ECMWF के ईआरए 5 संग्रह में उपलब्ध परिवर्तकों का एक उपसेट है (चित्रा 2), 37 दबाव स्तरों पर2: 1, 2, 3, 5, 7, 10, 20, 30, 50, 70, 100, 125, 150, 175, 200, 225, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 775, 800, 825, 850, 875, 900, 925, 950, 975, 1000 एचपीए। 1.2 गौरव एचआरईएस मॉडल आधार लाइन का मूल्यांकन करने के लिए दो अलग-अलग डेटा सेट की आवश्यकता होती है, अर्थात् पूर्वानुमान डेटा और जमीन सत्य डेटा, जिन्हें निम्नलिखित उपभागों में संक्षेपित किया जाता है. एचआरईएस संस्करण जो हमारे परीक्षण वर्षों के दौरान संचालित थे, टेबल 3 में दिखाए जाते हैं. HRES को आम तौर पर दुनिया में सबसे सटीक निर्णायक एनडब्ल्यूपी-आधारित मौसम मॉडल माना जाता है, इसलिए HRES आधार सूची का मूल्यांकन करने के लिए, हमने एक डेटासेट का निर्माण किया है जो HRES के आर्केड किए गए ऐतिहासिक पूर्वानुमानों का है. HRES को नियमित रूप से ECMWF द्वारा अपडेट किया जाता है, इसलिए ये पूर्वानुमान अनुमानों के समय नवीनतम HRES मॉडल का प्रतिनिधित्व करते हैं। HRES operational forecasts फिर हमने अंतरिक्ष रूप से पूर्वानुमानों को 0.25 ° चौड़ाई / लंबाई ग्रिड (ईआरए 5 की संकल्प के अनुरूप करने के लिए) के लिए कम नमूना किया, ECMWF के मेटव्यू लाइब्रेरी का उपयोग करके, डिफ़ॉल्ट पुनरावृत्ति पैरामीटरों के साथ। For evaluating the skill of the HRES operational forecasts, we constructed a ground truth dataset, “HRES-fc0”, based on ECMWF’s HRES operational forecast archive. This dataset comprises the initial time step of each HRES forecast, at initialization times 00z, 06z, 12z, and 18z (see Figure 5). The HRES-fc0 data is similar to the ERA5 data, but it is assimilated using the latest ECMWF NWP model at the forecast time, and assimilates observations from ±3 hours around the corresponding date and time. Note, ECMWF also provides an archive of “HRES Analysis” data, which is distinct from our HRES-fc0 dataset. The HRES Analysis dataset includes both atmospheric and land surface analyses, but is not the input which is provided to the HRES forecasts, therefore we do not use it as ground truth because it would introduce discrepancies between HRES forecasts and ground truth, simply due to HRES using different inputs, which would be especially prominent at short lead times. HRES-fc0 850hPa (z850) और 925hPa (z925) पर परिवर्तनीय भू-प्रभाव के लिए ECMWF HRES आरेख से मूल्यों का एक बहुत छोटा सा उप-सेट संख्या (NaN) नहीं है। इन NaNs 2016-2021 सीमा और पूर्वानुमान समय पर समान रूप से वितरित होने लगते हैं। यह z850 के लिए पिक्सेल के लगभग 0.00001% का प्रतिनिधित्व करता है (1 पिक्सेल हर दस 1440 x 721 चौड़ाई फ्रेम पर), z925 के लिए पिक्सेल के 0.00000001% (1 पिक्सेल हर दस हजार 1440 x 721 चौड़ाई फ्रेम पर) और प्रदर्शन पर कोई मापने योग्य प्रभाव नहीं है। HRES NaN handling 1.3. tropical cyclone डेटासेट उष्णकटिबंधीय साइक्लोन पूर्वानुमान के हमारे विश्लेषण के लिए, हमने IBTrACS [28, 29, 31, 30] संग्रह का उपयोग भूमि सत्य डेटासेट का निर्माण करने के लिए किया. इसमें लगभग एक दर्जन प्राधिकृत स्रोतों से ऐतिहासिक साइक्लोन ट्रैक शामिल हैं. प्रत्येक ट्रैक एक समय श्रृंखला है, 6 घंटे के अंतराल पर (00z, 06z, 12z, 18z), जहां प्रत्येक टाइमस्टेप उस समय के उस बिंदु पर साइक्लोन की आंख का प्रतिनिधित्व करता है। HRES आधार सूची के लिए, हमने TIGGE संग्रहालय का उपयोग किया, जो ऑपरेटिंग ट्रैकर के साथ अनुमानित सिक्लोन ट्रैक प्रदान करता है, जो 0.1 ° संकल्प [8, 46] पर HRES के पूर्वानुमानों से है। डेटा को https://confluence.ecmwf.int/display/TIGGE/Tools के तहत डाउनलोड के लिए उपलब्ध XML फ़ाइलों के रूप में संग्रहीत किया जाता है। डेटा को एक प्रारूप में परिवर्तित करने के लिए जो आगे के बाद-प्रसंस्करण और विश्लेषण के लिए उपयुक्त है, हमने एक विश्लेषक को लागू किया है जो रुचि के वर्षों के लिए सिक्लोन ट्रैक निकालता है। XML फ़ाइलों में प्रासंगिक अनुभागों (टैग) "प्रबंधित" ट्रैकर एल्गोरिदम और परिणामों के बारे में विस्तार के लिए अनुभाग 8.1 देखें। 2. नोटिंग और समस्या बयान इस अनुभाग में, हम पूरे दस्तावेज़ में उपयोगी समय नोट्स का वर्णन करते हैं (सेक्शन 2.1), हमने संबोधित की जाने वाली सामान्य पूर्वानुमान समस्या को औपचारिक रूप से परिभाषित करते हैं (सेक्शन 2.2) और विवरण देते हैं कि हम मौसम की स्थिति (सेक्शन 2.3) को कैसे मॉडलिंग करते हैं। 2.1 समय का वर्णन पूर्वानुमान में उपयोग किए जाने वाले समय का वर्णन भ्रमित हो सकता है, जिसमें कई अलग-अलग समय प्रतीक शामिल होते हैं, उदाहरण के लिए, प्रारंभिक पूर्वानुमान समय, वैधता समय, पूर्वानुमान क्षितिज आदि का वर्णन करने के लिए हम स्पष्टता और सरलता के लिए कुछ मानक शब्दों और वर्णन पेश करते हैं। हम समय में एक विशिष्ट बिंदु को "दिवसीय समय" के रूप में संदर्भित करते हैं, जो कैलेंडर की तारीख और यूटीसी समय द्वारा इंगित होता है. उदाहरण के लिए, 2018-06-21_18:00:00 का मतलब 21 जून, 2018 को 18:00 यूटीसी है. संक्षेप में, हम कभी-कभी ज़ुलू संधि का भी उपयोग करते हैं, अर्थात् 00z, 06z, 12z, 18 t: पूर्वानुमान समय चरण सूचकांक, जो पूर्वानुमान को प्रारंभ करने के बाद से चरणों की संख्या को सूचकांकित करता है। T: पूर्वानुमान क्षितिज, जो एक पूर्वानुमान में चरणों की कुल संख्या का प्रतिनिधित्व करता है। d: वैधता समय, जो एक विशेष मौसम की स्थिति की तारीख-समय को इंगित करता है। d0: पूर्वानुमान प्रारंभिककरण समय, एक पूर्वानुमान के प्रारंभिक इनपुट के वैधता समय को इंगित करता है। Δd: पूर्वानुमान चरण की अवधि, यह इंगित करती है कि एक पूर्वानुमान चरण के दौरान कितना समय गुजरता है। τ: पूर्वानुमान लीड टाइम, जो पूर्वानुमान में चले गए समय का प्रतिनिधित्व करता है (यानी, τ = tΔd)। 2. सामान्य पूर्वानुमान समस्या बयान समय d पर वैश्विक मौसम की सच्ची स्थिति का प्रतिनिधित्व करें. वास्तविक मौसम के समय के विकास को एक अंतर्निहित विशिष्ट-समय गतिशीलता फ़ंक्शन, Φ द्वारा प्रतिनिधित्व किया जा सकता है, जो वर्तमान के आधार पर अगले समय चरण (Δd भविष्य में) में राज्य उत्पन्न करता है, अर्थात्, Zd+Δd = Φ(Zd)। हमारा लक्ष्य एक सटीक और कुशल मॉडल खोजना है, φ, सच्ची गतिशीलता फ़ंक्शन, Φ, जो कुछ भविष्यवाणी क्षितिज, TΔd पर मौसम की स्थिति को प्रभावी ढंग से भविष्यवाणी कर सकता है। हम मानते हैं कि हम सीधे Zd का निरीक्षण नहीं कर सकते हैं, लेकिन इसके बजाय केवल कुछ आंशिक निरीक्षण Xd है, जो मौसम को सही ढंग से भविष्यवाणी करने के लिए आवश्यक राज्य जानकारी का एक अपूर्ण प्रतिनिधित्व है। Xd−Δd , Xd−2Δd , ..., Xd के अलावा मॉडल तब, सिद्धांत रूप में, इस अतिरिक्त संदर्भ जानकारी का लाभ उठा सकता है ताकि अधिक सटीक रूप से Zd का अनुमान लगाया जा सके। संतुलन (1) के समान, पूर्वानुमान X ̈d +Δd को एक पूर्ण पूर्वानुमान का उत्पादन करने के लिए ऑटोरेग्रेसिव रूप से φ में वापस डाला जा सकता है, हम φ के पूर्वानुमान की गुणवत्ता या कौशल का मूल्यांकन करके करते हैं कि पूर्वानुमानित ट्रैक्चर, X ̈d+Δd:d+T Δd, जमीन-सच्चाई ट्रैक्चर, Xd+Δd:d+TΔd से कितनी अच्छी तरह से मेल खाती है. हालांकि, यह फिर से उजागर करना महत्वपूर्ण है कि Xd+Δd:d+TΔd केवल हमारे Zd+Δd:d+TΔd के निरीक्षणों को शामिल करता है, जो स्वयं अनदेखी है. हम एक उद्देश्य कार्य के साथ पूर्वानुमानों और जमीन-सच्चाई के बीच सामंजस्य को मापते हैं, which is described explicitly in Section 5. हमारे काम में, डेटा और पूर्वानुमानों का समय संकल्प हमेशा Δd = 6 घंटे था, 10 दिनों के अधिकतम पूर्वानुमान क्षितिज के साथ, जो कुल T = 40 चरणों का अनुपालन करता है. चूंकि Δd इस दस्तावेज़ में एक निरंतर है, इसलिए हम समय को एक विशिष्ट तारीख-समय के बजाय एक पूर्ण संख्या के साथ सूचकांक करने के लिए (Xt, Xt+1, . . , Xt+T ) के बजाय (Xd, Xd+Δd , . . , Xd+TΔd ) का उपयोग करके नोटेशन को सरल कर सकते हैं। ECMWF मौसम डेटा मॉडलिंग मॉडल प्रशिक्षण और मूल्यांकन के लिए, हम अपने ईआरए 5 डेटासेट को सतह और वायुमंडलीय स्थिति के जमीन सत्य प्रतिनिधित्व के रूप में देखते हैं. जैसा कि अनुभाग 1.2 में वर्णित है, हमने एआरईएस के कौशल का मूल्यांकन करने के लिए जमीन सत्य के रूप में एआरईएस-एफसी 0 डेटासेट का उपयोग किया। हमारे डेटासेट में, एक ERA5 मौसम स्थिति Xt टेबल 2 में सभी परिवर्तनीयों को एक 0.25° क्षैतिज चौड़ाई-लंबाई संकल्प में शामिल करता है, जिसमें कुल 721 × 1440 = 1, 038, 240 ग्रिड पॉइंट्स और 37 ऊर्ध्वाधर दबाव स्तर हैं। वायुमंडलीय परिवर्तनीय सभी दबाव स्तरों पर परिभाषित होते हैं और (हॉरिज़ोनल) ग्रिड पॉइंट्स का सेट G0.25◦ = {−90.0, −89.75, . . . . , 90.0} × {−179.75, −179.5, . . . , 180.0} द्वारा दिया जाता है। इन परिवर्तनीयों को उनके संक्षिप्त नाम (और वायुमंडलीय परिवर्तनीयों के लिए दबाव स्तर) From all these variables, our model predicts 5 surface variables and 6 atmospheric variables for a total of 227 target variables. Several other static and/or external variables were also provided as input context for our model. These variables are shown in Table 1 and Table 2. The static/external variables include information such as the geometry of the grid/mesh, orography (surface geopotential), land-sea mask and radiation at the top of the atmosphere. हम Xt में उन परिवर्तकों के उप-सेट को संदर्भित करते हैं जो एक विशिष्ट ग्रिड बिंदु i (1,038,240 कुल) के अनुरूप हैं xt के रूप में, और 227 लक्षित परिवर्तकों के प्रत्येक परिवर्तक j को xt के रूप में। 3. GraphCast model इस खंड में GraphCast की एक विस्तृत विवरण प्रदान करता है, एक पूर्वानुमान (सेक्शन 3.1) के ऑटोरेग्रेसिव उत्पत्ति के साथ शुरू करते हुए, साधारण भाषा में वास्तुकला की एक समीक्षा (सेक्शन 3.2) के बाद, सभी ग्राफिक्स को परिभाषित करने के लिए एक तकनीकी विवरण GraphCast (सेक्शन 3.3) का परिभाषक (सेक्शन 3.4) के साथ-साथ प्रोसेसर (सेक्शन 3.5) और डिकोडर (सेक्शन 3.6) के साथ-साथ सभी मानकीकरण और पैरामीटरेशन विवरण (सेक्शन 3.7)। 3.1 एक अनुमान बनाना हमारे GraphCast मॉडल को एक कदम सीखने वाला सिमुलेटर के रूप में परिभाषित किया गया है जो समानता (2) में φ की भूमिका निभाता है और दो लगातार इनपुट राज्यों के आधार पर अगले चरण की भविष्यवाणी करता है, संतुलन (3) में की तरह, हम एक पूर्वानुमान का उत्पादन करने के लिए GraphCast को पुनः लागू कर सकते हैं of arbitrary length, 𝑇. This is illustrated in Figure 1b,c. We found, in early experiments, that two input states yielded better performance than one, and that three did not help enough to justify the increased memory footprint. 3.2 आर्किटेक्चर समीक्षा GraphCast की कोर आर्किटेक्चर एक "कोड-प्रोसेस-डेकोड" कॉन्फ़िगरेशन में जीएनएन का उपयोग करती है [6], जैसा कि चित्रा 1d,e,f में चित्रित किया गया है। जीएनएन-आधारित शिक्षित सिमुलेटर तरल पदार्थों और अन्य सामग्रियों की जटिल भौतिक गतिशीलता सीखने में बहुत प्रभावी हैं [43, 39], क्योंकि उनके प्रतिनिधित्वों और गणनाओं की संरचना सीखने वाले अंतिम तत्व समाधानकर्ताओं के समान है [1]। जीएनएन का एक महत्वपूर्ण लाभ यह है कि इनपुट ग्राफ की संरचना यह निर्धारित करती है कि प्रतिनिधित्व के किन भागों को सीखने वाले संदेश पारित करके एक दूसरे के साथ बातचीत करना है, जिससे किसी भी सीमा पर अंतरिक्ष बातचीत हम ग्रेफकस्ट के आंतरिक "मल्टी-मेश" प्रतिनिधित्व को पेश करने से जीएनएन की संभावना का लाभ उठाते हैं, जो कुछ संदेश पारित करने वाले चरणों के भीतर लंबी दूरी के बातचीत की अनुमति देता है और आम तौर पर दुनिया भर में समग्र अंतरिक्ष संकल्प है। यह एक चौड़ाई-लंबाई ग्रिड के विपरीत है जो ग्रिड बिंदुओं की अनियमित वितरण का कारण बनता है। हमारे मल्टी-मेश को एक नियमित icosahedron (12 नोड्स और 20 चेहरों) को 6 बार दोहराकर विभाजित करके बनाया गया है ताकि कुल 40,962 नोड्स और 81,920 चेहरों के उच्चतम संकल्प के साथ icosahedral मेषों की एक रीरेखेशन प्राप्त हो सके। हमने इस तथ्य का लाभ उठाया कि मोटे-मेश नोड्स फाइने-मेश नोड्स के उपसेट हैं, जिससे हमें सबसे अच्छी संकल्प के मेष पर मेष के सभी स्तरों से किनारों को अधिभारित करने की अनुमति मिली है। यह प्रक्रिया मेषों की एक बहु-स्केले सेट का उत्पादन करती है, जिसमें कई पैमाने पर लंबी दूरी को पुल करने वाले मोटे-मेश किनारों और स्थानीय बातचीत को कैप्चर GraphCast’s encoder (Figure 1d) first maps the input data, from the original latitude-longitude grid, into learned features on the multi-mesh, using a GNN with directed edges from the grid points to the multi-mesh. The processor (Figure 1e) then uses a 16-layer deep GNN to perform learned message-passing on the multi-mesh, allowing efficient propagation of information across space due to the long-range edges. The decoder (Figure 1f) then maps the final multi-mesh representation back to the latitude-longitude grid using a GNN with directed edges, and combines this grid representation, 𝑌ˆ𝑡+𝑘, with the input state, 𝑋ˆ𝑡+𝑘, to form the output prediction, 𝑋ˆ𝑡+𝑘+1 = 𝑋ˆ𝑡+𝑘 + 𝑌ˆ𝑡+𝑘. एन्कोडर और डिकोडर को एक नियमित रेखांकित ग्रिड में कच्चे डेटा को व्यवस्थित करने की आवश्यकता नहीं होती है, और इसे किसी भी मनमाने मेष-आधारित राज्य डिस्क्रेटेशन के लिए भी लागू किया जा सकता है [1]. सामान्य आर्किटेक्चर विभिन्न जीएनएन-आधारित सीखने वाले सिमुलेटरों पर बनाया जाता है जो कई जटिल तरल प्रणालियों और अन्य भौतिक क्षेत्रों [43, 39, 15]. मौसम पूर्वानुमान में समान दृष्टिकोणों का उपयोग किया गया था [26], आशाजनक परिणाम के साथ। एकल क्लाउड TPU v4 डिवाइस पर, GraphCast 60 सेकंड के भीतर 0.25 डिग्री संकल्प, 10 दिन की पूर्वानुमान (६ घंटे के चरणों पर) उत्पन्न कर सकता है। तुलना के लिए, ECMWF का आईएफएस सिस्टम 11.664 कोर क्लस्टर पर चलता है, और 0.1 डिग्री संकल्प उत्पन्न करता है, 10 दिन की पूर्वानुमान (पहले 90 घंटे के लिए 1 घंटे के चरणों में जारी किया गया है, घंटों के लिए 3 घंटे के चरण 93-144, और 150-240 घंटे से 6 घंटे के चरणों में, लगभग एक घंटे की कंप्यूट टाइम [41]। यहां HRES रिलीज विवरण देखें: https://www.ecmwf.int/en/forecasts/datasets/set 3.3 GraphCast का वर्णन GraphCast is implemented using GNNs in an “encode-process-decode” configuration, where the encoder maps (surface and atmospheric) features on the input latitude-longitude grid to a multi-mesh, the processor performs many rounds of message-passing on the multi-mesh, and the decoder maps the multi-mesh features back to the output latitude-longitude grid (see Figure 1). मॉडल एक ग्राफ G (VG, VM, EM, EG2M, EM2G) पर काम करता है, जो अगले पैराग्राफ में विस्तृत रूप से परिभाषित है। VG प्रत्येक ग्रिड नोड्स vG के प्रत्येक सेट का प्रतिनिधित्व करता है. प्रत्येक ग्रिड नोड एक दीर्घकालिक बिंदु पर वायुमंडल का एक ऊर्ध्वाधर टुकड़ा प्रतिनिधित्व करता है, अर्थात् प्रत्येक ग्रिड नोड vG से जुड़े विशेषताएं vG,features = [xt−1, xt, ft−1, ft, ft+1, ci], जहां xt ग्रिड नोड vG के साथ मेल खाते समय पर निर्भर मौसम राज्य Xt है और सभी 37 वायुमंडल स्तरों के लिए पूर्वानुमानित डेटा परिवर्तकों के साथ-साथ सतह परिवर्तकों को शामिल करता है. मजबूर शब्द ft समय पर निर्भर विशेषताओं से बना है जो विश्लेषणात्मक रूप से गणना की जा सकती हैं, और GraphCast द्वारा पूर्वानुमानित Grid nodes VM प्रत्येक मेष नोड्स vM. मेष नोड्स एक R-अनुकूलित icosahedral मेष MR. M0 एक यूनिट-रेडीस icosahedron (12 नोड्स और 20 त्रिकोण चेहरों) के साथ चेहरों के साथ एक सेट का प्रतिनिधित्व करता है. मेष नोड्स एक R-अनुकूलित icosahedral मेष MR. M0 के साथ दुनिया भर में समान रूप से रखा जाता है. मेष हर त्रिकोण चेहरे को 4 छोटे चेहरों में विभाजित करके, प्रत्येक किनारे के मध्य में एक अतिरिक्त नोड के परिणामस्वरूप होता है, और नए नोड्स को इकाई क्षेत्र में वापस प्रोजेक्ट करता है.4 विशेषताओं vM,हर मेष नोड्स vM से जुड़े विशेषताओं में चौड़ाई की Mesh nodes मुख्य रूप से, मेष के सभी स्तरों के लिए ईएम में मेष के किनार जोड़े जाते हैं, अर्थात्, सबसे अच्छी मेष, एम 6 के लिए, साथ ही साथ एम 5 के लिए, एम 4, एम 3, एम 2, एम 1 और एम 0 के लिए। यह सरल है क्योंकि परिष्करण प्रक्रिया कैसे काम करती है: एम -1 के नोड्स हमेशा श्री में नोडों के एक उपसेट होते हैं। इसलिए, कम परिष्करण स्तरों पर पेश किए गए नोड्स परिष्करण के सभी स्तरों के किनारों के संयुक्त सेट को शामिल करते हुए उच्चतम परिष्करण के स्तर से स्वतंत्र रूप से, लंबे रेंज संचार के लिए नोड्स के रूप में कार्य करते हैं। Mesh edges प्रत्येक एज eM को एक रिसीवर मेष नोड vM को एक रिसीवर मेष नोड vM से जोड़ने के लिए, हम vM→vM एज eM सुविधाओं का निर्माण करते हैं, जो मेष नोडों के इकाई क्षेत्र पर स्थिति का उपयोग करते हैं। इसमें एज के vM→vM की r लंबाई शामिल है, और रिसीवर नोड और रिसीवर नोड के 3d स्थितियों के बीच वेक्टर अंतर रिसीवर की एक स्थानीय समन्वय प्रणाली में गणना किया जाता है। रिसीवर की स्थानीय समन्वय प्रणाली को एक रोटेशन लागू करके गणना की जाती है जो एसिमूथल कोण को बदलता है जब तक कि रिसीवर नोड लंबाई 0 पर नहीं होता है, इसके बाद एक रोटेशन होता है जो ध्रुवीय कोण को बदलता है जब तक कि रिसीवर EG2M एकल दिशा के किनारे हैं जो भेजने वाले नेटवर्क नोड्स को रिसीवर नेटवर्क नोड्स से जोड़ते हैं. एक एज eG2M vG→vM जोड़ा जाता है यदि नेटवर्क नोड्स और नेटवर्क नोड्स के बीच की दूरी 0.6 गुना से छोटी है या बराबर है5 नेटवर्क M6 में किनारों की लंबाई (चित्र 1) जो सुनिश्चित करता है कि प्रत्येक नेटवर्क नोड्स को कम से कम एक नेटवर्क नोड्स से जुड़ा हुआ है। Grid2Mesh edges EM2G are unidirectional edges that connect sender mesh nodes to receiver grid nodes. For each grid point, we find the triangular face in the mesh 𝑀6 that contains it and add three Mesh2Grid edges of the form 𝑒M2G 𝑣M→𝑣G, to connect the grid node to the three mesh nodes adjacent s r to that face (see Figure 1). Features eM2G,features are built on the same way as those for the mesh 𝑣M→𝑣G s r edges. This results on a total of 3,114,720 Mesh2Grid edges (3 mesh nodes connected to each of the 721 × 1440 latitude-longitude grid points), each with four input features. Mesh2Grid edges 4. कोडिंग The purpose of the encoder is to prepare data into latent representations for the processor, which will run exclusively on the multi-mesh. As part of the encoder, we first embed the features of each of the grid nodes, mesh nodes, mesh edges, grid to mesh edges, and mesh to grid edges into a latent space of fixed size using five multi-layer perceptrons (MLP), Embedding the input features इसके बाद, ग्रिड नोड्स से ग्रिड नोड्स तक वायुमंडल की स्थिति की जानकारी स्थानांतरित करने के लिए, हम ग्रिड नोड्स से ग्रिड नोड्स को जोड़ने वाले Grid2M (VG, VM, EG2M) द्विपक्षीय उप-ग्राफ GG2M (GGG2M) पर एक एकल संदेश पारित करने के चरण को चलाते हैं। यह अद्यतन एक इंटरैक्शन नेटवर्क [5, 6] का उपयोग करके किया जाता है, जो कई नोड प्रकारों [2] के साथ काम करने में सक्षम होने के लिए बढ़ाया जाता है। Grid2Mesh GNN फिर मेष नोड्स में से प्रत्येक को उस मेष नोड तक पहुंचने वाले सभी किनारों से जानकारी एकत्र करके अपडेट किया जाता है: ग्रिड नोड्स में से प्रत्येक को भी अद्यतन किया जाता है, लेकिन कोई एकीकरण के बिना, क्योंकि ग्रिड नोड्स ग्रिड2मेश उपग्राफ में किसी भी किनारों के रिसीवर नहीं हैं, सभी तीन तत्वों को अद्यतन करने के बाद, मॉडल में एक शेष कनेक्शन शामिल है, और नोटेशन की सरलता के लिए, परिवर्तकों को पुनर्निर्देशित करता है, 3.5. Processor प्रोसेसर एक गहरी जीएनएन है जो मेष उपग्राफ जीएम (VM, EM) पर काम करता है जिसमें केवल मेष नोड्स और और मेष किनारों होते हैं. मेष किनारों में पूर्ण मल्टी-मेश होता है, न केवल एम 6 के किनारों के साथ, बल्कि एम 5, एम 4, एम 3, एम 2, एम 1 और एम 0 के सभी किनारों के साथ, जो लंबी दूरी संचार की अनुमति देगा। मेश जीएनएन का एकल परत एक मानक इंटरैक्शन नेटवर्क [5, 6] है जो पहले पड़ोसी नोड्स की जानकारी का उपयोग करके मेश के प्रत्येक किनारों को अपडेट करता है: Multi-mesh GNN Then it updates each of the mesh nodes, aggregating information from all of the edges arriving at that mesh node: और दोनों को अपडेट करने के बाद, प्रतिनिधित्वों को एक शेष कनेक्शन के साथ अपडेट किया जाता है और नोटेशन की सरलता के लिए, इनपुट परिवर्तकों को भी पुनर्निर्देशित किया जाता है: पिछला अनुच्छेद संदेश के एक एकल परत को पारित करने का वर्णन करता है, लेकिन [43, 39] के समान दृष्टिकोण के बाद, हमने इस परत को बार-बार 16 बार लागू किया, प्रत्येक परत में एमएलपी के लिए अनजान तंत्रिका नेटवर्क वजन का उपयोग करते हुए। 3.6 डिजाइनर डिकोडर का कार्य सूचना को ग्रिड में वापस लाना है, और एक आउटपुट निकालना है। Grid2Mesh GNN के समान, Mesh2Grid GNN Mesh2Grid bipartite subgraph GM2G (VG, VM, EM2G) पर एक ही संदेश चलाता है। Grid2Mesh GNN Mesh2Grid GNN के समान है, लेकिन Mesh2Grid किनारों का उपयोग विपरीत दिशा में जानकारी भेजने के लिए करता है। Mesh2Grid GNN Then it updates each of the grid nodes, aggregating information from all of the edges arriving at that grid node: In this case we do not update the mesh nodes, as they won’t play any role from this point on. यहां फिर से हम एक शेष कनेक्शन जोड़ते हैं, और नोटेशन की सरलता के लिए, परिवर्तकों को पुनर्निर्देशित करते हैं, इस बार केवल ग्रिड नोड्स के लिए, जो इस बिंदु से केवल आवश्यक हैं: अंत में, ग्रिड नोड्स के प्रत्येक के लिए पूर्वानुमान yi एक और MLP का उपयोग करके उत्पादित किया जाता है, Output function [43, 39] के समान, अगला मौसम राज्य, X ̈t + 1, सभी ग्रिड नोडों के लिए इनपुट राज्य के लिए प्रति नोड पूर्वानुमान, Y ̈t , जोड़कर गणना की जाती है, 3.7. मानकीकरण और नेटवर्क पैरामीटरेशन [43, 39] के समान, हमने सभी इनपुट को सामान्य किया। प्रत्येक भौतिक परिवर्तनीय के लिए, हमने 1979-2015 के दौरान प्रति दबाव स्तर औसत और मानक विचलन की गणना की, और उन्हें शून्य औसत और इकाई विचलन के लिए सामान्य करने के लिए इसका उपयोग किया। Input normalization चूंकि हमारे मॉडल एक अंतर, Y ̈t , जो निष्कर्षण के दौरान Xt को X ̈t + 1 का उत्पादन करने के लिए जोड़ा जाता है, उजागर करता है, इसलिए हमने प्रत्येक परिवर्तनीय के समय अंतर Yt = Xt+1 − Xt के लिए प्रति दबाव स्तर मानक विचलन आंकड़ों को गणना करके मॉडल के आउटपुट को सामान्य किया। Output normalization GraphCast के भीतर तंत्रिका नेटवर्क सभी एमएलपी हैं, एक छिपे हुए परत के साथ, और छिपे हुए और आउटपुट परतों के आकार 512 हैं (डिकोडर के एमएलपी के अंतिम परत को छोड़कर, जिसका आउटपुट आकार 227 है, प्रत्येक ग्रिड नोड के लिए पूर्वानुमानित परिवर्तकों की संख्या के अनुरूप)। Neural network parameterizations 4. प्रशिक्षण विवरण यह अनुभाग GraphCast प्रशिक्षण से संबंधित विवरण प्रदान करता है, जिसमें मॉडल विकसित करने के लिए उपयोग की जाने वाली डेटा विभाजन (अच्छे अनुभाग 4.1) शामिल है, प्रत्येक परिवर्तनीय और ऊर्ध्वाधर स्तर (अच्छे अनुभाग 4.2) के साथ जुड़े वजन के साथ उद्देश्य कार्य का पूरा परिभाषा, ऑट्रोरेक्सिव प्रशिक्षण दृष्टिकोण (अच्छे अनुभाग 4.3), अनुकूलन सेटिंग्स (अच्छे अनुभाग 4.4), प्रशिक्षण लागत को कम करने के लिए उपयोग की जाने वाली पाठ्यक्रम प्रशिक्षण (अच्छे अनुभाग 4.5), GraphCast की स्मृति पैरवी को कम करने के लिए इस्तेमाल की जाने वाली तकनीकी विवरण (अच्छे अनुभाग 4.6) और प्रशिक्षण समय (अच्छे अनुभाग 4.7) और हमने इस्तेमाल किया सॉफ्टवेयर स्टैक 4.1 प्रशिक्षण विभाजन To mimic real deployment conditions, in which the forecast cannot depend on information from the future, we split the data used to develop GraphCast and data used to test its performance “causally”, in that the “development set” only contained dates earlier than those in the “test set”. The development set comprises the period 1979–2017, and the test set contains the years 2018–2021. Neither the researchers, nor the model training software, were allowed to view data from the test set until we had finished the development phase. This prevented our choices of model architecture and training protocol from being able to exploit any information from the future. हमारे विकास सेट के भीतर, हमने डेटा को एक प्रशिक्षण सेट में विभाजित किया, जिसमें वर्ष 1979–2015 शामिल थे, और एक सत्यापन सेट जिसमें 2016–2017 शामिल थे। हमने अपने मॉडल के लिए प्रशिक्षण डेटा के रूप में प्रशिक्षण सेट का उपयोग किया और हाइपरपैरामीटर अनुकूलन और मॉडल चयन के लिए सत्यापन सेट का उपयोग किया, अर्थात्, सबसे अच्छा प्रदर्शन वाले मॉडल वास्तुकला का फैसला करने के लिए। 4.2. Training objective GraphCast को ERA5 लक्ष्यों के खिलाफ 12 चरणों के पूर्वानुमानों (3 दिन) के दौरान एक उद्देश्य कार्य को कम करने के लिए प्रशिक्षित किया गया था, ग्रेडिएंट गिरावट का उपयोग करते हुए। कहां τ ∈ 1 : Ttrain वे लीड टाइम्स हैं जो Ttrain ऑटोरेग्रेसिव चरणों के अनुरूप हैं। 𝑑0 ∈ 𝐷batch represent forecast initialization date-times in a batch of forecasts in the training set, j ∈ J परिवर्तनीय को सूचकांक देता है, और वायु परिवर्तनीयों के लिए दबाव का स्तर। i ∈ G0.25◦ ग्रिड में स्थान (विशेषता और लंबाई) समन्वय हैं, x ̈d0+τ और xd0+τ कुछ परिवर्तनीय स्तर, स्थान और नेतृत्व समय,j,i j,i के लिए पूर्वानुमान और लक्षित मूल्यों हैं 𝑠 𝑗 is the per-variable-level inverse variance of time differences, wj प्रति परिवर्तनीय स्तर के नुकसान का वजन है, ai चौड़ाई-लंबाई ग्रिड सेल का क्षेत्र है, जो चौड़ाई के साथ भिन्न होता है, और ग्रिड पर इकाई औसत के रूप में सामान्य किया जाता है। एक एकल स्केलर नुकसान का निर्माण करने के लिए, हमने चौड़ाई-लंबाई, दबाव के स्तर, परिवर्तनीय, प्लविंग समय, और बैच आकार के माध्यम से औसत लिया। मात्रा s = V hxt+1 − xt i −1 समय अंतर के समय अंतर के प्रति परिवर्तनीय-स्तरीय विरोधाभास अनुमान हैं, जिसका उद्देश्य यूनिट अंतर के लिए लक्ष्यों को मानकीकृत करना है। इन को प्रशिक्षण डेटा से अनुमानित किया गया था। हमने फिर प्रति परिवर्तनीय-स्तरीय नुकसान वजन लागू किया, अर्थात् वायुमंडल परिवर्तकों के लिए, हमने स्तर के दबाव के अनुपात के साथ स्तरों पर औसत किया, जैसे कि चित्र 6a में दिखाया गया है। हम घनत्व [26] के लिए एक प्रॉक्सी के रूप में यहां दबाव का उपयोग करते हैं। ध्यान दें कि दबाव स्तरों पर या 50 hPa के नीचे दबाव के लिए लागू नुकसान वजन, जहां HRES ग्राफकैस्ट की तुलना में बेहतर प्रदर्शन करने की 4.3. Training on autoregressive objective एक से अधिक चरणों में सटीक पूर्वानुमान बनाने की हमारी मॉडल की क्षमता में सुधार करने के लिए, हमने एक ऑटोरेग्रेसिव प्रशिक्षण योजना का उपयोग किया, जहां मॉडल के पूर्वानुमानित अगले चरण को अगले चरण की पूर्वानुमान के लिए इनपुट के रूप में वापस डाला गया था। अंतिम GraphCast संस्करण को 12 ऑटोरेग्रेसिव चरणों पर प्रशिक्षित किया गया था, नीचे वर्णित एक पाठ्यक्रम प्रशिक्षण कार्यक्रम के बाद। 4.4 अनुकूलन The training objective function was minimized using gradient descent, with mini-batches. We sampled ground truth trajectories from our ERA5 training dataset, with replacement, for batches of size 32. We used the AdamW optimizer [33, 27] with parameters (beta1 = 0.9, beta2 = 0.95). We used weight decay of 0.1 on the weight matrices. We used gradient (norm) clipping with a maximum norm value of 32. 4.5 प्रशिक्षण कार्यक्रम प्रशिक्षण मॉडल को तीन चरणों का एक पाठ्यक्रम का उपयोग करके आयोजित किया गया था, जिसमें सीखने की दरों और ऑट्रोरेजिव चरणों की संख्या में भिन्नता थी. पहला चरण 1000 ग्रेडेंट गिरावट अद्यतनों, एक ऑट्रोरेजिव चरण के साथ, और एक सीखने की दर की योजना का उपयोग करके किया गया था जो 0 से 1e−3 तक लाइनिक रूप से बढ़ी (चित्र 7a)। दूसरा चरण 299,000 ग्रेडेंट गिरावट अद्यतनों, एक बार फिर एक ऑट्रोरेजिव चरण के साथ, और एक सीखने की दर की योजना थी जो आधा-कोसिन गिरावट फ़ंक्शन (चित्र 7b) के साथ 0 तक वापस गिर गई। तीसरा चरण 11,000 ग्रेडेंट गिरावट अद्यतनों से बना था, जहां 4.6 स्मृति के निशान को कम करना एक क्लाउड टीपीयू v4 डिवाइस के 32 जीबी में लंबी मार्गों (12 ऑटोरेग्रेसिव कदम) को फिट करने के लिए, हम अपने मॉडल के मेमोरी पैटर्न को कम करने के लिए कई रणनीतियों का उपयोग करते हैं। सबसे पहले, हम 32 टीपीयू डिवाइस (यानी, प्रत्येक डिवाइस पर एक डेटा बिंदु) पर डेटा वितरित करने के लिए बैट्च पैरालेलिज्म का उपयोग करते हैं। 4.7 प्रशिक्षण समय प्रशिक्षण कार्यक्रम के बाद जो ऑटोरेग्रेसिव चरणों की संख्या को बढ़ाता है, जैसा कि ऊपर विस्तारित किया गया था, 32 TPU उपकरणों पर प्रशिक्षण GraphCast में लगभग चार सप्ताह लग गए। 4.8 सॉफ्टवेयर और हार्डवेयर स्टैक हम JAX [9], Haiku [23], Jraph [17], Optax, Jaxline [4] और xarray [25] का उपयोग हमारे मॉडल बनाने और प्रशिक्षित करने के लिए करते हैं। 5. निरीक्षण विधियों यह अनुभाग हमारे मूल्यांकन प्रोटोकॉल के बारे में विस्तृत जानकारी प्रदान करता है। अनुभाग 5.1 कारण के रूप में डेटा को विभाजित करने के लिए हमारे दृष्टिकोण को विस्तृत करता है, जिससे हमारे मूल्यांकन परीक्षणों को अर्थपूर्ण समग्रता के लिए सुनिश्चित किया जाता है, अर्थात्, भविष्य से जानकारी का लाभ उठाने के बिना। अनुभाग 5.2 हमारे HRES कौशल का मूल्यांकन करने और इसे GraphCast के साथ तुलना करने के लिए हमारे विकल्पों को और अधिक विस्तार से समझाता है, यह सुनिश्चित करने के लिए कि सभी विधियों को अपने इनपुट में और अपने लक्ष्यों में एक ही नतीजे का लाभ उठाने से बचने के लिए एक भूमि सच्चाई की आवश्यकता (अच्छे अनुभाग 5.2.1), ERA5 और HRES के विभिन्न संसाधन विंडो 5.1 प्रशिक्षण, सत्यापन और परीक्षण विभाजन परीक्षण चरण में, प्रोटोकॉल का उपयोग करके, जो विकास चरण के अंत में फ्रीज किया गया था (सेक्शन 4.1), हमने GraphCast के चार संस्करणों को प्रशिक्षित किया, उनमें से प्रत्येक को अलग-अलग अवधि पर। 2018–2021, 2019–2021, 2020–2021 और 2021 के अनुरूप। फिर से, इन विभाजनों ने मॉडल के एक संस्करण को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटा और इसके प्रदर्शन का मूल्यांकन करने के लिए इस्तेमाल किए जाने वाले डेटा के बीच एक कारणभेद बनाए रखा (चित्र 8 देखें)। हमारे अधिकांश परिणामों का मूल्यांकन 2018 में किया गया था (यानी, मॉडल को 1979–2017 में प्रशिक्षित किया गया था), कई अपवादों के साथ। सिक्लोन ट्रैकिंग प्रयोगों के लिए, हम 2018–2021 के परिणामों की रिपोर्ट करते हैं क्योंकि सिक्लोन इतने आम नहीं हैं, इसलिए अधिक वर्षों में नमूना आकार में वृद्धि होती है। हम एक निश्चित वर्ष पर भविष्यवाणी करने के लिए GraphCast का नवीनतम संस्करण का उपयोग करते हैं: Graph 5.2 GraphCast के साथ HRES की तुलना 5.2.1. Choice of ground truth datasets GraphCast को ERA5 डेटा की भविष्यवाणी करने के लिए प्रशिक्षित किया गया था, और इनपुट के रूप में ERA5 डेटा को लेने के लिए; हम हमारे मॉडल का मूल्यांकन करने के लिए ERA5 को भी जमीन की सच्चाई के रूप में उपयोग करते हैं. हालांकि, HRES पूर्वानुमानों को HRES विश्लेषण के आधार पर प्रारंभ किया जाता है. सामान्य तौर पर, अपने स्वयं के विश्लेषण के खिलाफ एक मॉडल की पुष्टि करना सबसे अच्छा कौशल अनुमान देता है [45]. इसलिए ERA5 जमीन की सच्चाई के खिलाफ HRES पूर्वानुमानों का मूल्यांकन करने के बजाय, जिसका मतलब है कि HRES पूर्वानुमानों के शून्य चरणों में भी कोई त्रुटि नहीं होगी, हमने एक "HRES पूर्वानुमान 5.2.2 समन्वय विंडो में समान दृष्टिकोण सुनिश्चित करना GraphCast और HRES के कौशल की तुलना करते समय, हमने ERA5 और HRES-fc0 डेटा संसाधन विंडो के बीच अंतरों को नियंत्रित करने के लिए कई विकल्प बनाए। अनुभाग 1 में वर्णित के रूप में, हर दिन HRES चार +/-3h विंडो का उपयोग करके 00z, 06z, 12z और 18z पर केंद्रित निरीक्षणों को संसाधित करता है (जहां 18z ज़ुलू संधि में 18:00 UTC का मतलब है), जबकि ERA5 दो +9h/-3h विंडो का उपयोग करता है जो 00z और 12z पर केंद्रित हैं, या समान रूप से दो +3h/-9h विंडो जो 06z और 18z पर केंद्रित हैं। उदाहरण के लिए चित्र 9 देखें। हमने GraphCast के पूर्वानुमानों चित्रा 10 GraphCast के प्रदर्शन को 06z/18z से प्रारंभ किया जाता है, और 00z/12z से प्रारंभ किया जाता है. जब एक बड़े lookahead राज्य से प्रारंभ किया जाता है, GraphCast एक दृश्य सुधार प्राप्त करता है जो लंबे lead समय पर जारी रहता है, जो 06z/18z से प्रारंभिक मूल्यांकन के लिए हमारे विकल्प का समर्थन करता है. हम मूल्यांकन करने के लिए लक्ष्य का चयन करते समय एक ही तर्क लागू करते हैं: हम केवल उन लक्ष्यों का मूल्यांकन करते हैं जो HRES और ERA5 दोनों के लिए एक 3h lookahead शामिल करते हैं. हमारे प्रारंभिक मूल्यांकन विकल्प 06z और 18z को देखते हुए, यह भविष्य के 06z और 18z विश्लेषण समय पर हर 12 घंटे का मूल्यांकन के अनुरूप है. एक व्यावहारिक उदा 5.2.3 प्रारंभिककरण और वैधता समय-दिन के अनुरूपता As stated above, a fair comparison with HRES requires us to evaluate GraphCast using 06z and 18z initializations, and with lead times which are multiples of 12h, meaning validity times are also 06z and 18z. 3.75 दिनों तक के लीड टाइम के लिए, 06z और 18z प्रारंभिककरण और वैधता टाइम का उपयोग करके संग्रहीत HRES पूर्वानुमान उपलब्ध हैं, और हम इन लीड टाइम पर GraphCast के साथ एक समान तुलना करने के लिए इन का उपयोग करते हैं। 4 दिनों और उससे अधिक के लिए, आर्केड किए गए HRES पूर्वानुमान केवल 00z और 12z प्रारंभिककरणों पर उपलब्ध हैं, जो हमारे 12 घंटे के बहुमूल्य नेतृत्व समय के आधार पर 00z और 12z वैधता समय का मतलब है। इन वैश्विक परिभाषित आरएमएसई की तुलना में, हम अनुमान लगाते हैं कि दिन के समय में अंतर HRES को थोड़ा लाभ देगा। चित्रा 11 में, हम देख सकते हैं कि 3.5 दिन के नेतृत्व समय तक, HRES RMSEs औसत 00z और 12z प्रारंभिकता / वैधता समय पर छोटे होते हैं, जबकि वे 06z और 18z समय पर होते हैं जिन पर GraphCast का मूल्यांकन किया जाता है। हम यह भी देख सकते हैं कि नेतृत्व समय बढ़ने के रूप में अंतर कम हो जाता है, और कि 06z/18z RMSEs आम तौर पर 00z/12z RMSE से ऊपर एक असीम्प्टोटी की ओर रुचि रखते हैं, लेकिन इसके 2% के भीतर। जब भी हम आरएमएसई और अन्य मूल्यांकन मीट्रिक को लीड टाइम के कार्य के रूप में वर्णित करते हैं, तो हम एक अंकित लाइन के साथ 3.5 दिन के बदलाव के बिंदु को इंगित करते हैं जहां हम 06z/18z पर एचआरईएस का मूल्यांकन करने से 00z/12z पर मूल्यांकन करने के लिए स्विच करते हैं। 5.2.4 मूल्यांकन की अवधि हमारे अधिकांश मुख्य परिणाम वर्ष 2018 (हमारे परीक्षण सेट से) के लिए रिपोर्ट किए गए हैं, जिनके लिए पहला पूर्वानुमान प्रारंभिक समय 2018-01-01_06:00:00 यूटीसी था और अंतिम 2018-12-31_18:00:00, या लंबे समय तक नेतृत्व समय पर एचआरईएस का मूल्यांकन करते समय, 2018-01-01_00:00:00 और 2018-12-31_12:00:00। 5.3. Evaluation metrics हम GraphCast, अन्य ML मॉडल, और HRES के कौशल की मात्रा को रूट औसत वर्ग त्रुटि (RMSE) और अनियमितता संरेखण संतुलन (ACC) का उपयोग करके मात्रा देते हैं, जो दोनों मॉडल के संबंधित जमीन सत्य डेटा के खिलाफ गणना की जाती हैं. RMSE एक निश्चित परिवर्तक के लिए अनुमानों और जमीन सत्य के बीच अंतर का आकार मापता है जिसे j द्वारा सूचकांकित किया गया है और एक निश्चित नेतृत्व समय τ (इमानना (20) देखें). ACC, Lj,τ, समानता (29) में परिभाषित किया गया है और मापता है कि मौसम से अनुमानित अंतर, अर्थात् एक स्थान और तारीख के लिए औसत मौसम, जलवायु से जमीन सत्य के अंतरों के संबंध में कितना अच्छा है. कौ All metrics were computed using float32 precision and reported using the native dynamic range of the variables, without normalization. हमने एक दिए गए परिवर्तनीय, x j, और लीड टाइम, τ = tΔd के लिए पूर्वानुमान कौशल की मात्रा निर्धारित की, जिसके द्वारा दी गई एक चौड़ाई-वजनित जड़ औसत वर्ग त्रुटि (RMSE) का उपयोग किया Root mean square error (RMSE) where • d0 ∈ Deval मूल्यांकन डेटासेट में पूर्वानुमान प्रारंभिक तारीख-समय का प्रतिनिधित्व करता है, • 𝑗 ∈ 𝐽 index variables and levels, e.g., 𝐽 = {z1000, z850, . . . , 2 T, MsL}, • i ∈ G0.25◦ ग्रिड में स्थान (विशेषता और लंबाई) समन्वय हैं, • x ̈d0 +τ और xd0 +τ कुछ परिवर्तनीय स्तर, स्थान और लीड टाइम के लिए पूर्वानुमानित और लक्ष्य मूल्य हैं, जी, जी, जी • ai चौड़ाई-लंबाई ग्रिड सेल का क्षेत्र है (ग्रिड पर औसत इकाई के रूप में सामान्य) जो चौड़ाई के साथ भिन्न होता है। पूर्वानुमान प्रारंभिककरणों पर औसत के भीतर वर्ग जड़ लेते हुए हम WeatherBench के अनुबंध का पालन करते हैं [41]. हालांकि, हम ध्यान देते हैं कि यह कई अन्य संदर्भों में RMSE को परिभाषित करने के तरीके से अलग है, जहां वर्ग जड़ केवल अंतिम औसत पर लागू होता है, अर्थात्, उन सभी तुलनाओं में जो भविष्यवाणियों को फ़िल्टर करते हैं, कटौती करते हैं या ग्लोबल हार्मोनिक डोमेन में विभाजित करते हैं, सुविधा के लिए हम सीधे ग्लोबल हार्मोनिक डोमेन में RMSEs की गणना करते हैं, सभी साधनों को वर्ग जड़ के अंदर लिया जाता है, Root mean square error (RMSE), spherical harmonic domain. यहां f ̈d0 +τ और f d0 +τ पूर्वानुमान और कुल तरंग संख्या j,l,m j,l,m के साथ ग्लोबल हार्मोनिक्स के लक्षित योग्यताएं हैं l और लंबी तरंग संख्या m. हम इन योग्यताओं को ग्रिड-आधारित डेटा से एक विशिष्ट सेल्फिक हार्मोनिक ट्रांसफार्मेशन [13] का उपयोग करके गणना करते हैं, जिसमें तरंग संख्या 719 पर त्रिकोणीय टर्नक्शन होता है, जिसे equator पर हमारे ग्रिड की 0.25° (28km) संकल्प को हल करने के लिए चुना गया था. इसका मतलब है कि l 0 से lmax = 719 तक और m −l से l तक होता है. This RMSE closely approximates the grid-based definition of RMSE given in Equation (21), however it is not exactly comparable, in part because the triangular truncation at wavenumber 719 does not resolve the additional resolution of the equiangular grid near the poles. यह RMSE परिभाषा (21) के अनुसार गणना की जाती है, लेकिन एकल स्थान के लिए: Root mean square error (RMSE), per location. हम भी केवल चौड़ाई पर RMSE को विभाजित करते हैं: जहां Eclon(G0.25◦) Eclon = 1440 हमारे नियमित 0.25° ग्रिड में अलग लंबाईों की संख्या है। यह समानता (21) के आरएमएसई परिभाषा के अनुसार गणना की जाती है, लेकिन सतह की ऊंचाई की एक विशिष्ट सीमा तक सीमित है, जो सतह geopotential पर सीमाओं zl ≤ zsurface < zu द्वारा दिया जाता है: Root mean square error (RMSE), by surface elevation. जहां ll संकेतक फ़ंक्शन को दर्शाता है। इस राशि को परिभाषित किया जाता है जैसे Mean bias error (MBE), per location. This quantifies the average magni-tude of the per-location biases from Equation (26) and is given by Root-mean-square per-location mean bias error (RMS-MBE). This quantifies the correlation between per-location biases (Equation (26)) of two different models A and B. We use an uncentered correlation coefficient because of the significance of the origin zero in measurements of bias, and compute this quantity according to Correlation of per-location mean bias errors. Anomaly correlation coefficient (ACC) हमने एक दिए गए परिवर्तनीय के लिए anomaly correlation coefficient, x j, और lead time, τ = tΔd, के अनुसार भी गणना की जहां Cd0 +τ एक निश्चित परिवर्तनीय, स्तर, चौड़ाई और लंबाई के लिए जलवायुगत औसत है, और वर्ष के दिन के लिए जो वैधता समय d0 + τ. जलवायुगत साधनों को 1993 और 2016 के बीच ERA5 डेटा का उपयोग करके गणना की गई थी। 5.4 सांख्यिकीय पद्धति 5.4.1 साधनों में अंतर के लिए महत्वपूर्णता परीक्षण प्रत्येक लीड टाइम τ और परिवर्तनीय स्तर j के लिए, हम GraphCast और HRES के लिए अनुपात (30)) में परिभाषित per-initialization-time RMSEs के बीच औसत अंतर के लिए परीक्षण करते हैं। हम [16] की पद्धति का पालन करते हुए ऑटो-कोरेलेशन के लिए सुधार के साथ एक जोड़े हुए दो-पक्षीय t-परीक्षण का उपयोग करते हैं। यह परीक्षण मानता है कि पूर्वानुमान स्कोर में अंतर के समय श्रृंखला को स्थिर Gaussian AR(2) प्रक्रियाओं के रूप में पर्याप्त रूप से मॉडल किया जाता है। हमारे परीक्षणों के लिए नामांकन नमूने का आकार n = 730 4 दिनों के अधीन समय पर होता है, जिसमें 2018 के 365 दिनों के दौरान प्रति दिन दो पूर्वानुमान प्रारंभिककरण होते हैं। (हम 4 दिनों के अधीन समय के लिए n = 729, देखें अनुभाग 5.4.2) हालांकि, ये डेटा (प्रभावित RMSEs में अंतर) समय में स्वचालित रूप से संबंधित होते हैं। [16] के बाद, हम मानक त्रुटि के लिए एक मुद्रास्फीति कारक k का अनुमान लगाते हैं जो इसके लिए सही होता है। हमारे महत्वपूर्णता परीक्षणों के विस्तृत परिणामों के लिए तालिका 5 देखें, जिसमें p-values, t-test statistics और neff के मूल्यों शामिल हैं। 5.4.2 पूर्वानुमान संरेखण लाइट टाइम τ 4 दिनों से कम के लिए, हमारे पास GraphCast और HRES दोनों के लिए प्रत्येक दिन 06z और 18z प्रारंभिककरण और वैधता समय पर पूर्वानुमान उपलब्ध हैं, और हम इन जोड़े गए पूर्वानुमानों के बीच RMSEs में अंतरों के लिए परीक्षण कर सकते हैं। हम मतभेदों की गणना करते हैं जिसका उपयोग हम इस null hypothesis का परीक्षण करने के लिए करते हैं कि E[diff-RMSE( j, τ, d0)] = 0 दो-पक्षीय alterna-tive के खिलाफ। As discussed in Section 5.2.3, at lead times of 4 days or more we only have HRES forecasts available at 00z and 12z initialization and validity times, while for the fairest comparison (Section 5.2.2) GraphCast forecasts must be evaluated using 06z and 18z initialization and validity times. In order to perform a paired test, we compare the RMSE of a GraphCast forecast with an interpolated RMSE of the two HRES forecasts either side of it: one initialized and valid 6 hours earlier, and the other initialized and valid 6 hours later, all with the same lead time. Specifically we compute differences: We can use these to test the null hypothesis 𝔼[diff-RMSEinterp( 𝑗, 𝜏, 𝑑0)] = 0, which again doesn’t depend on 𝑑0 by the stationarity assumption on the differences. If we further assume that the HRES RMSE time series itself is stationary (or at least close enough to stationary over a 6 hour window) then 𝔼[diff-RMSEinterp( 𝑗, 𝜏, 𝑑0)] = 𝔼[diff-RMSE( 𝑗, 𝜏, 𝑑0)] and the interpolated differences can also be used to test deviations from the original null hypothesis that 𝔼[diff-RMSE( 𝑗, 𝜏, 𝑑0)] = 0. This stronger stationarity assumption for HRES RMSEs is violated by diurnal periodicity, and in Section 5.2.3 we do see some systematic differences in HRES RMSEs between 00z/12z and 06z/18z validity times. However as discussed there, these systematic differences reduce substantially as lead time grows and they tend to favour HRES, and so we believe that a test of 𝔼[diff-RMSE( 𝑗, 𝜏, 𝑑0)] = 0 based on diff-RMSEinterp will be conservative in cases where GraphCast appears to have greater skill than HRES. 5.4.3. Confidence intervals for RMSEs The error bars in our RMSE skill plots correspond to separate confidence intervals for 𝔼[RMSE𝐺𝐶] and 𝔼[RMSE𝐻𝑅𝐸𝑆] (eliding or now the arguments 𝑗, 𝜏, 𝑑0). These are derived from the two-sided 𝑡-test with correction for autocorrelation that is described above, applied separately to GraphCast and HRES RMSE time-series. ये भरोसेमंद अंतराल अलग GraphCast और HRES RMSE समय श्रृंखला के लिए एक स्थिरता धारणा बनाते हैं, जो जैसा कि ऊपर कहा गया है, एक मजबूत धारणा है कि अंतराल की स्थिरता और थोड़ा उल्लंघन किया जाता है। 5.4.4 RMSE कौशल स्कोर के लिए भरोसेमंद अंतराल अनुच्छेद 5.4.1 में वर्णित टी-टेस्ट से हम आरएमएसई में सच्चे अंतर के लिए मानक तरीके से विश्वास अंतराल भी प्राप्त कर सकते हैं, हालांकि हमारे कौशल स्कोर प्लेट्स में हम सच्चे आरएमएसई कौशल स्कोर के लिए विश्वास अंतराल दिखाना चाहते हैं, जिसमें सच्चा अंतर आरएमएसई के सच्चे आरएमएसई द्वारा सामान्य किया जाता है: इस मात्रा के लिए एक भरोसेमंद अंतराल को हमारे सच्चे HRES RMSE के अनुमान की अनिश्चितता को ध्यान में रखना चाहिए. [ldiff, udiff] संख्याक के लिए हमारे 1 − α/2 भरोसेमंद अंतराल (RMSEs में अंतराल) और [lHRES, uHRES] नामक के लिए हमारे 1 − α/2 भरोसेमंद अंतराल (HRES RMSE) होने दें. यह देखते हुए कि 0 < lHRES प्रत्येक मामले में हमारे लिए, अंतराल गणित और यूनियन बंधन का उपयोग करके हम एक संरक्षित 1 − α भरोसेमंद अंतराल प्राप्त करते हैं RMSE-SStrue के लिए. हम RMSE कौशल स्कोर के हमारे अनुमानों के साथ इन विश्वास अंतरालों को योजना बनाते हैं, हालांकि ध्यान दें कि हम महत्वपूर्णता परीक्षण के लिए उन पर भरोसा नहीं करते हैं। 6. पिछले मशीन सीखने बेसलाइनों के साथ तुलना यह निर्धारित करने के लिए कि GraphCast के प्रदर्शन अन्य ML विधियों के साथ कैसे तुलना करता है, हम Pangu-Weather [7] पर ध्यान केंद्रित करते हैं, एक मजबूत MLWP आधार लाइन जो 0.25 ° संकल्प पर काम करता है। सबसे प्रत्यक्ष तुलना करने के लिए, हम अपने मूल्यांकन प्रोटोकॉल से बाहर निकलते हैं, और [7] में वर्णित का उपयोग करते हैं। क्योंकि प्रकाशित Pangu-Weather परिणाम 00z/12z प्रारंभिकताओं से प्राप्त होते हैं, हम GraphCast के लिए उसी प्रारंभिकताओं का उपयोग करते हैं, 06z/18z के बजाय, जैसा कि इस दस्तावेज़ के बाकी हिस्सों में है। यह दोनों मॉडलों को एक ही इनपुट पर प्रारंभ करने की अनुमति देता है, जो [7] में वर्णित हैं, जैसा कि चित्र 12 में दिखाया गया है, GraphCast (ब्लू लाइनों) लक्ष्य के 99.2% पर Pangu-Weather [7] (लाल लाइनों) से बेहतर प्रदर्शन करता है। सतह परिवर्तकों (2 टी, 10 यू, 10 वी, एमएसएल) के लिए, पहले कुछ दिनों में GraphCast की त्रुटि लगभग 10-20% कम होती है, और लंबे समय के प्लू टाइम्स पर लगभग 7-10% कम त्रुटि होती है। 7. अतिरिक्त पूर्वानुमान सत्यापन परिणाम इस खंड में GraphCast के प्रदर्शन की अतिरिक्त विश्लेषण प्रदान करता है, जो इसके ताकतों और सीमाओं की एक अधिक पूर्ण तस्वीर देता है। खंड 7.1 अतिरिक्त परिवर्तकों और z500 से परे स्तरों पर दस्तावेज़ के मुख्य परिणामों को पूरक करता है। खंड 7.2 GraphCast प्रदर्शन को क्षेत्रों, चौड़ाई और दबाव स्तरों द्वारा विभाजित करता है (विशेष रूप से थ्रोपोपोआस के नीचे और ऊपर के प्रदर्शन को अलग करता है), यह सुनिश्चित करने के लिए कि GraphCast की उत्तेजना और RMSE को चौड़ाई और ऊंचाई द्वारा बढ़ाया गया है। खंड 7.3 दर्शाता है कि दोनों मल्टी-मेश और ऑटोरेग्रेजिव नुकसान GraphCast के प्रदर्शन में एक महत्वपूर्ण भूमिका निभाते हैं। खंड 7. 7.1. Detailed results for additional variables 7.1.1 RMSE और ACC चित्रा 13 चित्रा 2a-b को पूरक करता है और GraphCast और HRES के लिए HRES के संबंध में RMSE और मानक RMSE अंतर को 12 चिह्नित परिवर्तकों के संयोजन पर दिखाता है। चित्रा 14 GraphCast और HRES के लिए HRES के संबंध में ACC और मानक ACC अंतर को 12 परिवर्तकों के संयोजन पर दिखाता है और चित्रा 2c को पूरक करता है। 7.1.2. RMSE तुलना के लिए विस्तृत महत्वपूर्णता परीक्षण परिणाम तालिका 5 GraphCast और HRES के बीच RMSE में अंतरों के बारे में मुख्य अनुभाग में किए गए सांख्यिकीय महत्व दावों के बारे में अधिक जानकारी प्रदान करता है। विधि के विवरण अनुभाग 5.4 में दिए गए हैं. यहां हम सभी परिवर्तकों के लिए पी-मान, परीक्षण आंकड़ों और प्रभावी नमूना आकार प्रदान करते हैं. अंतरिक्ष के कारण हम खुद को तीन प्रमुख लीड टाइम (12 घंटे, 2 दिन और 10 दिन) और 7 दबाव स्तरों के एक उपसेट पर सीमित करते हैं जिन्हें उन सभी मामलों को शामिल करने के लिए चुना गया है जहां इन लीड टाइम पर पी > 0.05। 7.1.3. Effect of data recency on GraphCast MLWP विधियों का एक महत्वपूर्ण विशेषता यह है कि उन्हें नियमित रूप से नवीनतम डेटा के साथ फिर से प्रशिक्षित किया जा सकता है. यह, सिद्धांत रूप में, उन्हें हाल के मौसम पैटर्न को मॉडलिंग करने की अनुमति देता है जो समय के साथ बदलते हैं, जैसे कि एनएसओ चक्र और अन्य oscillations, साथ ही साथ जलवायु परिवर्तन के प्रभाव. यह पता लगाने के लिए कि प्रशिक्षण डेटा की हालियाता GraphCast के परीक्षण प्रदर्शन को कैसे प्रभावित करती है, हमने GraphCast के चार संस्करणों को प्रशिक्षित किया, जिसमें प्रशिक्षण डेटा हमेशा 1979 में शुरू होता है, लेकिन 2017 में समाप्त होता है, 2018, 2019 और 2020 (हमने 2017 में समाप्त होने वाले संस्करण को "GraphCast:<2018", आदि के रूप में लेबल किया)। चित्रा 15 चार वर्गीकरणों के लिए GraphCast के चार संस्करणों के कौशल और कौशल स्कोर (HRES के संबंध में) को दर्शाता है, कई बदलावों के लिए और चित्रा 4a को पूरक करता है। एक सामान्य प्रवृत्ति है जहां परीक्षण वर्ष के करीब वर्षों के लिए प्रशिक्षित संस्करणों ने आम तौर पर HRES के खिलाफ कौशल स्कोर में सुधार किया है। इस सुधार का कारण पूरी तरह से समझा नहीं जाता है, हालांकि हम अनुमान लगाते हैं कि यह दीर्घकालिक पूर्वाग्रह सुधार के समान है, जहां मौसम में हाल के सांख्यिकीय पूर्वाग्रहों को सटीकता में सुधार करने के लिए प्रयोग किया जाता है। यह भी ध्यान देने योग्य है कि HRES वर्षों के माध्यम से एक ही NWP नहीं है: यह वर्ष में एक या दो बार यह यह भी योगदान दे सकता है कि क्यों GraphCast:<2018 और GraphCast:<2019, विशेष रूप से, 2021 परीक्षण मूल्यांकन के लिए प्रारंभिक अग्रणी समय में HRES के मुकाबले कम कौशल स्कोर हैं. हम ध्यान देते हैं कि अन्य परिवर्तकों के लिए, GraphCast:<2018 और GraphCast:<2019 अभी भी HRES से बेहतर प्रदर्शन करते हैं. ये परिणाम GraphCast की एक महत्वपूर्ण विशेषता को उजागर करते हैं, जो कि हाल के डेटा पर पुनः प्रशिक्षण करके प्रदर्शन को स्वचालित रूप से सुधारने की अनुमति देता है. 7.2. Disaggregated results 7.2.1 RMSE क्षेत्रों के अनुसार पूर्वानुमान कौशल के क्षेत्रीय मूल्यांकन चित्र 17 और 18 में प्रदान किया गया है, ECMWF स्कोरकार्डों (https://sites.ecmwf.int/ifs/scorecards/ scorecards-47r3HRES.html) के रूप में एक ही क्षेत्रों और नाम कन्वेंशन का उपयोग करते हुए। हम पूरे ग्रह के बेहतर कवरेज के लिए कुछ अतिरिक्त क्षेत्रों को जोड़ा। 7.2.2 सीमा और दबाव स्तर के अनुसार RMSE कौशल स्कोर चित्रा 19 में, हम GraphCast और HRES के बीच सामान्य RMSE अंतरों को दोनों दबाव स्तर और चौड़ाई के कार्य के रूप में चित्रित करते हैं. हम WeatherBench [41] से केवल 13 दबाव स्तरों को चित्रित करते हैं जिन पर हमने HRES का मूल्यांकन किया है. On these plots, we indicate at each latitude the mean pressure of the tropopause, which separates the troposphere from the stratosphere. We use values computed for the ERA-15 dataset (1979-1993), given in Figure 1 of [44]. These will not be quite the same as for ERA5 but are intended only as a rough aid to interpretation. We can see from the scorecard in Figure 2 that GraphCast performs worse than HRES at the lowest pressure levels evaluated (50hPa). Figure 19 shows that the pressure level at which GraphCast starts to get worse is often latitude-dependent too, in some cases roughly following the mean level of the tropopause. हम कम दबाव के स्तरों के लिए एक कम नुकसान वजन का उपयोग करते हैं और यह कुछ भूमिका निभा रहा हो सकता है; यह भी संभव है कि एआरए 5 और एचआरईएस-एफसी 0 डेटासेट्स के बीच अंतर हो सकता है stratosphere में परिवर्तकों की भविष्यवाणी में। 7.2.3 चौड़ाई और लंबी दूरी के लिए बाइज़ छवियों 20 से 22 में, हम ग्राफकास्ट के औसत पूर्वाग्रह त्रुटि (एमबीई, या केवल 'अनुकूलन' में परिभाषित (26)) को चौड़ाई और लंबी दूरी के कार्य के रूप में तीन अग्रणी समय पर वर्णित करते हैं: 12 घंटे, 2 दिन और 10 दिन। दबाव के स्तर पर दिए गए परिवर्तकों के लिए फ्लॉट में, हमने उन क्षेत्रों को छिपाया है जिनकी सतह ऊंचाई पर्याप्त उच्च है कि दबाव का स्तर औसत में मिट्टी के तहत है. हम यह निर्धारित करते हैं कि यह तब होता है जब सतह भू-प्रभावक एक ही स्थान और दबाव के स्तर पर जलवायुगत औसत भू-प्रभावक से अधिक होता है. इन क्षेत्रों में, परिवर्तक को आमतौर पर मिट्टी के तहत इंटरपोल किया गया है और एक सच्चा वायुमंडलीय मूल्य का प्रतिनिधित्व नहीं करेगा. To quantify the average magnitude of the per-location biases shown in Figures 20 to 22, we computed the root-mean-square of per-location mean bias errors (RMS-MBE, defined in Equation (26)). These are plotted in Figure 23 for GraphCast and HRES as a function of lead time. We can see that GraphCast’s biases are smaller on average than HRES’ for most variables up to 6 days. However they generally start to exceed HRES’ biases at longer lead times, and at 4 days in the case of 2m temperature. हमने GraphCast और HRES के प्रति-स्थानीय औसत पूर्वाग्रह त्रुटियों के बीच एक संरेखण कारक भी गणना की (अनुशासन (27) में परिभाषित), जो चित्रा 24 में लीड टाइम के एक कार्य के रूप में चित्रित किया गया है। 7.2.4 यूआरएमएसई कौशल स्कोर चौड़ाई और लंबी दूरी के अनुसार In Figures 25 to 27, we plot the normalized RMSE difference between GraphCast and HRES by latitude and longitude. As in Section 7.2.3, for variables given on pressure levels, we have masked out regions whose surface elevation is high enough that the pressure level is below ground on average. उल्लेखनीय क्षेत्रों में जहां HRES GraphCast से बेहतर प्रदर्शन करता है, विशेष रूप से ध्रुवों (विशेष रूप से दक्षिणी ध्रुवों) के पास विशिष्ट आर्द्रता शामिल है; ध्रुवों के पास geopotential; ध्रुवों के पास 2m तापमान और कई भूमि क्षेत्रों पर; और उच्च सतह ऊंचाई वाले क्षेत्रों में सतह या लगभग सतह परिवर्तनकों की एक संख्या (और अनुभाग 7.2.5 देखें)। 12 घंटे और 2 दिनों के लीड टाइम पर GraphCast और HRES दोनों को 06z/18z प्रारंभिककरण और वैधता समय पर मूल्यांकन किया जाता है, हालांकि 10 दिनों के लीड टाइम पर हमें 06z/18z पर GraphCast और 00z/12z पर HRES की तुलना करनी चाहिए (देखें अनुभाग 5)। 7.2.5 सतह ऊंचाई के अनुसार RMSE कौशल स्कोर चित्रा 25 में, हम देख सकते हैं कि GraphCast 12 घंटे के नेतृत्व समय पर कई परिवर्तकों के लिए उच्च ऊंचाई क्षेत्रों में कम कौशल दिखाई देता है. इस बारे में आगे की जांच करने के लिए हमने पृथ्वी की सतह ऊंचाई के अनुसार 32 बिनों में विभाजित किया (ज्योतिषी ऊंचाई के संदर्भ में दिया गया है) और अनुमान के अनुसार प्रत्येक बिन के भीतर RMSEs गणना की (24). ये चित्रा 28 में चित्रित हैं. At short lead times and especially at 6 hours, GraphCast’s skill relative to HRES tends to decrease with higher surface elevation, in most cases dropping below the skill of HRES at sufficiently high elevations. At longer lead times of 5 to 10 days this effect is less noticeable, however. We note that GraphCast is trained on variables defined using a mix of pressure-level coordinates (for atmospheric variables) and height above surface coordinates (for surface-level variables like 2m temperature or 10m wind). The relationship between these two coordinates systems depends on surface elevation. Despite GraphCast conditioning on surface elevation we conjecture that it may struggle to learn this relationship, and to extrapolate it well to the highest surface elevations. In further work we would propose to try training the model on a subset of ERA5’s native model levels instead of pressure levels; these use a hybrid coordinate system [14] which follows the land surface at the lowest levels, and this may make the relationship between surface and atmospheric variables easier to learn, especially at high surface elevations. दबाव स्तर समन्वयों का उपयोग करने वाले परिवर्तकों को जमीन के नीचे इंटरपोल किया जाता है जब दबाव स्तर सतह दबाव से अधिक होता है. GraphCast को कोई स्पष्ट संकेत नहीं दिया जाता है कि ऐसा हुआ है और यह उच्च सतह ऊंचाई पर पूर्वानुमान सीखने की चुनौती को बढ़ा सकता है. दबाव स्तर समन्वयों का उपयोग करके आगे के काम में हम मॉडल को यह इंगित करने के लिए अतिरिक्त सिग्नल प्रदान करने का प्रस्ताव करते हैं कि यह कब हुआ है। अंत में, हमारे नुकसान वजन कम दबाव के स्तर पर वायुमंडलीय परिवर्तकों के लिए कम है, और यह उच्च ऊंचाई के स्थानों पर कौशल को प्रभावित कर सकता है। 7.3. GraphCast ablations 7.3.1. Multi-mesh ablation बेहतर समझने के लिए कि मल्टी-मेश प्रतिनिधित्व GraphCast के प्रदर्शन को कैसे प्रभावित करता है, हम GraphCast प्रदर्शन को मल्टी-मेश प्रतिनिधित्व के बिना प्रशिक्षित मॉडल के एक संस्करण के साथ तुलना करते हैं। बाद के मॉडल की आर्किटेक्चर GraphCast के समान है (एक ही एन्कोडर और डिकोडर, और एक ही नोड्स की संख्या सहित), सिवाय इसके कि प्रक्रिया ब्लॉक में, ग्राफ़ केवल सबसे अच्छे icosahedron मेष M6 (245,760 किनारों, GraphCast के लिए 327,660 के बजाय) से किनारों को शामिल करता है। चित्रा 29 (बाएं पैनल) ग्राफकास्ट के साथ तुलना करने वाले स्कोरकार्ड को दिखाता है। ग्राफकास्ट सभी भविष्यवाणी किए गए परिवर्तकों के लिए मल्टी-मेश संरचना से लाभ उठाता है, 50 एचपीए पर 5 दिनों से अधिक लीड टाइम को छोड़कर। विशेष रूप से सभी दबाव स्तरों और 5 दिनों से कम लीड टाइम के लिए औसत समुद्र के स्तर के दबाव के लिए geopotential के लिए बेहतर है. मध्य पैनल में ग्राफकास्ट की तुलना करने वाले स्कोरकार्ड को दिखाता है HRES, जबकि दाहिने पैनल ग्राफकास्ट को HRES की तुलना करता है, जो दिखाता है कि मल्टी-मेश ग्राफकास्ट के लिए 5 दिनों से कम लीड टाइम पर geopotential पर HR 7.3.2. Effect of autoregressive training हमने GraphCast के उन संस्करणों के प्रदर्शन का विश्लेषण किया जिन्हें कम ऑटोरेग्रेसिव (एआर) चरणों7 के साथ प्रशिक्षित किया गया था, जो उन्हें लंबे समय के नेतृत्व के प्रदर्शन की लागत पर अपने छोटे नेतृत्व समय प्रदर्शन में सुधार करने के लिए प्रोत्साहित करना चाहिए। जैसा कि चित्र 30 में दिखाया गया है (कम एआर चरणों के साथ प्रशिक्षण के अनुरूप हल्के नीले लाइनों के साथ) हमने पाया कि कम एआर चरणों के साथ प्रशिक्षित मॉडल कम नेतृत्व समय सटीकता के लिए लंबे समय तक व्यापार करने की प्रवृत्ति रखते हैं। ये परिणाम एआर चरणों के विभिन्न संख्याओं के साथ कई मॉडल को जोड़ने की संभावना का सुझाव देते हैं, उदाहरण के लिए, संक्षिप्त, मध्यम और लंबे नेतृत्व समय के लिए, 7.4 बेहतरीन ब्लेंडिंग 7.4.1 GraphCast और HRES के बीच कौशल की तुलना पर प्रभाव आंकड़ों 31 और 32 में, हम दोनों मॉडलों पर इष्टतम विचलन लागू होने से पहले और बाद में GraphCast के साथ HRES के RMSE की तुलना करते हैं. हम देख सकते हैं कि इष्टतम विचलन शायद ही कभी दो मॉडलों के रैंकिंग को बदलता है, हालांकि यह आम तौर पर उनके बीच की अंतर को कम करता है. 7.4.2. Filtering methodology हमने फ़िल्टर चुने हैं जो स्पेस पर रेखांकित, समग्र (स्थिति अपरिवर्तनीय), इज़ोट्रोपिक (धारा अपरिवर्तनीय) फ़िल्टरों के वर्ग के भीतर आरएमएसई को कम करते हैं. इन फ़िल्टरों को आसानी से स्पेस हार्मोनिक डोमेन में लागू किया जा सकता है, जहां वे बहुमुखी फ़िल्टर वजनों के अनुरूप होते हैं जो कुल तरंग संख्या पर निर्भर करते हैं, लेकिन लंबी तरंग संख्या नहीं [12]. प्रत्येक प्रारंभिककरण d0, लीड टाइम τ, परिवर्तनीय और स्तर j के लिए, हमने पूर्वानुमानों x ̈d0+τ और लक्ष्यों xd0+τ के लिए एक विशिष्ट स्फोरिक हार्मोनिक ट्रांसफार्म [13] लागू किया, प्रत्येक जोड़ी के लिए स्फोरिक हार्मोनिक कारक f ̈d0+τ j j j,l,m और f d0+τ प्राप्त करते हैं कुल तरंग संख्या l और लंबी तरंग संख्या m. equator पर हमारे ग्रिड की 0.25° (28km) रिज़ॉल्यूशन को हल करने के लिए, हम कुल तरंग संख्या 719 पर एक त्रिकोण का उपयोग करते हैं, जिसका अर्थ है कि l 0 से max l = 719 तक होता है, और प्रत्येक l के लिए m के मूल्य −l से l तक होते हैं। हमने फिर प्रत्येक पूर्वानुमानित कारक f ̈d0+τ को एक फ़िल्टर वजन bτ से गुणा किया, जो j,l,m,j,l से स्वतंत्र है लंबी तरंग संख्या m. फ़िल्टर वजनों को कम से कम वर्गों का उपयोग करके समायोजित किया गया था ताकि औसत वर्ग त्रुटि को कम किया जा सके, जैसा कि ग्लोबल हार्मोनिक डोमेन में गणना की गई है: हमने 2017 से डेटा का उपयोग इन वजनों को फिट करने के लिए किया, जो 2018 के परीक्षण सेट के साथ दोहराया नहीं है. फ़िल्टर किए गए पूर्वानुमानों का मूल्यांकन करते समय, हमने स्फार्क हार्मोनिक डोमेन में एमएसई गणना की, जैसा कि संतुलन में विस्तारित किया गया है (22). प्रत्येक लीड टाइम के लिए अलग-अलग फिल्टरों को फिट करने के द्वारा, गड़बड़ी की डिग्री लंबे लीड टाइम पर बढ़ती अनिश्चितता के साथ बढ़ने के लिए स्वतंत्र थी। While this method is fairly general, it also has limitations. Because the filters are homogeneous, they are unable to take into account location-specific features, such as orography or land-sea boundaries, and so they must choose between over-blurring predictable high-resolution details in these locations, or under-blurring unpredictable high-resolution details more generally. This makes them less effective for some surface variables like 2 T, which contain many such predictable details. Future work may consider more complex post-processing schemes. हमारे ईसीएमडब्ल्यूएफ पूर्वानुमान आधार सूची के लिए एक शर्तपूर्वक पूर्वानुमान (और इस प्रकार RMSE में सुधार) को अनुकूलित करने का एक वैकल्पिक तरीका ENS ensemble पूर्वानुमान प्रणाली के संयोज औसत का मूल्यांकन करना होगा, निर्णायक HRES पूर्वानुमान के बजाय। 7.4.3. Transfer functions of the optimal filters फ़िल्टर वजन चित्र 33 में वर्णित हैं, जो फ़िल्टर के लिए आउटपुट पावर और इनपुट पावर का अनुपात दिखाता है, लोग्राइथमिक डेसिबल स्केल पर, लहर की लंबाई के एक कार्य के रूप में। संतुलन (35), यह 20 लॉग10(bτ ) के बराबर है, जो लहर की लंबाई Ce/l के लिए कुल लहरों की संख्या l के अनुरूप है। For both HRES and GraphCast, we see that it is optimal for MSE to attenuate power over some short-to-mid wavelengths. As lead times increase, the amount of attenuation increases, as does the wavelength at which it is greatest. In optimizing for MSE, we seek to approximate a conditional expectation which averages over predictive uncertainty. Over longer lead times this predictive uncertainty increases, as does the spatial scale of uncertainty about the location of weather phenomena. We believe that this largely explains these changes in optimal filter response as a function of lead time. We can see that HRES generally requires more blurring than GraphCast, because GraphCast’s predictions already blur to some extent (see Section 7.5.3), whereas HRES’ do not. इष्टतम फिल्टर GraphCast और HRES के पूर्वानुमानों में स्पेक्ट्रल बाधाओं के लिए भी कुछ हद तक संतुलित करने में सक्षम हैं. उदाहरण के लिए, हमारे पुनरावृत्त ERA5 डेटासेट में कई परिवर्तकों के लिए, स्पेक्ट्रम अचानक 62 किमी से नीचे की लहरों के लिए बंद हो जाता है जो ERA5 की मूल 0.28125◦ संकल्प पर हल नहीं किए गए हैं. GraphCast ने इस काटने को सटीक रूप से दोहराना नहीं सीखा है, लेकिन इष्टतम फिल्टर इसे लागू करने में सक्षम हैं। हम यह भी नोट करते हैं कि z500 के लिए GraphCast फ़िल्टर प्रतिक्रिया में 100 किलोमीटर की तरंग लंबाई के आसपास ध्यान देने योग्य ऊंचाइयों हैं, जो HRES के लिए मौजूद नहीं हैं. हम मानते हैं कि ये छोटे, झूठे आर्टिफैक्ट्स को फ़िल्टर कर रहे हैं जो इन तरंग लंबाइयों के आसपास GraphCast द्वारा इन मॉडल के अंदर किए गए ग्रिड-टू-मेश और ग्रिड-टू-मेज परिवर्तनों के साइड-प्रभाव के रूप में पेश किए जाते हैं। 7.4.4. ऑटोरेग्रेसिव प्रशिक्षण क्षितिज और अस्पष्टता के बीच संबंध In Figure 34 we use the results of optimal blurring to investigate the connection between autoregressive training and the blurring of GraphCast’s predictions at longer lead times. In the first row of Figure 34, we see that models trained with longer autoregressive training horizons benefit less from optimal blurring, and that the benefits of optimal blurring generally start to accrue only after the lead time corresponding to the horizon they were trained up to. This suggests that autoregressive training is effective in teaching the model to blur optimally up to the training horizon, but beyond this further blurring is required to minimize RMSE. यह सुविधाजनक होगा अगर हम एक सरल पोस्ट-प्रसंस्करण रणनीति के साथ लंबे क्षितिज प्रशिक्षण को बदल सकते हैं, जैसे कि इष्टतम गड़बड़, लेकिन ऐसा नहीं दिखता है: चित्रा 34 के दूसरे पंक्ति में हम देखते हैं कि लंबे क्षितिज ऑटेरोरेजिव प्रशिक्षण अभी भी कम आरएमएसई का परिणाम देता है, यहां तक कि इष्टतम गड़बड़ लागू होने के बाद भी। If one desires predictions which are in some sense minimally blurry, one could use a model trained to a small number of autoregressive steps. This would of course result in higher RMSEs at longer lead times, and our results here suggest that these higher RMSEs would not only be due to the lack of blurring; one would be compromising on other aspects of skill at longer lead times too. In some applications this may still be a worthwhile trade-off, however. 5. स्पेक्ट्रम विश्लेषण 7.5.1 औसत वर्ग त्रुटि के स्पेक्ट्रल विघटन आंकड़ों 35 और 36 में, हम विभिन्न अंतरिक्ष पैमाने पर, इष्टतम फ़िल्टरिंग से पहले और बाद में GraphCast के कौशल के साथ HRES की तुलना करते हैं (भाग 7.4 में विवरण देखें)। जहां lmax = 719 जैसा कि संतुलन (22) में है। प्रत्येक कुल तरंग संख्या l लगभग एक तरंग लंबाई सीई / एल के अनुरूप है, जहां सीई पृथ्वी की परिधि है। हम पावर घनत्व हाइस्टोग्राम योजना बनाते हैं, जहां प्रत्येक बार का क्षेत्र S j,τ(l) के अनुरूप है, और बारों के केंद्र log10(1 + l) के आसपास होते हैं (क्योंकि एक लॉग आवृत्ति स्केल आसान दृश्य निरीक्षण की अनुमति देता है, लेकिन हमें लहर संख्या l = 0 भी शामिल करना चाहिए)। 2 या उससे अधिक दिनों के नेतृत्व समय पर, अधिकांश परिवर्तकों के लिए GraphCast सभी तरंग लंबाई पर समान रूप से HRES की क्षमता में सुधार करता है (2m तापमान एक उल्लेखनीय अपवाद है)। 12 घंटे से 1 दिन तक की छोटी लीड टाइम पर, कई परिवर्तकों (जैसे z500, T500, T850 और U500) के लिए, HRES 200-2000 किमी के अनुमानित रेंज में ग्रेफकास्ट की तुलना में अधिक कौशल है, और ग्रेफकास्ट के पास इस रेंज के बाहर अधिक कौशल आमतौर पर है। 7.5.2. आरएमएसई एक क्षैतिज संकल्प कार्य के रूप में चित्रा 37 में, हम GraphCast के कौशल को HRES के साथ तुलना करते हैं जब अंतरिक्ष संकल्पों की एक श्रृंखला पर मूल्यांकन किया जाता है। विशेष रूप से, प्रत्येक कुल तरंग संख्या ltrunc पर, हम पूर्वानुमानों और लक्ष्यों के बीच RMSEs प्लग करते हैं जो दोनों उस कुल तरंग संख्या पर ट्रिंकित होते हैं। टुकड़े किए गए पूर्वानुमानों और लक्ष्यों के बीच RMSEs औसत त्रुटि शक्तियों S j,τ(l) को संचरण (37) में परिभाषित करने के लिए एकत्रित जोड़ों के माध्यम से प्राप्त किया जा सकता है, के अनुसार Figure 37 shows that in most cases GraphCast has lower RMSE than HRES at all resolutions typically used for forecast verification. This applies before and after optimal filtering (see Section 7.4). Exceptions include 2 meter temperature at a number of lead times and resolutions, T 500 at 12 hour lead times, and U 500 at 12 hour lead times, where GraphCast does better at 0.25° resolution but HRES does better at resolutions around 0.5◦ to 2.5◦ (corresponding to shortest wavelengths of around 100 to 500 km). विशेष रूप से, हम नोट करते हैं कि ईआरए 5 का मूल संकल्प 0.28125◦ है, जो 62 किमी की सबसे छोटी लहर की लंबाई के अनुरूप है, जो टुकड़ों में एक ऊर्ध्वाधर लाइन द्वारा इंगित किया जाता है. एआरईएस-एफसी 0 लक्ष्यों में 62 किमी से कम लहर की लंबाई पर कुछ सिग्नल होते हैं, लेकिन ग्राफकास्ट का मूल्यांकन करने के लिए उपयोग किए गए ईआरए 5 लक्ष्यों को कम से कम नैतिक रूप से नहीं किया जाता है (देखें अनुभाग 7.5.3)। 7.5.3 भविष्यवाणियों और लक्ष्यों का स्पेक्ट्रम Figure 38 compares the power spectra of GraphCast’s predictions, the ERA5 targets they were trained against, and HRES-fc0. A few phenomena are notable: ERA5 और HRES-fc0 के स्पेक्ट्रम में उल्लेखनीय अंतर हैं, विशेष रूप से छोटे तरंग लंबाई पर। ये अंतर आंशिक रूप से उन तरीकों के कारण हो सकते हैं जो उन्हें अपने मूल आईएफएस रिज़ॉल्यूशन TL639 (0.28125◦) और TCo1279 (लगभग 0.1◦, [36]) से 0.25° ईक्विंगोल ग्रिड तक पुनर्गठन करते हैं. हालांकि, इस पुनर्गठन से पहले भी आईएफएस संस्करणों, सेटिंग्स, रिज़ॉल्यूशन और डेटा संसाधन विधि में अंतर हैं जो HRES और ERA5 के लिए उपयोग किए जाते हैं, और ये अंतर स्पेक्ट्रम को भी प्रभावित कर सकते हैं. चूंकि हम GraphCast के खिलाफ ERA5 और HRES के खिलाफ HRES-fc0 का मूल्या Differences between HRES and ERA5 हम GraphCast के पूर्वानुमानों में छोटे से मध्य लहर लंबाई पर कम बिजली को देखते हैं, जो लीड टाइम के साथ और भी कम हो जाता है. हम मानते हैं कि यह ग्लैमरिंग के अनुरूप है जिसे GraphCast ने एमएसई के लिए अनुकूलन में प्रदर्शन करने के लिए सीखा है. हमने इसे अनुभाग 7.4 और 7.4.4 में आगे चर्चा की है. Blurring in GraphCast These peaks are particularly visible for z500; they appear to increase with lead time. We believe they correspond to small, spurious artifacts introduced by the internal grid-to-mesh and mesh-to-grid transformations performed by GraphCast at each autoregressive step. In future work we hope to eliminate or reduce the effect of these artifacts, which were also observed by [26]. Peaks for GraphCast around 100km wavelengths Finally we note that, while these differences in power at short wavelengths are very noticeable in log scale and relative plots, these short wavelengths contribute little to the total power of the signal. 8. Additional severe event forecasting results इस खंड में, हम हमारे गंभीर घटना पूर्वानुमान विश्लेषण के बारे में अतिरिक्त विवरण प्रदान करते हैं. हम नोट करते हैं कि GraphCast विशेष रूप से उन निचले स्तर के कार्यों के लिए प्रशिक्षित नहीं है, जो दिखाता है कि, बेहतर कौशल के अलावा, GraphCast वास्तविक दुनिया प्रभाव के साथ कार्यों के लिए उपयोगी पूर्वानुमान प्रदान करता है जैसे चक्रों का ट्रैकिंग (सेक्शन 8.1), वायुमंडलीय नदी (सेक्शन 8.2) की विशेषताएं, और चरम तापमान (सेक्शन 8.3) का वर्गीकरण। 8.1 ट्रैफिक साइक्लोन ट्रैक पूर्वानुमान In this section, we detail the evaluation protocols we used for cyclone tracking (Supplements Sec-tion 8.1.1) and analyzing statistical significance (Supplements Section 8.1.2), provide additional results (Supplements Section 8.1.3), and describe our tracker and its differences with the one from ECMWF (Supplements Section 8.1.4). 8.1.1. Evaluation protocol एक ही Graphic Cyclone पूर्वानुमान सिस्टम की तुलना करने के लिए एक ही Graphic Graphic Cyclone पूर्वानुमान सिस्टम के चारों ओर प्रारंभ करने का मानक तरीका यह है कि तुलना को उन घटनाओं पर प्रतिबंधित किया जाए जहां दोनों मॉडल एक Cyclone के अस्तित्व की पूर्वानुमान करते हैं। पूरक अनुभाग 5.2.2 में विस्तारित के रूप में, GraphCast को 06z और 18z से प्रारंभ किया जाता है, 00z और 12z के बजाय, ताकि यह HRES की तुलना में हमेशा एक lookahead लाभ न हो। हालांकि, TIGGE संग्रह में HRES Cyclone ट्रैक [8] केवल 00z और 12z पर प्रारंभ किया जाता है। यह विपरीत हमें उन घटनाओं को चुनने से रोकता है जहां चूंकि हम एक ही बुनियादी सच्चाई (यानी, IBTrACS) के संबंध में त्रुटि की गणना करते हैं, इसलिए मूल्यांकन को पूरक अनुभाग 5.2.2 में वर्णित समान प्रतिबंधों के अधीन नहीं है, अर्थात्, दोनों मॉडल के लिए लक्ष्यों में समान मात्रा में lookahead शामिल है. यह इस दस्तावेज़ में हमारे अधिकांश मूल्यांकनों के विपरीत है, जहां HRES (यानी, HRES-fc0) के लिए लक्ष्यों में +3h lookahead शामिल है, और GraphCast (ईआरए 5 से) के लिए लक्ष्यों में +3h या +9h शामिल हैं, जिससे हमें केवल एक मेल खाते हुए lookahead (अधिकतम 12h) के साथ लीड टाइम्स के लिए परिणामों की रिपोर्ट करने की अनु एक दिए गए पूर्वानुमान के लिए, साइक्लोन के पूर्वानुमान केंद्र और वास्तविक केंद्र के बीच की त्रुटि को जियोडेडिक दूरी का उपयोग करके गणना की जाती है। 8.1.2. Statistical methodology Computing statistical confidence in cyclone tracking requires particular attention in two aspects: 1. नमूने की संख्या को परिभाषित करने के दो तरीके हैं. पहला एक उष्णकटिबंधीय साइक्लोन घटनाओं की संख्या है, जिसे ज्यादातर स्वतंत्र घटनाओं के रूप में माना जा सकता है. दूसरा एक प्रति लीड समय डेटा बिंदुओं की संख्या है, जो बड़ा है, लेकिन संबंधित बिंदुओं के लिए गणना करता है (हर उष्णकटिबंधीय साइक्लोन घटना के लिए कई पूर्वानुमानों को 6 घंटे के अंतराल पर किया जाता है). हमने पहले परिभाषा का उपयोग करने का विकल्प चुना है जो सांख्यिकीय महत्व के अधिक रूढ़िवादी अनुमान प्रदान करता है. दोनों संख्याएं 1 से 5 दिनों के लिए लीड समय के लिए प्रदर्शित की जाती हैं, जो कि प्लगमेंट्स चित्रा 39 के एक्स-एक्स पर हैं। 2. HRES और GraphCast के प्रति उदाहरण ट्रैकिंग त्रुटियों का संबंध है. इसलिए उनके अंतर में सांख्यिकीय भिन्नता उनके संयुक्त भिन्नता की तुलना में बहुत कम है. इस प्रकार, हम रिपोर्ट करते हैं कि GraphCast HRES से बेहतर है (देखें पूरक चित्र 39b) प्रति मॉडल आत्मविश्वास के अलावा (देखें पूरक चित्र 39a)। Given the two considerations above, we do bootstrapping with 95% confidence intervals at the level of cyclones. For a given lead time, we consider all the corresponding initialization time/lead time pairs and keep a list of which cyclone they come from (without duplication). For the bootstrap estimate, we draw samples from this cyclone list (with replacement) and apply the median (or the mean) to the corresponding initialization time/lead time pairs. Note that this gives us much more conservative confidence bounds than doing bootstrapping at the level of initialization time/lead time pairs, as it is equivalent to assuming all bootstrap samples coming from the sample cyclone (usually in the order of tens) are perfectly correlated. उदाहरण के लिए, मान लीजिए कि एक निश्चित नेतृत्व समय के लिए हमारे पास साइक्लोन ए के लिए (50, 100, 150) त्रुटियां हैं, साइक्लोन बी के लिए (300, 200) और साइक्लोन सी के लिए (100, 100) जबकि ए के पास अधिक नमूने हैं. साइक्लोन के स्तर पर एक bootstrapping नमूना पहले प्रतिस्थापन के साथ यादृच्छिक 3 साइक्लोन पर समान रूप से नमूना देता है (उदाहरण के लिए, ए, ए, बी) और फिर संबंधित नमूने के ऊपर औसत गणना करता है: औसत(50,100,150,50,100,150,200,300)=137.5. 8.1 परिणाम In Supplements Figure 3a-b, we chose to show the median error rather than the mean. This decision was made before computing the results on the test set, based on the performance on the validation set. On the years 2016–2017, using the version of GraphCast trained on 1979–2015, we observed that, using early versions of our tracker, the mean track error was dominated by very few outliers and was not representative of the overall population. Furthermore, a sizable fraction of these outliers were due to errors in the tracking algorithm rather than the predictions themselves, suggesting that the tracker was suboptimal for use with GraphCast. Because our goal is to assess the value of GraphCast forecast, rather than a specific tracker, we show median values, which are also affected by tracking errors, but to a lesser extent. In figure Figure 40 we show how that the distribution of both HRES and GraphCast track errors for the test years 2018–2021 are non-gaussian with many outliers. This suggests the median is a better summary statistic than the mean. पूरक चित्रा 39 औसत ट्रैक त्रुटि और संबंधित जोड़े गए विश्लेषण को दिखाने से चित्रा 3a-b को पूरक करता है. हम ध्यान देते हैं कि हमारे ट्रैकर के अंतिम संस्करण का उपयोग करते हुए (सप्लीकेशन अनुभाग 8.1.4), GraphCast औसत परिणाम मध्यम के समान हैं, जिसमें GraphCast 2 और 5 दिनों के बीच नेतृत्व समय के लिए HRES को काफी बेहतर प्रदर्शन करता है. Because of well-known blurring effects, which tend to smooth the extrema used by a tracker to detect the presence of a cyclone, ML methods can drop existing cyclones more often than NWPs. Dropping a cyclone is very correlated with having a large positional error. Therefore, removing from the evaluation such predictions, where a ML model would have performed particularly poorly, could give it an unfair advantage. इस समस्या से बचने के लिए, हम यह पुष्टि करते हैं कि हमारे हाइपर-पैरामीटर-सेवा ट्रैकर (देखें पूरक अनुभाग 8.1.4) एचआरईएस के समान циклон संख्या को याद करता है. पूरक आंकड़ा 41 दिखाता है कि परीक्षण सेट (2018-2021), GraphCast और एचआरईएस एक समान циклон संख्या को कम करते हैं, जिससे हमारी तुलनाएं जितनी संभव हो उचित हैं। Supplements Figures 42 and 43 show the median error and paired analysis as a function of lead time, broken down by cyclone category, where category is defined on the Saffir-Simpson Hurricane Wind Scale [47], with category 5 representing the strongest and most damaging storms (note, we use category 0 to represent tropical storms). We found that GraphCast has equal or better performance than HRES across all categories. For category 2, and especially for category 5 (the most intense events), GraphCast is significantly better that HRES, as demonstrated by the per-track paired analysis. We also obtain similar results when measuring mean performance instead of median. 8.1.4. Tracker details हमने GraphCast के लिए इस्तेमाल किया ट्रैकर ECMWF के ट्रैकर [35] के हमारे पुनरावृत्ति पर आधारित है. क्योंकि यह 0.1° HRES के लिए डिज़ाइन किया गया है, हमने GraphCast पूर्वानुमानों पर लागू होने पर असफल साइक्लोन की मात्रा को कम करने के लिए कई संशोधन जोड़ने के लिए उपयोगी पाया. हालांकि, ट्रैकिंग त्रुटियां अभी भी होती हैं, जो 0.25° पूर्वानुमानों के बजाय 0.1° से सिक्लोन ट्रैकिंग से उम्मीद की जाती है. हम नोट करते हैं कि हम अपने ट्रैकर का उपयोग HRES मूल लाइन के लिए नहीं करते हैं, क्योंकि इसके ट्रैक सीधे TIGGE संग्रह से पुनर्प्राप्त होते हैं [8]। हम सबसे पहले ECMWF से डिफ़ॉल्ट ट्रैकर की एक उच्च स्तर की सारांश देते हैं, इससे पहले कि हमने किए गए परिवर्तनों और हमारे निर्णय प्रक्रिया को समझाया। 10 यू, 10 वी, एमएसएल के साथ-साथ U, v और z के परिवर्तकों के एक मॉडल के पूर्वानुमानों को देखते हुए 200, 500, 700, 850 और 1000 एचपीए के दबाव स्तरों पर कई समय चरणों पर, ECMWF ट्रैकर [35] अनुक्रमिक रूप से प्रत्येक समय चरण को प्रक्रिया करता है ताकि पूरे मार्ग पर एक साइक्लोन के स्थान का पूर्वानुमान किया जा सके। हर 6 घंटे के ट्रैकर की पूर्वानुमान में दो मुख्य चरण होते हैं। पहले चरण में, साइक्लोन के वर्तमान स्थान के आधार पर, ट्रैकर अगले स्थान की एक अनुमान का गणना करता है, 6 घंटे आगे। ECMWF tracker अगले साइक्लोन के स्थान की अनुमान को गणना करने के लिए, ट्रैकर वर्तमान अनुमान को दो वेक्टरों के औसत के रूप में गणना की जाती है: 1) अंतिम दो ट्रैक स्थानों के बीच की अनुमान (यानी, लाइनर एस्ट्रापोलेशन) और 2) हवा की दिशा की अनुमान, 200, 500, 700 और 850 hPa दबाव के स्तर पर पिछले ट्रैक स्थिति में हवा की गति U और v का औसत। एक बार अगले साइक्लोन के स्थान की अनुमान की गणना की गई है, ट्रैकर इस अनुमान के 445 किमी के भीतर औसत समुद्री स्तर दबाव (एमएसएल) के सभी स्थानीय न्यूनतम को देखता है। 1. Vorticity check: the maximum vorticity at 850 hPa within 278 km of the local minima is larger than 5 · 10−5 s−1 for the Northern Hemisphere, or is smaller than −5 · 10−5s−1 for the Southern Hemisphere. Vorticity can be derived from horizontal wind (U and v). 2. हवा की गति की जांच: यदि उम्मीदवार जमीन पर है, तो 278 किमी के भीतर 10 मीटर की अधिकतम हवा की गति 8 मीटर / सेकंड से अधिक है। 3. मोटाई की जांच: यदि साइक्लोन एंटीट्रोपिक है, तो 278 किमी की रेंज के भीतर 850 एचपीए और 200 एचपीए के बीच अधिकतम मोटाई है, जहां मोटाई z850-z200 के रूप में परिभाषित है। यदि कोई न्यूनतम इन सभी स्थितियों को पूरा नहीं करता है, तो ट्रैकर मानता है कि कोई साइक्लोन नहीं है. ईसीएमडब्ल्यूएफ का ट्रैकर कुछ कोने की स्थिति में कुछ समय के लिए गायब होने की अनुमति देता है, इससे पहले कि वे फिर से दिखाई दें। हमने अपने सत्यापन सेट वर्षों (2016-2017) से साइक्लोनों पर गलत ट्रैक का विश्लेषण किया, 1979-2015 पर प्रशिक्षित एक GraphCast संस्करण का उपयोग करते हुए, और नीचे वर्णित के रूप में ECMWF ट्रैकर के डिफ़ॉल्ट पुन: कार्यान्वयन को संशोधित किया। Our modified tracker 1. वर्तमान चरण निकटता रेंज निर्धारित करता है कि एक नया केंद्र उम्मीदवार अनुमान से कितना दूर हो सकता है. हमने इस पैरामीटर को महत्वपूर्ण पाया और निम्नलिखित विकल्पों में से एक के लिए एक बेहतर मूल्य की तलाश की: 445 × f 0.25, 0.375, 0.5, 0.625, 0.75, 1.0 (आधारित मूल्य) में f के लिए। 2. अगले चरण निकटता रेंज यह निर्धारित करता है कि कितने सख्त कई चेक हैं. हमने इस पैरामीटर को महत्वपूर्ण पाया और निम्नलिखित विकल्पों के बीच एक बेहतर मूल्य की तलाश की: 278 × f में f के लिए 0.25, 0.375, 0.5, 0.625, 0.75, 1.0 (आधारित मूल्य)। 3. ईसीएमडब्ल्यूएफ के अगले चरण का अनुमान लाइनर एस्ट्रापोलेशन और हवा की दिशा के वेक्टरों के बीच 50-50 वजन का उपयोग करता है। हमारे मामले में जहां हवा को 0.25 ° संकल्प पर पूर्वानुमान किया जाता है, हमने हवा की दिशा को कभी-कभी बाधा अनुमानों के लिए पाया है। यह आश्चर्य की बात नहीं है क्योंकि हवा एक स्थानिक रूप से चिकनी क्षेत्र नहीं है, और ट्रैकर संभवतः 0.1 ° संकल्प पूर्वानुमान का लाभ उठाने के लिए अनुकूलित किया गया है। इस प्रकार, हम हाइपर पैरामीटर ने निम्नलिखित विकल्पों के बीच वजन का पता लगाया: 0.0, 0.1, 0.33, 0.5 (आधारित मूल्य)। 4. We noticed multiple misstracks happened when the track sharply reversed course, going against its previous direction. Thus, we only consider candidates that creates an angle between the previous and new direction below 𝑑 degrees, where 𝑑 was searched among these values: 90, 135, 150, 165, 175, 180 (i.e. no filter, original value). 5. We noticed multiple misstracks made large jumps, due to a combination of noisy wind steering and features being hard to discern for weak cyclones. Thus, we explored clipping the estimate from moving beyond 𝑥 kilometers (by resizing the delta with the last center), searching over the following values for x: 445 × 𝑓 for f in 0.25, 0.5, 1.0, 2.0, 4.0, ∞ (i.e. no clipping, original value). During the hyper-parameter search, we also verified on validation data that the tracker applied to GraphCast dropped a similar number of cyclones as HRES. 8.2 वायुमंडल नदी ऊर्ध्वाधर रूप से एकीकृत जल भाप परिवहन (IvT) आमतौर पर वायुमंडलीय नदियों की तीव्रता का वर्णन करने के लिए उपयोग किया जाता है [38, 37]. हालांकि GraphCast सीधे IvT का पूर्वानुमान नहीं करता है और वायुमंडलीय नदियों का पूर्वानुमान करने के लिए विशेष रूप से प्रशिक्षित नहीं है, हम इस राशि को पूर्वानुमानित वायुमंडलीय परिवर्तकों विशिष्ट आर्द्रता, Q, और क्षैतिज हवा, (U, v) के माध्यम से प्राप्त कर सकते हैं [38]: जहां g = 9.80665 m/s2 पृथ्वी की सतह पर गुरुत्वाकर्षण के कारण गति है, pb = 1000 hPa निचले दबाव है, और pt = 300 hPa शीर्ष दबाव है। उपरोक्त संबंध का उपयोग करके IvT का मूल्यांकन करने के लिए संख्यात्मक एकीकरण की आवश्यकता होती है और परिणाम इसलिए भविष्यवाणी की ऊर्ध्वाधर संकल्प पर निर्भर करता है। GraphCast 37 दबाव स्तरों का एक ऊर्ध्वाधर संकल्प है जो केवल 25 दबाव स्तरों के साथ उपलब्ध HRES मार्गों की संकल्प से अधिक है। दोनों मॉडल की एक स्थिर और उचित तुलना के लिए, हम केवल दबाव स्तरों के एक सामान्य उपसेट का उपयोग करते हैं, जो WeatherBench संदर्भ में भी शामिल हैं, जब IvT 8 का मूल्यांकन करते हैं, अर्थात् [300, 400, 500, 600, 700, 850, 925, 1000] hPa। हमारे मूल्यांकन प्रोटोकॉल के बाकी हिस्सों के साथ, प्रत्येक मॉडल को अपने स्वयं के "विश्लेषण" के खिलाफ मूल्यांकन किया जाता है। GraphCast के लिए, हम अपने पूर्वानुमानों के आधार पर IvT की गणना करते हैं और इसे ERA5 से अनुमानित IvT के साथ तुलना करते हैं। Similarly to previous work [10], Figure 44 reports RMSE skill and skill score averaged over coastal North America and the Eastern Pacific (from 180°W to 110°W longitude, and 10°N to 60°N latitude) during the cold season (Jan-April and Oct-Dec 2018), which corresponds to a region and a period with frequent atmospheric rivers. 8.3 अत्यधिक गर्मी और ठंड हम एक बाइनरी वर्गीकरण समस्या [35, 32] के रूप में चरम गर्मी और ठंड पूर्वानुमान का अध्ययन करते हैं, यह तुलना करके कि क्या एक निश्चित पूर्वानुमान मॉडल सही ढंग से भविष्यवाणी कर सकता है कि क्या एक विशिष्ट परिवर्तनीय के लिए मूल्य एक संदर्भ ऐतिहासिक जलवायु विज्ञान के वितरण के एक निश्चित प्रतिशत से ऊपर (या नीचे) होगा (उदाहरण के लिए, अत्यधिक गर्मी के लिए 98% प्रतिशत से ऊपर, और अत्यधिक ठंड के लिए 2% प्रतिशत से नीचे)। पिछले काम [35] के बाद, संदर्भ जलवायु विज्ञान के लिए (1) प्रत्येक परिवर्तनीय (2) वर्ष के प्रत्येक महीने के लिए अलग-अलग प्राप्त किया जाता है, (3) दिन के प्रत्येक समय, (4) प्रत्येक चौड़ाई / लंबाई समन्वय, और (5) प्रत्येक दबाव स्तर (यदि लागू होता है)। यह अत्यधिक चूंकि चरम पूर्वानुमान परिभाषा से एक असंतुलित वर्गीकरण समस्या है, इसलिए हम अपने विश्लेषण को इस मामले के लिए अच्छी तरह से उपयुक्त सटीक रीसेट प्लेटों पर आधारित करते हैं [42]। परिभाषा के अनुसार चरम पूर्वानुमान को एक मुफ्त पैरामीटर "आउट" में भिन्न करके प्राप्त किया जाता है, जिसमें जलवायु विज्ञान के मध्यम मूल्य के संदर्भ में एक स्केलिंग कारक शामिल है, अर्थात् स्केलिंग पूर्वानुमान = लाभ × (प्रबंध - मध्यम जलवायु विज्ञान) + मध्यम जलवायु विज्ञान। यह निर्णय सीमा को स्थानांतरित करने का प्रभाव है और झूठे नकारात्मक और झूठे सकारात्मक के बीच अलग-अलग ट्रेडिंग ऑफ्स का अध्ययन करने की अनुमति देता है। अंतर्दृष्टि हम अपने विश्लेषण पर ध्यान केंद्रित करते हैं जो चरम तापमान स्थितियों के लिए प्रासंगिक हैं, विशेष रूप से 2 टी [35, 32], और भी T 850, z500 जो अक्सर ईसीएमडब्ल्यूएफ द्वारा गर्मी की लहरों का वर्णन करने के लिए इस्तेमाल किया जाता है [34]। पिछले काम के बाद [32], चरम गर्मी के लिए हम उत्तरी गोलार्ध में भूमि पर जून, जुलाई और अगस्त के दौरान औसत करते हैं (विशेषता > 20◦) और दक्षिणी गोलार्ध में दिसंबर, जनवरी और फरवरी के दौरान भूमि पर (विशेषता < -20◦). चरम ठंड के लिए, हमने उत्तरी और दक्षिणी गोलार्ध के लिए महीनों को विनिमय किया। 9. पूर्वानुमान दृश्य इस अंतिम अनुभाग में, हम अनुमानों के कुछ विज़ुअलाइज़ेशन उदाहरण प्रदान करते हैं जो GraphCast द्वारा परिवर्तकों 2 टी (चित्र 47), 10 यू (चित्र 48), एमएसएल (चित्र 49), z500 (चित्र 50), T 850 (चित्र 51), v 500 (चित्र 52), Q 700 (चित्र 53) के लिए किए गए हैं। संदर्भ [1] Ferran Alet, Adarsh Keshav Jeewajee, Maria Bauza Villalonga, Alberto Rodriguez, Tomas Lozano-Perez, और Leslie Kaelbling. Graph element networks: adaptive, structured computing and memory. In International Conference on Machine Learning, pages 212–222. PMLR, 2019. [2] Kelsey R Allen, Yulia Rubanova, Tatiana Lopez-Guevara, William Whitney, Alvaro Sanchez-Gonzalez, Peter Battaglia, और Tobias Pfaff. चेहरे के इंटरैक्शन ग्राफ नेटवर्क के साथ कठोर गतिशीलता सीखना. arXiv preprint arXiv:2212.03574, 2022. [3] Jimmy Lei Ba, Jamie Ryan Kiros और Geoffrey E. Hinton. Layer normalization. arXiv, 2016। [4] Igor Babuschkin, Kate Baumli, Alison Bell, Surya Bhupatiraju, Jake Bruce, Peter Buchlovsky, David Budden, Trevor Cai, Aidan Clark, Ivo Danihelka, Claudio Fantacci, Jonathan Godwin, Chris Jones, Ross Hemsley, Tom Hennigan, Matteo Hessel, Shaobo Hou, Steven Kapturowski, Thomas Keck, Iurii Kemaev, Michael King, Markus Kunesch, Lena Martens, Hamza Merzic, Vladimir Mikulik, Tamara Norman, John Quan, George Papamakarios, Roman Ring, Francisco Ruiz, Alvaro Sanchez, Rosalia Schneider, Eren Sezener, Stephen Spencer, Srivatsan Srinivasan, Luyu, Wangciech Wojciech Stokowiec, और Fabio Viola. Deep JAX पारिस्थितिकी तंत्र http: // github.com/deepmind, 2020 के बारे में [5] Peter Battaglia, Razvan Pascanu, Matthew Lai, Danilo Jimenez Rezende, et al. वस्तुओं, रिश्तों और भौतिकी के बारे में सीखने के लिए इंटरैक्शन नेटवर्क। [6] Peter W Battaglia, Jessica B Hamrick, Victor Bapst, Alvaro Sanchez-Gonzalez, Vinicius Zambaldi, Mateusz Malinowski, Andrea Tacchetti, David Raposo, Adam Santoro, Ryan Faulkner, et al. रिश्तों की प्रेरक पूर्वाग्रह, गहरी सीखने, और ग्राफ नेटवर्क. arXiv प्रीप्रिंट arXiv:1806.01261, 2018. [7] Kaifeng Bi, Lingxi Xie, Hengheng Zhang, Xin Chen, Xiaotao Gu, और Qi Tian. Pangu-Weather: एक तेजी से और सटीक वैश्विक मौसम पूर्वानुमान के लिए 3 डी उच्च संकल्प मॉडल. arXiv preprint arXiv:2211.02556, 2022. [8] Philippe Bougeault, Zoltan Toth, Craig Bishop, Barbara Brown, David Burridge, De Hui Chen, Beth Ebert, Manuel Fuentes, Thomas M Hamill, Ken Mylne, et al. THORPEX इंटरैक्टिव ग्रैंड ग्लोबल इंटेलिजेंस. American Meteorological Society Bulletin, 91(8):1059–1072, 2010. [9] जेम्स ब्रैडबरी, रॉय फ्रोस्टीग, पीटर हॉकिंग्स, मैथ्यू जेम्स जॉनसन, क्रिस लीरी, डूगल मैकलोरिन, जॉर्ज नेक्ला, एडम पाज़्के, जेक वंडरप्लास, स्की वंडरमैन-मिलीन, और कियाओ जोंग। [10] WE Chapman, AC Subramanian, L Delle Monache, SP Xie, और FM Ralph. मशीन सीखने के साथ वायुमंडलीय नदी पूर्वानुमानों में सुधार. Geophysical Research Letters, 46(17-18):10627-10635, 2019. [11] Tianqi Chen, Bing Xu, Chiyuan Zhang, और Carlos Guestrin. प्रशिक्षण गहरे नेटवर्क के साथ उप-लाइनर स्मृति लागत. arXiv प्रीप्रिंट arXiv:1604.06174, 2016. [12] Balaji Devaraju. Sphere Filtering: Experiences from Filtering GRACE data. PhD Thesis, University of Stuttgart, 2015। [13] J R Driscoll और D M Healy. Computing fourier 2-स्फीर पर ट्रांसफार्मर्स और convolutions। एप्ल. मैथ्यू, 15(2):202–250, जून 1994 [14] ECMWF. IFS दस्तावेज़ CY41R2 - भाग III: गतिशीलता और संख्यात्मक प्रक्रियाएं. https: //www.ecmwf.int/node/16647, 2016 में। [15] मेयर फोर्टुनाटो, टोबियास पीफाफ, पीटर वायरन्सबर्ग, अलेक्जेंडर प्रिटज़ेल, और पीटर बैटगाली। मल्टी-स्केल मैशग्राफनेट. arXiv प्रीप्रिंट arXiv:2210.00612, 2022. [16] Alan J Geer. मध्यम सीमा पूर्वानुमान स्कोर में परिवर्तनों का महत्व. Tellus A: Dynamic Meteorology and Oceanography, 68(1):30229, 2016. [17] Jonathan Godwin, Thomas Keck, Peter Battaglia, Victor Bapst, Thomas Kipf, Yujia Li, Kimberly Stachenfeld, Petar Veličković, और Alvaro Sanchez-Gonzalez. Jraph: JAX में ग्राफ न्यूरोल नेटवर्क के लिए एक पुस्तकालय. http://github.com/deepmind/jraph, 2020. [18] T. Haiden, Martin Janousek, Jean-Raymond Bidlot, R. Buizza, L. Ferranti, F. Prates, और Frédéric Vitart. ECMWF पूर्वानुमानों का मूल्यांकन, 2018 अपग्रेड सहित। https://www.ecmwf. int/node/18746, 10/2018 2018. [19] थॉमस हाइडन, मार्टिन जेनोसेक, फ्रेडरिक विटार्ट, ज़ेड बेन-बुअललेग, लोरिया फेरेन्टी, कर्टिस्टीना प्रेट्स, और डेविड रिचर्डसन। ECMWF पूर्वानुमानों का मूल्यांकन, 2020 अपग्रेड सहित। https://www.ecmwf.int/node/19879, 01/2021 2021. [20] थॉमस हेडन, मार्टिन जेनोसेक, फ्रेडरिक विटार्ट, ज़ेड बेन-बूअललेग, लोरिया फेरेन्टी, और फ्रेंडो प्रेट्स। ECMWF पूर्वानुमानों का मूल्यांकन, 2021 में अपग्रेड सहित। https://www. ecmwf.int/node/20142, 09/2021 2021. [21] थॉमस हैडेन, मार्टिन जेनोसेक, फ्रेडरिक विटार्ट, ज़ीड बेन-बूअललेग, लोरिया फेरान्टी, फ्रेंडो प्रेट्स, और डेविड रिचर्डसन। ECMWF पूर्वानुमानों का मूल्यांकन, 2021 अपग्रेड सहित। https://www.ecmwf.int/node/20469, 09/2022 2022. [22] Thomas Haiden, Martin Janousek, Frédéric Vitart, Laura Ferranti, और Fernando Prates. ECMWF पूर्वानुमानों का मूल्यांकन, 2019 अपग्रेड सहित। https://www.ecmwf.int/node/ 19277, 11/2019। [23] टॉम हेनिगन, ट्रॉवर कैय, तामारा नॉर्मन, और इगोर बाबुशकिन। http://github.com/deepmind/dm-haiku, 2020. [24] हंस हर्स्बैक, बिल बेल, पॉल बेरिसफोर्ड, शोजी हिरहारा, एंड्रास हॉरनी, जोएक्विन मुनोज-साबेटर, जूलियन निकोलस, कैरोल प्यूबे, रोलुका रेडु, डायनांड शेपर्स, आदि। ERA5 वैश्विक पुनः विश्लेषण। रॉयल मेट्रोलॉजिकल सोसाइटी के तिमाही पत्रिका, 146(730):1999–2049, 2020। [25] S. Hoyer और J. Hamman. xarray: N-D लेबल एरेज और डेटासेट्स में Python. Journal of Open Research Software, 5(1), 2017. [26] Ryan Keisler. ग्राफ न्यूरोल नेटवर्क के साथ वैश्विक मौसम का पूर्वानुमान. arXiv preprint arXiv:2202.07575, 2022. [27] डायडरिक पी किंगमा और जिमी बी एडम: स्टोकैस्टिक अनुकूलन के लिए एक विधि. arXiv प्रीप्रिंट arXiv:1412.6980, 2014. [28] Kenneth R Knapp, Howard J Diamond, James P Kossin, Michael C Kruk, Carl J Schreck, et al. International best track archive for climate stewardship (IBTrACS) परियोजना, संस्करण 4. https://doi.org/10.25921/82ty-9e16, 2018. [29] Kenneth R Knapp, Michael C Kruk, David H Levinson, Howard J Diamond, और Charles J Neumann जलवायु प्रबंधन (IBTrACS) के लिए अंतरराष्ट्रीय सर्वश्रेष्ठ ट्रैक आर्काइव जो उष्णकटिबंधीय चक्रन डेटा को एकजुट करता है। [30] Michael C Kruk, Kenneth R Knapp, और डेविड एच लेविंसन. वैश्विक उष्णकटिबंधीय साइक्लोन सर्वश्रेष्ठ ट्रैक डेटा को जोड़ने के लिए एक तकनीक. Journal of Atmospheric and Oceanic Technology, 27(4):680-692, 2010. [31] डेविड एच लेविंसन, हॉवर्ड जे डायमंड, केनेथ आर नापप, माइकल सी क्रोक, और ईथन जे गिबनी. एक समलैंगिक वैश्विक उष्णकटिबंधीय तूफान के लिए सर्वश्रेष्ठ ट्रैक डेटासेट. Bulletin of American Meteorological Society, 91(3):377-380, 2010. [32] Ignacio Lopez-Gomez, Amy McGovern, Shreya Agrawal, और Jason Hickey. ग्लोबल चरम गर्मी पूर्वानुमान न्यूरो मौसम मॉडल का उपयोग कर. पृथ्वी प्रणालियों के लिए कृत्रिम बुद्धि, पृष्ठ 1-41, 2022. [33] Ilya Loshchilov और फ्रैंक हटर. अलग-अलग वजन घटाने नियमितता. arXiv प्रीप्रिंट arXiv:1711.05101, 2017. [34] लिनस मैगनसन. 202208 - heatwave - uk. https://confluence.ecmwf.int/display/ FCST/202208+-+Heatwave+-+UK, 2022. [35] Linus Magnusson, Thomas Haiden, and David Richardson. Extreme Weather Events Verification: Discrete Predictands. यूरोपीय मध्यम सीमा मौसम पूर्वानुमान केंद्र, 2014। [36] S. Malardel, Nils Wedi, Willem Deconinck, Michail Diamantakis, क्रिश्चियन Kuehnlein, G. Mozdzynski, M. Hamrud, और Piotr Smolarkiewicz. IFS के लिए एक नया ग्रिड. https: //www.ecmwf.int/node/17262, 2016 2016. [37] Benjamin J Moore, Paul J Neiman, F Martin Ralph, और Faye E Barthold. नाशविले, टेनेसी में भारी बाढ़ के साथ जुड़े भौतिक प्रक्रियाओं, और 1–2 मई 2010 के दौरान आसपास: एक वायुमंडलीय नदी और मोज़ास्केल कॉन्वेक्टिव सिस्टम की भूमिका. Monthly Weather Review, 140(2):358–378, 2012. [38] पॉल जे Neiman, एफ मार्टिन राल्फ, गरी एक विक, जेसिका डी लंडक्विस्ट, और माइकल डी डेटिंगर। मौसम विशेषताएं और उत्तरी अमेरिका के पश्चिमी तट को प्रभावित करने वाले वायुमंडलीय नदियों के सतह पर बारिश के प्रभाव एसएसएम / आई उपग्रह निरीक्षणों के आठ वर्षों के आधार पर। [39] टोबीस पीफाफ, मेयर फोर्टुनाटो, अल्वारो सैंचेस-गोंज़ेलेज़, और पीटर बैटगाला। ग्राफ़ नेटवर्क के साथ मेष आधारित सिमुलेशन सीखना. International Conference on Learning Representations, 2021. [40] Prajit Ramachandran, Barret Zoph, और Quoc V Le. सक्रियण कार्यों के लिए खोज. arXiv प्रीप्रिंट arXiv:1710.05941, 2017. [41] Stephan Rasp, Peter D Dueben, Sebastian Scher, Jonathan A Weyn, Soukayna Mouatadid, और Nils Thuerey. WeatherBench: डेटा-आधारित मौसम पूर्वानुमान के लिए संदर्भ डेटा सेट. जर्नल of Advances in Modeling Earth Systems, 12(11):e2020MS002203, 2020। [42] Takaya Saito और मार्क Rehmsmeier। सटीकता याद दिलाने की जिक्र बाइनरी वर्गीकरण को असंतुलित डेटासेट पर मूल्यांकन करते समय ROC जिक्र की तुलना में अधिक सूचनात्मक है. PloS एक, 10(3):e0118432, 2015. [43] Alvaro Sanchez-Gonzalez, Jonathan Godwin, Tobias Pfaff, Rex Ying, Jure Leskovec, और Peter Battaglia ग्राफ़ नेटवर्क के साथ जटिल भौतिकी को अनुकरण करने के लिए सीखना। [44] B. D. Santer, R. Sausen, T. M. L. Wigley, J. S. Boyle, K. AchutaRao, C. Doutriaux, J. E. Hansen, G. A. Meehl, E. Roeckner, R. Ruedy, G. Schmidt, और K. E. Taylor. मॉडल, पुनः विश्लेषण, और अवलोकनों में tropopause ऊंचाई और वायुमंडलीय तापमान के व्यवहार: दशक परिवर्तन। [45] Richard Swinbank, Masayuki Kyouda, Piers Buchanan, Lizzie Froude, Thomas M Hamill, Tim D Hewson, Julia H Keller, Mio Matsueda, John Methven, Florian Pappenberger, आदि। [46] रिचर्ड स्विनबैंक, मैसायोकी किउडा, पियर्स बुकनेन, लिज़ी फ्रूड, थॉमस एम. हैमिल, टिम डी. ह्यूसन, जूलिया एच. केलर, मायो मत्वेदा, जॉन मथवेन, फ्लोरियन पेपेंबर्गर, माइकल श्वेयर, हेलेन ए. टिटली, लॉरेंस विल्सन, और म्यूनेहिको यामागुशी। टीआईजीजीई परियोजना और इसके उपलब्धि। अमेरिकी मौसम विज्ञान समाज की पत्रिका, 97(1):49 – 67, 2016. [47] हार्वे थोरम टेलर, बिल वार्ड, मार्क विलिस, और वाल्ट ज़ेलस्की। सफिर-सिम्पसन तूफान हवा का पैमाना। वायुमंडल प्रशासन: वाशिंगटन, डीसी, संयुक्त राज्य अमेरिका, 2010। [48] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, Łukasz Kaiser, और Illia Polosukhin। ध्यान सब कुछ आप की जरूरत है. न्यूरो सूचना प्रसंस्करण प्रणालियों में प्रगति, 30, 2017. [49] पीटर Veličković, Guillem Cucurull, Arantxa Casanova, Adriana Romero, Pietro Lio, और Yoshua Bengio. ग्राफ ध्यान नेटवर्क. arXiv प्रीप्रिंट arXiv:1710.10903, 2017. यह लेख CC by 4.0 Deed (Attribution 4.0 International) लाइसेंस के तहत archiv पर उपलब्ध है। यह लेख CC by 4.0 Deed (Attribution 4.0 International) लाइसेंस के तहत archiv पर उपलब्ध है।