लेखक:
(1) शा-बो लिन, सेंटर फॉर इंटेलिजेंट डिसीजन-मेकिंग एंड मशीन लर्निंग, स्कूल ऑफ मैनेजमेंट, शीआन जियाओतोंग यूनिवर्सिटी;
(2) जिंगपिंग सन, गणित विभाग, मिसौरी स्टेट यूनिवर्सिटी;
(3) डि वांग, §सेंटर फॉर इंटेलिजेंट डिसीजन-मेकिंग एंड मशीन लर्निंग, स्कूल ऑफ मैनेजमेंट, शीआन जियाओतोंग यूनिवर्सिटी।
सार एवं परिचय
गोले पर कर्नेल इंटरपोलेशन का अनिश्चितता संबंध
वितरित कर्नेल इंटरपोलेशन
चतुर्भुज नियमों के माध्यम से संचालक अंतर
सबूत
संख्यात्मक सत्यापन
संदर्भ
बिखरे हुए डेटा के रेडियल आधार फ़ंक्शन (आरबीएफ) कर्नेल इंटरपोलेशन के लिए, शेबैक [30] ने 1995 में साबित किया कि प्राप्य सन्निकटन त्रुटि और अंतर्निहित इंटरपोलेशन मैट्रिक्स की स्थिति संख्या को एक साथ छोटा नहीं किया जा सकता है। उन्होंने इस खोज को "अनिश्चितता संबंध" के रूप में संदर्भित किया, जिसका एक अवांछनीय परिणाम यह है कि आरबीएफ कर्नेल इंटरपोलेशन शोर डेटा के लिए अतिसंवेदनशील है। इस पेपर में, हम गैर-नगण्य परिमाण के शोर गोलाकार डेटा को इंटरपोल करके लाई गई अनिश्चितता को प्रबंधित करने और मापने के लिए एक वितरित इंटरपोलेशन विधि का प्रस्ताव और अध्ययन करते हैं। हम संख्यात्मक सिमुलेशन परिणाम भी प्रस्तुत करते हैं जो दिखाते हैं कि चुनौतीपूर्ण कंप्यूटिंग वातावरण से शोर डेटा को संभालने के मामले में हमारी पद्धति व्यावहारिक और मजबूत है।
मुख्य शब्द. कर्नेल प्रक्षेप, वितरित अनिश्चितता शमन, बिखरा हुआ गोलाकार डेटा
परिणाम 2.2 से पता चलता है कि गैर-नगण्य परिमाण के शोर डेटा का सामना करते समय कर्नेल इंटरपोलेशन खराब प्रदर्शन करता है। इस बड़ी कमी को दूर करने के लिए, हम इस खंड में एक वितरित कर्नेल इंटरपोलेशन (डीकेआई) विधि का प्रस्ताव और अध्ययन करते हैं, जो साहित्य में "वितरित शिक्षा" से प्रेरित है [37, 19]। लाक्षणिक रूप से कहें तो, यह अनिश्चितता परिमाणीकरण के लिए फूट डालो और जीतो की रणनीति है। विस्तृत रूप से, हम तीन चरणों में विधि का वर्णन करते हैं।
इस खंड में, हम सबसे पहले [8] में शुरू किए गए इंटीग्रल-ऑपरेटर दृष्टिकोण को संक्षेप में उजागर करते हैं और फिर एक उपोत्पाद के रूप में एक निश्चित प्रकार की सोबोलेव नमूना असमानताओं [12] को प्राप्त करते हुए, हमारे हित के ऑपरेटरों के अंतर के लिए कड़ी ऊपरी सीमाएं प्राप्त करते हैं। अनुभाग के मुख्य आकर्षणों में प्रस्ताव 4.5) और लेम्मा 4.8 शामिल हैं।
डीकेआई के उत्कृष्ट प्रदर्शन को सत्यापित करने के लिए इस खंड में चार सिमुलेशन किए गए हैं। पहला दिखाता है कि डीकेआई कर्नेल इंटरपोलेशन की अनिश्चितता को दूर करने में सफल होता है। दूसरा डीकेआई में एम की भूमिका को प्रदर्शित करता है। तीसरा डीकेआई में विभाजन रणनीति की भूमिका पर केंद्रित है। अंतिम डीकेआई की तुलना कई लोकप्रिय गोलाकार डेटा फिटिंग योजनाओं से करता है जिसमें वितरित फ़िल्टर्ड हाइपरइंटरपोलेशन (डीएफएच) [21], एस * -डिज़ाइन के साथ स्केचिंग [20], और वितरित कर्नेल रिज रिग्रेशन (डीकेआरआर) [8] शामिल हैं।
सिमुलेशन 2: इस सिमुलेशन में, हम डीकेआई में पैरामीटर एम की भूमिका दिखाते हैं। हम 10014 प्रशिक्षण नमूने तैयार करते हैं (इनपुट के रूप में 141-डिज़ाइन के साथ)। डिवीजनों की संख्या, मी, {5, 10, · · ·, 200} तक होती है। चित्र 6.2 डीकेआई के आरएमएसई और गॉसियन शोर के विभिन्न स्तरों के तहत स्थानीय मशीनों की संख्या के बीच संबंध दिखाता है, बशर्ते कि प्रशिक्षण नमूनों की कुल संख्या दी गई हो। चित्र 6.2 से, हम निम्नलिखित दावे का निष्कर्ष निकाल सकते हैं: 1) उच्च स्तर के शोर वाले नमूनों के प्रशिक्षण के लिए, परीक्षण आरएमएसई आम तौर पर पहले कम हो जाता है और फिर स्थानीय मशीनों की संख्या बढ़ने पर धीरे-धीरे बढ़ता है। एम के मध्यम मूल्य डीकेआई के लिए अच्छी सन्निकटन संपत्ति के लिए अधिक प्रवाहकीय हैं। इसका कारण यह है कि बहुत छोटा एम कर्नेल इंटरपोलेशन में अनिश्चितता के मुद्दे को सफलतापूर्वक संबोधित नहीं करता है; बहुत बड़ा एम फिटिंग त्रुटि को बढ़ाता है, जिसके परिणामस्वरूप सामान्यीकरण प्रदर्शन थोड़ा खराब होता है। 2) सबसे कम आरएमएसई के साथ इष्टतम संख्या एम बढ़ते गाऊसी शोर के साथ बढ़ती है। यह प्रमेय 3.2 के समीकरण (3.3) को सत्यापित करता है, जिसमें सन्निकटन त्रुटि मुख्य रूप से बड़े शोर (यानी, बड़े एम) के लिए नमूना त्रुटि से संबंधित है और इसे बड़े एम का उपयोग करके कम किया जा सकता है।
[1] आर. भाटिया, मैट्रिक्स विश्लेषण, खंड। 169, स्प्रिंगर साइंस एंड बिजनेस मीडिया, 2013।
[2] जेएस ब्रूचार्ट और के. हेस्से, मनमाने आयाम के क्षेत्रों पर संख्यात्मक एकीकरण, रचनात्मक अनुमान, 25 (2007), पीपी 41-71।
[3] जी. ब्राउन और एफ. दाई, कॉम्पैक्ट दो-बिंदु सजातीय स्थानों पर सुचारू कार्यों का अनुमान, जर्नल ऑफ फंक्शनल एनालिसिस, 220 (2005), पीपी 401-423।
[4] ए. चेर्निह, आईएच स्लोअन, और आरएस वोमर्सली, वेंडलैंड फ़ंक्शंस बढ़ती सहजता के साथ एक गाऊसी में परिवर्तित होते हैं, कम्प्यूटेशनल गणित में प्रगति, 40 (2014), पीपी 185-200।
[5] एफ. दाई, दोहरीकरण भार और ए∞ भार के संबंध में बहुभिन्नरूपी बहुपद असमानताएं, जर्नल ऑफ फंक्शनल एनालिसिस, 235 (2006), पीपी. 137-170।
[6] एफ. दाई, गोले पर सामान्यीकृत हाइपरइंटरपोलेशन पर, अमेरिकी गणितीय सोसायटी की कार्यवाही, 134 (2006), पीपी 2931-2941।
[7] एचडब्ल्यू इंजील, एम. हैंके, और ए. न्यूबॉयर, रेग्युलराइजेशन ऑफ इनवर्स प्रॉब्लम्स, वॉल्यूम। 375, स्प्रिंगर साइंस एंड बिजनेस मीडिया, 1996।
[8] एच. फेंग, एस.-बी. लिन, और डी.-एक्स. झोउ, गोले पर वितरणात्मक रूप से संग्रहीत डेटा के साथ रेडियल आधार फ़ंक्शन सन्निकटन, arXiv:2112.02499, (2021)।
[9] टी. हेंगलब्रोक, एफजे नार्कोविच, एक्स. सन, और जेडी वार्ड, मैनिफोल्ड्स पर कर्नेल सन्निकटन ii: एल2 प्रोजेक्टर का एल∞ मानदंड, गणितीय विश्लेषण पर सियाम जर्नल, 43 (2011), पीपी. 662-684।
[10] टी. हेंगलब्रोक, एफजे नार्कोविच, और जेडी वार्ड, मैनिफोल्ड्स पर कर्नेल सन्निकटन i: बाउंडिंग द लेबेस्ग कॉन्स्टेंट, गणितीय विश्लेषण पर सियाम जर्नल, 42 (2010), पीपी. 1732-1760।
[11] के. हेस्से, आईएच स्लोअन, और आरएस वोमर्सली, गोले पर शोर बिखरे हुए डेटा का रेडियल आधार फ़ंक्शन सन्निकटन, न्यूमेरिस्चे मैथमैटिक, 137 (2017), पीपी. 579-605।
[12] के. हेस्से, आईएच स्लोअन, और आरएस वोमर्सली, शोर बिखरे हुए डेटा के साथ गोले पर स्थानीय आरबीएफ-आधारित दंडित न्यूनतम-वर्ग सन्निकटन, जर्नल ऑफ़ कम्प्यूटेशनल एंड एप्लाइड मैथमेटिक्स, 382 (2021), पी। 113061.
[13] एस हबर्ट, क्यूटी ले जिया, और टीएम मॉर्टन ˆ, गोलाकार रेडियल आधार फ़ंक्शन, सिद्धांत और अनुप्रयोग, स्प्रिंगर, 2015।
[14] एमए किंग, आरजे बिंघम, पी. मूर, पीएल व्हाइटहाउस, एमजे बेंटले, और जीए मिल्ने, अंटार्कटिक समुद्र-स्तर योगदान के निचले उपग्रह-गुरुत्वाकर्षण अनुमान, नेचर, 491 (2012), पीपी. 586-589।
[15] क्यूटी ले जिया, एफजे नार्कोविच, जेडी वार्ड, और एच. वेंडलैंड, गोले पर रेडियल आधार कार्यों द्वारा सतत और असतत न्यूनतम-वर्ग सन्निकटन, जर्नल ऑफ़ एप्रोक्सिमेशन थ्योरी, 143 (2006), पीपी 124-133।
[16] पी. लेपार्डी, इकाई गोले का समान क्षेत्रफल और छोटे व्यास वाले क्षेत्रों में विभाजन, संख्यात्मक विश्लेषण पर इलेक्ट्रॉनिक लेनदेन, 25 (2006), पीपी. 309-327।
[17] जे. लेवेस्ले, जेड. लुओ, और एक्स. सन, सख्ती से सकारात्मक निश्चित कार्यों से जुड़े इंटरपोलेशन मैट्रिक्स और उनके व्युत्क्रमों के सामान्य अनुमान, अमेरिकी गणितीय सोसायटी की कार्यवाही, (1999), पीपी 2127-2134।
[18] एस.-बी. लिन, एक्स. चांग, और एक्स. सन, उच्च आयामी बिखरे हुए डेटा का कर्नेल इंटरपोलेशन, arXiv प्रीप्रिंट arXiv:2009.01514, (2020)।
[19] एस.-बी. लिन, एक्स. गुओ, और डी.-एक्स. झोउ, नियमित न्यूनतम वर्गों के साथ वितरित शिक्षण, द जर्नल ऑफ मशीन लर्निंग रिसर्च, 18 (2017), पीपी. 3202-3232।
[20] एस.-बी. लिन, डी. वांग, और डी.-एक्स. झोउ, गोले पर गोलाकार डिज़ाइन के साथ स्केचिंग, वैज्ञानिक संगणना पर सियाम जर्नल, प्रेस में (2023)।
[21] एस.-बी. लिन, वाईजी वांग, और डी.-एक्स। झोउ, गोले पर शोर डेटा के लिए वितरित फ़िल्टर्ड हाइपरइंटरपोलेशन, संख्यात्मक विश्लेषण पर SIAM जर्नल, 59 (2021), पीपी 634-659।
[22] जेडी मैकएवेन और वाई. वियाक्स, गोले पर एक नया नमूनाकरण प्रमेय, सिग्नल प्रोसेसिंग पर आईईईई लेनदेन, 59 (2011), पीपी. 5876-5887।
[23] एच. म्हस्कर, एफ. नार्कोविच, और जे. वार्ड, गोलाकार मार्सिंकिविज़-ज़िगमंड असमानताएं और सकारात्मक चतुर्भुज, संगणना का गणित, 70 (2001), पीपी. 1113-1130।
[24] एचएन म्हस्कर, भारित चतुर्भुज सूत्र और क्षेत्र पर जोनल फ़ंक्शन नेटवर्क द्वारा सन्निकटन, जर्नल ऑफ कॉम्प्लेक्सिटी, 22 (2006), पीपी 348-370।
[25] सी. मुलर ¨, गोलाकार हार्मोनिक्स, वॉल्यूम। 17, स्प्रिंगर, 1966।
[26] एफजे नार्कोविच, एन. शिवकुमार, और जेडी वार्ड, यूक्लिडियन क्षेत्रों पर बिखरे हुए डेटा इंटरपोलेशन के लिए स्थिरता परिणाम, कम्प्यूटेशनल गणित में प्रगति, 8 (1998), पीपी. 137-163।
[27] एफजे नार्कोविच, एक्स. सन, जेडी वार्ड, और एच. वेंडलैंड, गोलाकार आधार कार्यों के माध्यम से बिखरे हुए डेटा इंटरपोलेशन के लिए प्रत्यक्ष और उलटा सोबोलेव त्रुटि अनुमान, कम्प्यूटेशनल गणित की नींव, 7 (2007), पीपी 369-390।
[28] एफजे नार्कोविच और जेडी वार्ड, क्षेत्रों पर बिखरे हुए डेटा इंटरपोलेशन: त्रुटि अनुमान और स्थानीय रूप से समर्थित आधार फ़ंक्शन, गणितीय विश्लेषण पर एसआईएएम जर्नल, 33 (2002), पीपी 1393-1410।
[29] ए. रूडी, आर. कैमोरियानो, और एल. रोसास्को, कम अधिक है: निस्ट्रोम कम्प्यूटेशनल नियमितीकरण, एनआईपीएस में, 2015, पीपी. 1657-1665।
[30] आर. शाबैक, रेडियल आधार फ़ंक्शन इंटरपोलेशन के लिए त्रुटि अनुमान और स्थिति संख्या, कम्प्यूटेशनल गणित में प्रगति, 3 (1995), पीपी. 251-264।
[31] एस. स्माले और डी.-एक्स. झोउ, शैनन नमूनाकरण और बिंदु मूल्यों से फ़ंक्शन पुनर्निर्माण, अमेरिकन गणितीय सोसायटी के बुलेटिन, 41 (2004), पीपी 279-305।
[32] एस. स्माले और डी.-एक्स. झोउ, शैनन सैंपलिंग ii: कनेक्शंस टू लर्निंग थ्योरी, एप्लाइड एंड कम्प्यूटेशनल हार्मोनिक एनालिसिस, 19 (2005), पीपी. 285-302।
[33] वाई.-टी. त्साई और जेड-सी। शिह, गोलाकार रेडियल आधार फ़ंक्शंस और क्लस्टर्ड टेंसर सन्निकटन का उपयोग करके ऑल-फ़्रीक्वेंसी प्रीकंप्यूटेड रेडियंस ट्रांसफर, ग्राफिक्स पर एसीएम लेनदेन (टीओजी), 25 (2006), पीपी 967-976।
[34] एच. वेंडलैंड, स्कैटरड डेटा एप्रोक्सिमेशन, खंड। 17, कैम्ब्रिज यूनिवर्सिटी प्रेस, 2004।
[35] एमए विएज़ोरेक और आरजे फिलिप्स, एक गोले पर संभावित विसंगतियाँ: चंद्र परत की मोटाई के लिए अनुप्रयोग, जर्नल ऑफ़ जियोफिजिकल रिसर्च: ग्रह, 103 (1998), पीपी. 1715-1724।
[36] आरएस वोमर्सली, समकालीन कम्प्यूटेशनल गणित में अच्छे ज्यामितीय गुणों के साथ कुशल गोलाकार डिजाइन-इयान स्लोअन के 80वें जन्मदिन का उत्सव, स्प्रिंगर, 2018, पीपी 1243-1285।
[37] वाई. झांग, जे. डुची, और एम. वेनराइट, कर्नेल रिज रिग्रेशन को विभाजित करें और जीतें: मिनिमैक्स इष्टतम दरों के साथ एक वितरित एल्गोरिदम, द जर्नल ऑफ मशीन लर्निंग रिसर्च, 16 (2015), पीपी 3299-3340।
SM1. परिशिष्ट ए: डेटा प्रभाग के लिए चयन और न्यायाधीश रणनीति। इस परिशिष्ट में, हम चयन-और-न्यायाधीश (एसएजे) रणनीति का विस्तृत कार्यान्वयन प्रस्तुत करते हैं। हमारा उद्देश्य समान कार्डिनैलिटी के उपसमुच्चय की एक श्रृंखला प्राप्त करना है, जिसका पृथक्करण त्रिज्या किसी दिए गए सहिष्णुता c0 से छोटा न हो। SAJ के लिए दो चरण हैं।
यह पेपर CC0 1.0 DEED लाइसेंस के तहत arxiv पर उपलब्ध है।