লেখক:
(1) শা-বো লিন, সেন্টার ফর ইন্টেলিজেন্ট ডিসিশন-মেকিং অ্যান্ড মেশিন লার্নিং, স্কুল অফ ম্যানেজমেন্ট, জিয়ান জিয়াওটং ইউনিভার্সিটি;
(2) জিংপিং সান, গণিত বিভাগ, মিসৌরি স্টেট ইউনিভার্সিটি;
(3) ডি ওয়াং, §সেন্টার ফর ইন্টেলিজেন্ট ডিসিশন মেকিং অ্যান্ড মেশিন লার্নিং, স্কুল অফ ম্যানেজমেন্ট, জিয়ান জিয়াওটং ইউনিভার্সিটি।
বিমূর্ত এবং ভূমিকা
গোলকের উপর কার্নেল ইন্টারপোলেশনের অনিশ্চয়তা সম্পর্ক
বিতরণ করা কার্নেল ইন্টারপোলেশন
চতুর্ভুজ নিয়মের মাধ্যমে অপারেটরের পার্থক্য
প্রমাণ
সংখ্যাগত যাচাইকরণ
তথ্যসূত্র
বিক্ষিপ্ত ডেটার রেডিয়াল বেসিস ফাংশন (RBF) কার্নেল ইন্টারপোলেশনের জন্য, 1995 সালে Schaback [30] প্রমাণ করেছিলেন যে প্রাপ্য আনুমানিক ত্রুটি এবং অন্তর্নিহিত ইন্টারপোলেশন ম্যাট্রিক্সের শর্ত সংখ্যা একই সাথে ছোট করা যায় না। তিনি এই অনুসন্ধানটিকে "অনিশ্চয়তা সম্পর্ক" হিসাবে উল্লেখ করেছেন, যার একটি অবাঞ্ছিত পরিণতি হল যে RBF কার্নেল ইন্টারপোলেশন গোলমাল ডেটার জন্য সংবেদনশীল। এই গবেষণাপত্রে, আমরা অ-নগণ্য মাত্রার গোলমাল গোলাকার ডেটা ইন্টারপোলেট করে আনা অনিশ্চয়তা পরিচালনা এবং পরিমাপ করার জন্য একটি বিতরণকৃত ইন্টারপোলেশন পদ্ধতির প্রস্তাব এবং অধ্যয়ন করি। আমরা সংখ্যাসূচক সিমুলেশন ফলাফলও উপস্থাপন করি যা দেখায় যে আমাদের পদ্ধতিটি ব্যবহারিক এবং চ্যালেঞ্জিং কম্পিউটিং পরিবেশ থেকে গোলমাল ডেটা পরিচালনার ক্ষেত্রে শক্তিশালী।
মূল শব্দ। কার্নেল ইন্টারপোলেশন, বিতরণ করা অনিশ্চয়তা প্রশমন, বিক্ষিপ্ত গোলাকার ডেটা
কোরোলারি 2.2 দেখায় যে কার্নেল ইন্টারপোলেশন খারাপভাবে কাজ করে যখন অ-নগণ্য মাত্রার গোলমাল ডেটার মুখোমুখি হয়। এই প্রধান অপূর্ণতা কাটিয়ে ওঠার জন্য, আমরা এই বিভাগে একটি ডিস্ট্রিবিউটেড কার্নেল ইন্টারপোলেশন (DKI) পদ্ধতির প্রস্তাব এবং অধ্যয়ন করি, যা সাহিত্যে "ডিস্ট্রিবিউটেড লার্নিং" দ্বারা অনুপ্রাণিত হয় [37, 19]। রূপকভাবে বলতে গেলে, এটি অনিশ্চয়তার পরিমাণ নির্ধারণের জন্য একটি বিভক্ত-এবং-জয় কৌশল। বিস্তারিতভাবে, আমরা তিনটি ধাপে পদ্ধতিটি বর্ণনা করি।
এই বিভাগে, আমরা প্রথমে সংক্ষিপ্তভাবে [8] তে শুরু করা একটি অখণ্ড-অপারেটর পদ্ধতির প্রকাশ করি এবং তারপরে আমাদের আগ্রহের অপারেটরদের পার্থক্যের জন্য আঁটসাঁট উপরের সীমারেখা বের করি, একটি উপজাত হিসাবে একটি নির্দিষ্ট ধরণের সোবোলেভ নমুনা বৈষম্যগুলি [12] প্রাপ্ত করি। বিভাগের হাইলাইটগুলির মধ্যে রয়েছে প্রস্তাবনা 4.5) এবং লেমা 4.8৷
DKI-এর চমৎকার কর্মক্ষমতা যাচাই করার জন্য এই বিভাগে চারটি সিমুলেশন করা হয়। প্রথমটি দেখায় যে ডিকেআই কার্নেল ইন্টারপোলেশনের অনিশ্চয়তা দূর করতে সফল হয়। দ্বিতীয়টি DKI তে m এর ভূমিকা প্রদর্শন করে। তৃতীয়টি ডিকেআই-তে বিভাগ কৌশলের ভূমিকার উপর দৃষ্টি নিবদ্ধ করে। শেষটি ডিকেআই-কে ডিস্ট্রিবিউটেড ফিল্টারড হাইপারইন্টারপোলেশন (DFH) [২১], s ∗ -ডিজাইন [২০] সহ স্কেচিং, এবং ডিস্ট্রিবিউটেড কার্নেল রিজ রিগ্রেশন (DKRR) [৮] সহ বেশ কয়েকটি জনপ্রিয় গোলাকার ডেটা ফিটিং স্কিমের সাথে তুলনা করে।
সিমুলেশন 2: এই সিমুলেশনে, আমরা DKI তে m প্যারামিটারের ভূমিকা দেখাই। আমরা 10014 প্রশিক্ষণের নমুনা তৈরি করি (ইনপুট হিসাবে 141-ডিজাইন সহ)। বিভাজনের সংখ্যা, m, {5, 10, · · · , 200} থেকে বিস্তৃত। চিত্র 6.2 ডিকেআই-এর RMSE এবং গাউসিয়ান শব্দের বিভিন্ন স্তরের অধীনে স্থানীয় মেশিনের সংখ্যার মধ্যে সম্পর্ক দেখায়, তবে প্রশিক্ষণের নমুনার মোট সংখ্যা দেওয়া হয়। চিত্র 6.2 থেকে, আমরা নিম্নলিখিত দাবিগুলি উপসংহার করতে পারি: 1) উচ্চ স্তরের শব্দ সহ প্রশিক্ষণের নমুনার জন্য, RMSE পরীক্ষা সাধারণত প্রথমে হ্রাস পায় এবং তারপরে স্থানীয় মেশিনের সংখ্যা বৃদ্ধির সাথে সাথে ধীরে ধীরে বৃদ্ধি পায়। m-এর মাঝারি মানগুলি DKI-এর জন্য ভাল আনুমানিক সম্পত্তি থেকে আরও পরিবাহী। কারণ হল যে খুব ছোট m কার্নেল ইন্টারপোলেশনে অনিশ্চয়তার সমস্যাটি সফলভাবে সমাধান করে না; খুব বড় m ফিটিং ত্রুটি বাড়ায়, যার ফলে সাধারণীকরণ কার্যক্ষমতা কিছুটা খারাপ হয়। 2) সর্বনিম্ন RMSE সহ সর্বোত্তম সংখ্যা m ক্রমবর্ধমান গাউসিয়ান শব্দের সাথে বৃদ্ধি পায়। এটি উপপাদ্য 3.2 এর সমীকরণ (3.3) যাচাই করে, যেখানে আনুমানিক ত্রুটি প্রাথমিকভাবে বড় শব্দের (অর্থাৎ, বড় M) নমুনা ত্রুটির সাথে সম্পর্কিত এবং একটি বড় m ব্যবহার করে হ্রাস করা যেতে পারে।
[১] আর. ভাটিয়া, ম্যাট্রিক্স বিশ্লেষণ, ভলিউম। 169, স্প্রিংগার সায়েন্স অ্যান্ড বিজনেস মিডিয়া, 2013।
[২] JS Brauchart এবং K. Hesse, সাংখ্যিক একীকরণ ওভার অর্বিট্রারি ডাইমেনশন, গঠনমূলক আনুমানিক, 25 (2007), pp. 41-71।
[৩] জি. ব্রাউন এবং এফ. দাই, কমপ্যাক্ট টু-পয়েন্ট সমজাতীয় স্থানগুলিতে মসৃণ ফাংশনগুলির আনুমানিক, কার্যকরী বিশ্লেষণের জার্নাল, 220 (2005), পৃষ্ঠা 401-423।
[৪] A. Chernih, IH Sloan, এবং RS Womersley, Wendland ফাংশন ক্রমবর্ধমান মসৃণতার সাথে গাউসিয়ানে একত্রিত হয়, কম্পিউটেশনাল গণিতের অগ্রগতি, 40 (2014), pp. 185– 200।
[৫] এফ. দাই, দ্বিগুণ ওজন এবং a∞ ওজনের ক্ষেত্রে বহুমুখী বহুপদী অসমতা, কার্যকরী বিশ্লেষণ জার্নাল, 235 (2006), পৃ. 137-170।
[৬] এফ. দাই, গোলকের উপর সাধারণীকৃত হাইপারইন্টারপোলেশন, প্রসিডিংস অফ দ্য আমেরিকান ম্যাথমেটিকাল সোসাইটি, 134 (2006), পৃষ্ঠা 2931-2941।
[৭] HW Engl, M. Hanke, and A. Neubauer, Regularization of Inverse Problems, vol. 375, স্প্রিংগার সায়েন্স অ্যান্ড বিজনেস মিডিয়া, 1996।
[৮] এইচ. ফেং, এস.-বি. লিন, এবং ডি.-এক্স। Zhou, গোলকের উপর বন্টনমূলকভাবে সঞ্চিত ডেটা সহ রেডিয়াল বেসিস ফাংশন আনুমানিক, arXiv:2112.02499, (2021)।
[৯] T. Hangelbroek, FJ Narcowich, X. Sun, and JD Ward, Kernel approximation on manifolds ii: l2 প্রজেক্টরের l∞ আদর্শ, গাণিতিক বিশ্লেষণে SIAM জার্নাল, 43 (2011), pp. 662–684.
[১০] টি. হ্যাঙ্গেলব্রুক, এফজে নারকোভিচ এবং জেডি ওয়ার্ড, কার্নেল অ্যাপ্রোক্সিমেশন অন ম্যানিফোল্ডস i: বাউন্ডিং দ্য লেবেসগ্যু কনস্ট্যান্ট, গাণিতিক বিশ্লেষণের উপর সিয়াম জার্নাল, 42 (2010), pp. 1732–1760।
[১১] কে. হেসে, আইএইচ স্লোন, এবং আরএস ওমার্সলে, গোলকের উপর গোলমাল বিক্ষিপ্ত ডেটার রেডিয়াল বেসিস ফাংশন আনুমানিক, নিউমেরিসচে ম্যাথমেটিক, 137 (2017), পিপি। 579–605।
[১২] কে. হেসে, আইএইচ স্লোন, এবং আরএস ওমার্সলে, স্থানীয় rbf-ভিত্তিক জরিমানাকৃত ন্যূনতম-বর্গক্ষেত্র আনুমানিক গোলক বিক্ষিপ্ত ডেটা সহ, কম্পিউটেশনাল এবং ফলিত গণিতের জার্নাল, 382 (2021), পৃ. 113061।
[১৩] S. Hubbert, QT Le Gia, এবং TM Morton ˆ , গোলাকার রেডিয়াল বেসিস ফাংশন, তত্ত্ব এবং প্রয়োগ, স্প্রিংগার, 2015।
[১৪] এমএ কিং, আরজে বিংহাম, পি. মুর, পিএল হোয়াইটহাউস, এমজে বেন্টলি, এবং জিএ মিলনে, অ্যান্টার্কটিক সমুদ্র-স্তরের অবদানের নিম্ন উপগ্রহ-গ্রাভিমেট্রি অনুমান, প্রকৃতি, 491 (2012), পৃষ্ঠা. 586-589।
[১৫] কিউটি লে গিয়া, এফজে নারকোভিচ, জেডি ওয়ার্ড, এবং এইচ. ওয়েন্ডল্যান্ড, গোলকের উপর রেডিয়াল বেসিস ফাংশন দ্বারা ক্রমাগত এবং বিচ্ছিন্ন সর্বনিম্ন-বর্গীয় অনুমান, জার্নাল অফ অ্যাপ্রোক্সিমেশন থিওরি, 143 (2006), পৃষ্ঠা 124-133।
[১৬] পি. লিওপার্ডি, সমান ক্ষেত্রফল এবং ছোট ব্যাসের অঞ্চলে একক গোলকের বিভাজন, সংখ্যাগত বিশ্লেষণে বৈদ্যুতিন লেনদেন, 25 (2006), পৃষ্ঠা 309-327।
[১৭] জে. লেভসলি, জেড. লুও, এবং এক্স. সান, ইন্টারপোলেশন ম্যাট্রিক্সের আদর্শ অনুমান এবং কঠোরভাবে ইতিবাচক নির্দিষ্ট ফাংশনের সাথে সম্পর্কিত তাদের বিপরীত, আমেরিকান গাণিতিক সোসাইটির কার্যপ্রণালী, (1999), পৃ. 2127-2134।
[১৮] এস.-বি. লিন, এক্স. চ্যাং, এবং এক্স. সূর্য, উচ্চমাত্রিক বিক্ষিপ্ত ডেটার কার্নেল ইন্টারপোলেশন, arXiv প্রিপ্রিন্ট arXiv:2009.01514, (2020)।
[১৯] এস.-বি. লিন, এক্স. গুও, এবং ডি.-এক্স। Zhou, নিয়মিত ন্যূনতম স্কোয়ার সহ বিতরণ করা শিক্ষা, দ্য জার্নাল অফ মেশিন লার্নিং রিসার্চ, 18 (2017), pp. 3202–3232।
[২০] এস.-বি. লিন, ডি. ওয়াং এবং ডি.-এক্স। Zhou, গোলকের উপর গোলাকার নকশা সহ স্কেচিং, SIAM জার্নাল অন সায়েন্টিফিক কম্পিউটেশন, প্রেসে (2023)।
[২১] এস.-বি. লিন, ওয়াইজি ওয়াং এবং ডি.-এক্স। Zhou, গোলকের উপর কোলাহলপূর্ণ ডেটার জন্য বিতরণ করা ফিল্টার করা হাইপারইন্টারপোলেশন, সংখ্যাগত বিশ্লেষণে SIAM জার্নাল, 59 (2021), pp. 634–659।
[২২] JD McEwen এবং Y. Wiaux, গোলকের উপর একটি উপন্যাস নমুনা উপপাদ্য, IEEE লেনদেন অন সিগন্যাল প্রসেসিং, 59 (2011), pp. 5876–5887।
[২৩] H. Mhaskar, F. Narcowich, and J. Ward, Spherical marcinkiewicz-zygmund inequalities and positive quadrature, Mathematics of Computation, 70 (2001), pp. 1113–1130.
[২৪] এইচ এন মহস্কর, ওয়েটেড কোয়াড্রেচার সূত্র এবং গোলকের উপর জোনাল ফাংশন নেটওয়ার্ক দ্বারা আনুমানিকতা, জার্নাল অফ কমপ্লেসিটি, 22 (2006), পৃষ্ঠা 348-370।
[২৫] সি. মুলার ¨ , স্ফেরিক্যাল হারমোনিক্স, ভলিউম। 17, স্প্রিংগার, 1966।
[২৬] এফজে নারকোভিচ, এন. শিবকুমার, এবং জেডি ওয়ার্ড, ইউক্লিডিয়ান গোলকের বিক্ষিপ্ত-ডেটা ইন্টারপোলেশনের জন্য স্থিতিশীলতার ফলাফল, গণিত গণিতের অগ্রগতি, 8 (1998), পৃষ্ঠা 137-163।
[২৭] এফজে নারকোভিচ, এক্স. সান, জেডি ওয়ার্ড, এবং এইচ. ওয়েন্ডল্যান্ড, গোলাকার ভিত্তি ফাংশনের মাধ্যমে বিক্ষিপ্ত ডেটা ইন্টারপোলেশনের জন্য প্রত্যক্ষ এবং বিপরীত সোবোলেভ ত্রুটি অনুমান, কম্পিউটেশনাল গণিতের ভিত্তি, 7 (2007), পৃষ্ঠা 369–390।
[২৮] এফজে নারকোভিচ এবং জেডি ওয়ার্ড, গোলকগুলিতে বিক্ষিপ্ত ডেটা ইন্টারপোলেশন: ত্রুটি অনুমান এবং স্থানীয়ভাবে সমর্থিত ভিত্তি ফাংশন, গাণিতিক বিশ্লেষণের উপর সিয়াম জার্নাল, 33 (2002), পিপি। 1393-1410।
[২৯] এ. রুডি, আর. ক্যামোরিয়ানো, এবং এল. রোসাস্কো, কম বেশি: Nystr¨om কম্পিউটেশনাল রেগুলারাইজেশন।, NIPS, 2015, pp. 1657–1665।
[৩০] আর. শ্যাব্যাক, রেডিয়াল বেসিস ফাংশন ইন্টারপোলেশনের জন্য ত্রুটি অনুমান এবং শর্ত সংখ্যা, গণিত গণিতের অগ্রগতি, 3 (1995), পিপি। 251-264।
[৩১] S. Smale এবং D.-X. ঝোউ, শ্যানন নমুনা এবং বিন্দু মান থেকে ফাংশন পুনর্গঠন, আমেরিকান গাণিতিক সোসাইটির বুলেটিন, 41 (2004), পৃষ্ঠা 279-305।
[৩২] S. Smale এবং D.-X. ঝোউ, শ্যানন স্যাম্পলিং ii: শেখার তত্ত্বের সংযোগ, ফলিত এবং গণনামূলক হারমোনিক বিশ্লেষণ, 19 (2005), পৃষ্ঠা 285–302।
[৩৩] Y.-T. Tsai এবং Z.-C. শিহ, গোলাকার রেডিয়াল বেসিস ফাংশন এবং ক্লাস্টারড টেনসর অ্যাপ্রোক্সিমেশন ব্যবহার করে অল-ফ্রিকোয়েন্সি প্রি-কম্পিউটেড রেডিয়েন্স ট্রান্সফার, গ্রাফিক্সের উপর ACM লেনদেন (TOG), 25 (2006), pp. 967-976।
[৩৪] এইচ. ওয়েন্ডল্যান্ড, বিক্ষিপ্ত ডেটা আনুমানিকতা, ভলিউম। 17, কেমব্রিজ ইউনিভার্সিটি প্রেস, 2004।
[৩৫] এমএ উইকজোরেক এবং আরজে ফিলিপস, একটি গোলকের সম্ভাব্য অসামঞ্জস্য: চন্দ্র ভূত্বকের পুরুত্বের প্রয়োগ, জিওফিজিক্যাল রিসার্চ জার্নাল: প্ল্যানেটস, 103 (1998), পৃ. 1715-1724।
[৩৬] RS Womersley, ভাল জ্যামিতিক বৈশিষ্ট্য সহ দক্ষ গোলাকার নকশা, সমসাময়িক গণিত গণিত-এ সেলিব্রেশন অফ দ্য 80 তম জন্মদিন ইয়ান স্লোন, স্প্রিংগার, 2018, পৃষ্ঠা 1243–1285।
[৩৭] Y. Zhang, J. Duchi, এবং M. Wainwright, Divide and conquer kernel ridge regression: A distributed algorithm with minimax optimal rates, The Journal of Machine Learning Research, 16 (2015), pp. 3299–3340.
SM1। পরিশিষ্ট A: ডেটা বিভাগের জন্য নির্বাচন ও বিচারক কৌশল। এই পরিশিষ্টে, আমরা সিলেক্ট-এন্ড-জজ (SAJ) কৌশলের বিস্তারিত বাস্তবায়ন উপস্থাপন করি। আমাদের লক্ষ্য একটি প্রদত্ত সহনশীলতা c0 এর চেয়ে ছোট নয় এমন বিচ্ছেদ ব্যাসার্ধ সহ অনুরূপ কার্ডিনালিটির উপসেটের একটি সিরিজ আহরণ করা। SAJ এর জন্য দুটি পর্যায় রয়েছে।
এই কাগজটি CC0 1.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।