paint-brush
球体核插值的分布式不确定性量化经过@interpolation
239 讀數

球体核插值的分布式不确定性量化

太長; 讀書

本文提出分布式核插值 (DKI) 作为管理噪声球形数据插值中的不确定性的解决方案。 DKI 采用分而治之的策略,优化鲁棒性和近似精度。数值模拟验证了其有效性。
featured image - 球体核插值的分布式不确定性量化
The Interpolation Publication HackerNoon profile picture

作者:

(1) 林沙波,西安交通大学管理学院智能决策与机器学习中心;

(2) 孙兴平,密苏里州立大学数学系;

(3) 王迪,西安交通大学管理学院智能决策与机器学习中心。

内容概述

摘要与简介

球面上核插值的不确定性关系

分布式核插值

通过正交规则的运算符差异

证明

数值验证

参考

抽象的

对于离散数据的径向基函数(RBF)核插值,Schaback [30]于1995年证明了可达到的逼近误差和底层插值矩阵的条件数不能同时变小。他将这一发现称为“不确定性关系”,其不良后果是 RBF 核插值容易受到噪声数据的影响。在本文中,我们提出并研究了一种分布式插值方法,用于管理和量化因插值不可忽略的噪声球形数据而带来的不确定性。我们还提供了数值模拟结果,表明我们的方法在处理来自具有挑战性的计算环境的噪声数据方面是实用且稳健的。


关键词。核插值、分布式不确定性缓解、分散球形数据






球面上核插值的不确定性关系









3.分布式核插值。

推论 2.2 表明,在面对不可忽略的噪声数据时,核插值的表现很差。为了克服这个主要缺点,我们在本节中提出并研究了一种分布式核插值(DKI)方法,该方法是受到文献[37, 19]中“分布式学习”的启发。形象地说,这是一种不确定性量化的分而治之的策略。为了详细说明,我们分三个步骤描述该方法。











4. 通过正交规则实现算子差异。

在本节中,我们首先简要阐述[8]中提出的积分算子方法,然后导出我们感兴趣的算子差异的严格上限,获得某种类型的索博列夫采样不等式[12]作为副产品。本节的重点包括命题 4.5) 和引理 4.8。

























6. 数值验证

本节进行了四次仿真来验证DKI的优异性能。第一个表明 DKI 成功地规避了核插值的不确定性。第二个展示了 m 在 DKI 中的作用。第三个重点是分工战略在DKI中的作用。最后一篇将 DKI 与几种流行的球形数据拟合方案进行了比较,包括分布式滤波超插值 (DFH) [21]、使用 s * -设计绘制草图 [20] 和分布式核岭回归 (DKRR) [8]。








模拟2:在这个模拟中,我们展示了参数m在DKI中的作用。我们生成 10014 个训练样本(以 141 个设计作为输入)。划分数m的范围为{5, 10, ···, 200}。图 6.2 显示了在给定训练样本总数的情况下,不同高斯噪声水平下 DKI 的 RMSE 与本地机器数量之间的关系。从图6.2中,我们可以得出以下结论: 1)对于噪声水平较高的训练样本,测试均方根误差通常首先下降,然后随着本地机器数量的增加而缓慢增加。适中的 m 值更有利于 DKI 具有良好的近似性质。原因是m太小并不能成功解决核插值的不确定性问题; m太大会增加拟合误差,导致泛化性能稍差。 2) 具有最低 RMSE 的最佳数 m 随着高斯噪声的增加而增加。这验证了定理3.2的方程(3.3),其中近似误差主要与大噪声(即大M)的样本误差有关,并且可以使用大m来减小。








参考

[1] R. Bhatia,矩阵分析,卷。 169,施普林格科学与商业媒体,2013 年。


[2] JS Brauchart 和 K. Hesse,任意维度球面上的数值积分,构造近似,25 (2007),第 41-71 页。


[3] G. Brown 和 F. Dai,紧致两点齐次空间上的平滑函数的近似,函数分析杂志,220 (2005),第 401-423 页。


[4] A. Chernih、IH Sloan 和 RS Womersley,平滑度增加的 Wendland 函数收敛于高斯,计算数学进展,40 (2014),第 185-200 页。


[5] F. Dai,关于加倍权重和 a∞ 权重的多元多项式不等式,函数分析杂志,235 (2006),第 137-170 页。


[6] F. Dai,论球面上的广义超插值,美国数学会学报,134 (2006),第 2931–2941 页。


[7] HW Engl、M. Hanke 和 A. Neubauer,反问题正则化,卷。 375,施普林格科学与商业媒体,1996 年。


[8] H. Feng, S.-B.林和D.-X。 Zhou,球体上分布存储数据的径向基函数逼近,arXiv:2112.02499,(2021)。


[9] T. Hangelbroek、FJ Narcowich、X. Sun 和 JD Ward,流形 ii 上的核近似:l2 投影仪的 l∞ 范数,SIAM 数学分析杂志,43 (2011),第 662–684 页。


[10] T. Hangelbroek、FJ Narcowich 和 JD Ward,流形 i 上的核近似:限制勒贝格常数,SIAM 数学分析杂志,42 (2010),第 1732-1760 页。


[11] K. Hesse、IH Sloan 和 RS Womersley,球体上噪声散射数据的径向基函数近似,数值数学,137 (2017),第 579-605 页。


[12] K. Hesse、IH Sloan 和 RS Womersley,带有噪声散射数据的球体上基于局部 rbf 的惩罚最小二乘近似,计算与应用数学杂志,382 (2021),第 12 页。 113061。


[13] S. Hubbert、QT Le Gia 和 TM Morton ˆ,球面径向基函数、理论和应用,Springer,2015 年。


[14] MA King、RJ Bingham、P. Moore、PL Whitehouse、MJ Bentley 和 GA Milne,南极海平面贡献的较低卫星重力测量估计,自然,491 (2012),第 586-589 页。


[15] QT Le Gia、FJ Narcowich、JD Ward 和 H. Wendland,球体上径向基函数的连续和离散最小二乘近似,近似理论杂志,143 (2006),第 124–133 页。


[16] P. Leopardi,将单位球体划分为等面积和小直径的区域,Electronic Transactions on Numerical Analysis,25 (2006),第 309-327 页。


[17] J. Levesley、Z. Luo 和 X. Sun,与严格正定函数相关的插值矩阵及其逆的范数估计,美国数学会论文集,(1999),第 2127-2134 页。


[18]S.-B。 Lin、X. Chang 和 X. Sun,高维离散数据的核插值,arXiv 预印本 arXiv:2009.01514,(2020)。


[19]S.-B。 Lin、X.Guo 和 D.-X。周,使用正则化最小二乘法进行分布式学习,机器学习研究杂志,18(2017),第 3202-3232 页。


[20] S.-B。 Lin、D. Wang 和 D.-X。 Zhou,《Sketching with spherical designs on spheres》,《SIAM Journal on Scientific Computation》,待出版(2023 年)。


[21]S.-B。林、YG Wang 和 D.-X。 Zhou,球体上噪声数据的分布式滤波超插值,SIAM 数值分析杂志,59 (2021),第 634-659 页。


[22] JD McEwen 和 Y. Wiaux,球体上的新颖采样定理,IEEE 信号处理汇刊,59 (2011),第 5876–5887 页。


[23] H. Mhaskar、F. Narcowich 和 J. Ward,球面 marcinkiewicz-zygmund 不等式和正求积,计算数学,70 (2001),第 1113–1130 页。


[24] HN Mhaskar,球面上区域函数网络的加权求积公式和近似,复杂性杂志,22 (2006),第 348-370 页。


[25] C. Muller ì ,球谐函数,卷。 17,施普林格,1966 年。


[26] FJ Narcowich、N. Sivakumar 和 JD Ward,欧氏球体上离散数据插值的稳定性结果,计算数学进展,8 (1998),第 137-163 页。


[27] FJ Narcowich、X. Sun、JD Ward 和 H. Wendland,通过球基函数进行离散数据插值的直接和逆 Sobolev 误差估计,计算数学基础,7 (2007),第 369-390 页。


[28] FJ Narcowich 和 JD Ward,球体上的分散数据插值:误差估计和本地支持的基函数,SIAM 数学分析杂志,33 (2002),第 1393-1410 页。


[29] A. Rudi、R. Camoriano 和 L. Rosasco,少即是多:Nyström 计算正则化。,NIPS,2015 年,第 1657-1665 页。


[30] R. Schaback,径向基函数插值的误差估计和条件数,计算数学进展,3 (1995),第 251–264 页。


[31] S. Smale 和 D.-X。 Zhou,香农采样和点值函数重建,美国数学会通报,41 (2004),第 279–305 页。


[32] S. Smale 和 D.-X。 Zhou,香农采样 ii:与学习理论的联系,应用和计算谐波分析,19 (2005),第 285-302 页。


[33] Y.-T。蔡和 Z.-C。 Shih,使用球面径向基函数和簇张量近似的全频率预计算辐射率传输,ACM 图形学汇刊 (TOG),25 (2006),第 967–976 页。


[34] H. Wendland,分散数据近似,卷。 17,剑桥大学出版社,2004 年。


[35] MA Wieczorek 和 RJ Phillips,球体上的潜在异常:对月壳厚度的应用,地球物理研究杂志:行星,103 (1998),第 1715-1724 页。


[36] RS Womersley,具有良好几何特性的高效球形设计,当代计算数学 - 庆祝伊恩·斯隆 80 岁生日,施普林格,2018 年,第 1243-1285 页。


[37] Y. 张、J. Duchi 和 M. Wainwright,分而治之核岭回归:具有极小极大最优率的分布式算法,机器学习研究杂志,16 (2015),第 3299-3340 页。


SM1。附录A:数据划分的选择和判断策略。在本附录中,我们介绍了选择和判断(SAJ)策略的详细实施方式。我们的目标是导出一系列相似基数的子集,其分离半径不小于给定的容差 c0。 SAJ 有两个阶段。