Авторы:
(1) Ша-Бо Линь, Центр интеллектуального принятия решений и машинного обучения, Школа менеджмента, Сианьский университет Цзяотун;
(2) Синпин Сунь, факультет математики, Университет штата Миссури;
(3) Ди Ван, §Центр интеллектуального принятия решений и машинного обучения, Школа менеджмента, Сианьский университет Цзяотун.
Аннотация и введение
Отношение неопределенностей ядерной интерполяции на сферах
Распределенная интерполяция ядра
Различия операторов через правила квадратур
Доказательства
Численные проверки
Рекомендации
Для интерполяции разбросанных данных ядром радиальной базисной функции (RBF) Шабак [30] в 1995 году доказал, что достижимая ошибка аппроксимации и число обусловленности базовой матрицы интерполяции не могут быть одновременно уменьшены. Он назвал этот вывод «отношением неопределенности», нежелательным следствием которого является то, что интерполяция ядра RBF чувствительна к зашумленным данным. В этой статье мы предлагаем и изучаем метод распределенной интерполяции для управления и количественной оценки неопределенности, вызванной интерполяцией зашумленных сферических данных значительной величины. Мы также представляем результаты численного моделирования, показывающие, что наш метод практичен и надежен с точки зрения обработки зашумленных данных из сложных вычислительных сред.
Ключевые слова. Интерполяция ядра, смягчение распределенной неопределенности, разбросанные сферические данные
Следствие 2.2 показывает, что интерполяция ядра работает плохо при работе с зашумленными данными значительной величины. Чтобы преодолеть этот серьезный недостаток, мы предлагаем и изучаем в этом разделе метод интерполяции распределенного ядра (DKI), который мотивирован «распределенным обучением» в литературе [37, 19]. Образно говоря, это стратегия «разделяй и властвуй» для количественной оценки неопределенности. Чтобы уточнить, мы опишем метод в три этапа.
В этом разделе мы сначала кратко излагаем интегрально-операторный подход, начатый в [8], а затем получаем точные верхние оценки для разностей интересующих нас операторов, получая в качестве побочного продукта определенный тип неравенств Соболева [12]. Основные моменты этого раздела включают предложение 4.5) и лемму 4.8.
В этом разделе проводятся четыре моделирования для проверки превосходной производительности DKI. Первый показывает, что DKI удается обойти неопределенность интерполяции ядра. Второй демонстрирует роль m в DKI. Третий фокусируется на роли стратегии подразделения в DKI. Последний сравнивает DKI с несколькими популярными схемами подбора сферических данных, включая распределенную фильтрованную гиперинтерполяцию (DFH) [21], эскизирование с помощью s∗-дизайнов [20] и распределенную регрессию гребня ядра (DKRR) [8].
Моделирование 2: В этом моделировании мы показываем роль параметра m в DKI. Мы генерируем 10014 обучающих выборок (со 141 дизайном в качестве входных данных). Число делений m варьируется в пределах {5, 10, · · · , 200}. На рисунке 6.2 показана связь между RMSE DKI и количеством локальных машин при разных уровнях гауссовского шума при условии, что задано общее количество обучающих выборок. Из рисунка 6.2 мы можем сделать следующие выводы: 1) Для обучающих выборок с более высоким уровнем шума среднеквадратическое отклонение тестирования обычно сначала уменьшается, а затем медленно увеличивается по мере увеличения количества локальных машин. Умеренные значения m более способствуют хорошей аппроксимации DKI. Причина в том, что слишком маленькое значение m не решает проблему неопределенности при интерполяции ядра; слишком большое m увеличивает ошибку аппроксимации, что приводит к несколько худшему качеству обобщения. 2) Оптимальное число m с наименьшим среднеквадратическим отклонением растет с увеличением гауссовского шума. Это подтверждает уравнение (3.3) теоремы 3.2, в котором ошибка аппроксимации в первую очередь связана с ошибкой выборки при большом шуме (т. е. при большом M) и может быть уменьшена с помощью большого m.
[1] Р. Бхатия, Матричный анализ, том. 169, Springer Science & Business Media, 2013.
[2] Дж. С. Браухарт и К. Гессе, Численное интегрирование по сферам произвольной размерности, Конструктивное приближение, 25 (2007), стр. 41–71.
[3] Г. Браун и Ф. Дай, Приближение гладких функций на компактных двухточечных однородных пространствах, Журнал функционального анализа, 220 (2005), стр. 401–423.
[4] А. Черных, И. Х. Слоан и Р. С. Уомерсли, Функции Вендланда с увеличением гладкости сходятся к гауссиане, Успехи в вычислительной математике, 40 (2014), стр. 185–200.
[5] Ф. Дай, Многомерные полиномиальные неравенства относительно удвоения весов и весов a∞, Журнал функционального анализа, 235 (2006), стр. 137–170.
[6] Ф. Дай, Об обобщенной гиперинтерполяции на сфере, Труды Американского математического общества, 134 (2006), стр. 2931–2941.
[7] Х. В. Энгл, М. Ханке и А. Нойбауэр, Регуляризация обратных задач, т. 1, с. 375, Springer Science & Business Media, 1996.
[8] Х. Фэн, С.-Б. Лин и Д.-Х. Чжоу, Приближение радиальной базисной функции с распределенно хранимыми данными о сферах, arXiv:2112.02499, (2021).
[9] Т. Хангельбрук, Ф. Дж. Наркович, X. Сан и Дж. Д. Уорд, Ядерная аппроксимация на многообразиях ii: норма l∞ проектора l2, SIAM Journal on Mathematical Analysis, 43 (2011), стр. 662–684.
[10] Т. Хангельбрук, Ф. Дж. Наркович и Дж. Д. Уорд, Ядерная аппроксимация на многообразиях i: ограничение константы Лебега, SIAM Journal on Mathematical Analysis, 42 (2010), стр. 1732–1760.
[11] К. Гессе, И. Х. Слоан и Р. С. Уомерсли, Приближение радиальной базисной функции зашумленных рассеянных данных на сфере, Numerische Mathematik, 137 (2017), стр. 579–605.
[12] К. Гессе, И.Х. Слоан и Р.С. Уомерсли, Локальная аппроксимация методом наименьших квадратов со штрафом на основе rbf на сфере с зашумленными разбросанными данными, Журнал вычислительной и прикладной математики, 382 (2021), с. 113061.
[13] С. Хабберт, К. Т. Ле Гиа и Т. М. Мортон, Сферические радиальные базисные функции, теория и приложения, Springer, 2015.
[14] М. А. Кинг, Р. Дж. Бингэм, П. Мур, П. Л. Уайтхаус, М. Дж. Бентли и Г. А. Милн, Нижние спутниковые гравиметрические оценки вклада уровня антарктического моря, Nature, 491 (2012), стр. 586–589.
[15] К. Т. Ле Гиа, Ф. Дж. Наркович, Дж. Д. Уорд и Х. Вендланд, Непрерывная и дискретная аппроксимация методом наименьших квадратов радиальными базисными функциями на сферах, Журнал теории приближения, 143 (2006), стр. 124–133.
[16] П. Леопарди, Разделение единичной сферы на области равной площади и малого диаметра, Электронные транзакции по численному анализу, 25 (2006), стр. 309–327.
[17] Дж. Левсли, З. Луо и X. Сан, Нормальные оценки интерполяционных матриц и их обратных, связанных со строго положительно определенными функциями, Труды Американского математического общества, (1999), стр. 2127–2134.
[18] С.-Б. Лин, К. Чанг и К. Сан, Интерполяция ядра многомерных разбросанных данных, препринт arXiv arXiv:2009.01514, (2020).
[19] С.-Б. Линь, С. Го и Д.-Х. Чжоу, Распределенное обучение с регуляризованным методом наименьших квадратов, Журнал исследований машинного обучения, 18 (2017), стр. 3202–3232.
[20] С.-Б. Линь, Д. Ван и Д.-Х. Чжоу, Зарисовки сферических изображений на сферах, SIAM Journal on Scientific Computing, в печати (2023 г.).
[21] С.-Б. Линь, Ю.Г. Ван и Д.-Х. Чжоу, Распределенная гиперинтерполяция с фильтрацией для зашумленных данных о сфере, SIAM Journal on Numerical Analysis, 59 (2021), стр. 634–659.
[22] Дж. Д. МакИвен и Ю. Вио, Новая теорема выборки в сфере, IEEE Transactions on Signal Processing, 59 (2011), стр. 5876–5887.
[23] Х. Мхаскар, Ф. Наркович и Дж. Уорд, Сферические неравенства Марцинкевича-Зигмунда и положительная квадратура, Математика вычислений, 70 (2001), стр. 1113–1130.
[24] Х. Н. Мхаскар, Взвешенные квадратурные формулы и аппроксимация сетями зональных функций на сфере, Journal of Complexity, 22 (2006), стр. 348–370.
[25] К. Мюллер ¨, Сферические гармоники, т. 1, с. 17, Спрингер, 1966.
[26] Ф. Дж. Наркович, Н. Сивакумар и Дж. Д. Уорд, Результаты устойчивости для интерполяции рассеянных данных на евклидовых сферах, Успехи в вычислительной математике, 8 (1998), стр. 137–163.
[27] Ф. Дж. Наркович, К. Сан, Дж. Д. Уорд и Х. Вендланд, Прямые и обратные оценки ошибок Соболева для интерполяции разбросанных данных с помощью сферических базисных функций, Основы вычислительной математики, 7 (2007), стр. 369–390.
[28] Ф. Дж. Наркович и Дж. Д. Уорд, Интерполяция разбросанных данных по сферам: оценки ошибок и локально поддерживаемые базисные функции, SIAM Journal on Mathematical Analysis, 33 (2002), стр. 1393–1410.
[29] А. Руди, Р. Камориано и Л. Росаско, «Меньше значит больше: вычислительная регуляризация Нистрема», в NIPS, 2015, стр. 1657–1665.
[30] Р. Шабак, Оценки ошибок и числа обусловленности для интерполяции радиальной базисной функции, Успехи в вычислительной математике, 3 (1995), стр. 251–264.
[31] С. Смейл и Д.-Х. Чжоу, Выборка Шеннона и реконструкция функций по точечным значениям, Бюллетень Американского математического общества, 41 (2004), стр. 279–305.
[32] С. Смейл и Д.-Х. Чжоу, Выборка Шеннона II: Связь с теорией обучения, Прикладной и вычислительный гармонический анализ, 19 (2005), стр. 285–302.
[33] Ю.-Т. Цай и З.-Ц. Ши, Предварительно вычисленная передача излучения на всех частотах с использованием сферических радиальных базисных функций и аппроксимации кластерных тензоров, ACM Transactions on Graphics (TOG), 25 (2006), стр. 967–976.
[34] Х. Вендланд, Аппроксимация рассеянных данных, том. 17, издательство Кембриджского университета, 2004.
[35] М. А. Вечорек и Р. Дж. Филлипс, Потенциальные аномалии на сфере: Применение к толщине лунной коры, Журнал геофизических исследований: Планеты, 103 (1998), стр. 1715–1724.
[36] Р.С. Уомерсли, Эффективные сферические конструкции с хорошими геометрическими свойствами, в журнале «Современная вычислительная математика: празднование 80-летия Яна Слоана», Springer, 2018, стр. 1243–1285.
[37] Ю. Чжан, Дж. Дучи и М. Уэйнрайт, Регрессия гребня ядра «разделяй и властвуй»: распределенный алгоритм с минимаксными оптимальными показателями, Журнал исследований машинного обучения, 16 (2015), стр. 3299–3340.
СМ1. Приложение A: Стратегия выбора и оценки для отдела данных. В этом приложении мы представляем подробную реализацию стратегии выбора и оценки (SAJ). Наша цель — получить серию подмножеств одинаковой мощности с радиусом разделения не меньшим заданного допуска c0. SAJ состоит из двух этапов.
Этот документ доступен на arxiv под лицензией CC0 1.0 DEED.