210 чтения

Глубокая нейронная сеть для прогнозирования температуры поверхности моря: краткое содержание и введение

к Oceanography: Everything You Need to Study the Ocean5m2024/05/29

Слишком долго; Читать

В этой статье исследователи улучшают прогнозирование ТПО, перенося физические знания из исторических наблюдений в числовые модели.

featured image - Глубокая нейронная сеть для прогнозирования температуры поверхности моря: краткое содержание и введение

Авторы:

(1) Юйсинь Мэн;

(2) Фэн Гао;

(3) Эрик Ригалл;

(4) Ран Донг;

(5) Джуню Донг;

(6) Цянь Ду.

Таблица ссылок

Абстрактный

Традиционно в океанографических исследованиях использовались численные модели для моделирования динамики океана путем представления физических уравнений. Однако многие факторы, относящиеся к динамике океана, кажутся нечеткими. Мы утверждаем, что перенос физических знаний на основе данных наблюдений может еще больше повысить точность численных моделей при прогнозировании температуры поверхности моря (ТПМ). В последнее время достижения в технологиях наблюдения Земли привели к колоссальному росту данных. Следовательно, крайне важно изучить способы улучшения и дополнения численных моделей с использованием постоянно растущих объемов исторических данных наблюдений. С этой целью мы вводим метод прогнозирования ТПО, который переносит физические знания из исторических наблюдений в числовые модели. В частности, мы используем комбинацию кодера и генеративно-состязательной сети (GAN) для получения физических знаний из наблюдаемых данных. Данные числовой модели затем передаются в предварительно обученную модель для генерации физических данных, которые затем можно использовать для прогнозирования ТПО. Экспериментальные результаты показывают, что предложенный метод значительно повышает эффективность прогнозирования ТПО по сравнению с несколькими современными базовыми моделями.

Индексные термины — температура поверхности моря, физические знания, генеративно-состязательная сеть, численная модель.

ВВЕДЕНИЕ

ЧИСЛЕННЫЕ модели были традиционным методом математических вычислений для прогнозирования динамики океана. Согласно статистике Всемирной программы исследования климата (WCRP), исследовательское сообщество разработало более 40 численных моделей океана, каждая из которых имеет свои преимущества и характеристики. Например, система региональных моделей океана (ROMS) [1] имеет мощный экологический сопряженный модуль, модель быстрой атмосферы океана (FOAM) [2] высокоэффективна в глобальных совместных исследованиях океан-атмосфера, модель прибрежного океана конечного объема (FVCOM) [3] способен точно определить границу береговой линии и топографию подводной лодки. Гибридная координатная модель океана (HYCOM) [4] может реализовать три разновидности самоадаптивных координат. Эти числовые модели не являются взаимозаменяемыми, и их использование зависит от конкретного приложения. Следует отметить, что различные процессы динамики океана, описываемые в численных моделях, основаны на упрощенных уравнениях и

параметры из-за нашего ограниченного понимания океана. Движения и изменения в реальном океане настолько разнообразны и сложны, что выявление источников того или иного явления становится настоящей проблемой. Поэтому поиск новых связей или знаний на основе исторических данных имеет решающее значение для повышения эффективности численных моделей при изучении динамики океана. В этой статье мы ссылаемся на возможности, которые могут улучшить численную модель, как на физические знания. Мы предполагаем, что исторические данные могут содержать физические знания, до сих пор не обнаруженные.

Глубокое обучение обладает замечательной способностью изучать очень сложные функции, преобразуя исходные данные на гораздо более высокий уровень абстракции. В [5] Лекун и др. описал фундаментальные принципы и ключевые преимущества глубокого обучения. В последнее время глубокое обучение применяется для решения различных задач, таких как мониторинг морского биоразнообразия [6], [7], идентификация целей на гидролокационных изображениях [8], [9] и прогнозирование концентрации морского льда [10]. Например, Бермант и др. [6] использовали сверточные нейронные сети (CNN) для классификации спектрограмм, сгенерированных на основе акустических данных кашалота. Аллкен и др. [7] разработали модель CNN для классификации видов рыб, используя синтетические данные для увеличения обучающих данных. Лима и др. [8] предложили метод глубокого трансферного обучения для автоматического распознавания океанского фронта, извлекая знания из глубоких моделей CNN, обученных на исторических данных. Сюй и др. [9] представили подход, сочетающий сети глубокой генерации и трансферное обучение для обнаружения затонувших кораблей с помощью гидролокаторов. Рен и др. [10] предложили систему кодирования-декодера с полностью сверточными сетями, которая может с высокой точностью прогнозировать концентрацию морского льда на неделю вперед. Благодаря применению методов глубокого обучения к исследованию океана были достигнуты значительные улучшения с точки зрения классификации и эффективности прогнозирования.

Из-за неполных физических знаний в численных моделях и слабой способности нейронных сетей к обобщению предпринимаются некоторые попытки улучшить производительность прогнозирования путем объединения преимуществ численной модели и нейронных сетей. В географической науке этого можно достичь тремя разными способами [11]: 1) Изучение параметров числовой модели с помощью нейронных сетей. Нейронные сети могут оптимально описать наблюдаемую сцену на основе подробной модели высокого разрешения, но многие параметры трудно вывести, что усложняет их оценку. Бреновиц и др. [12] обучили глубокую нейронную сеть на основе единой физической параметризации и объяснили влияние радиации и кучевой конвекции. 2) Замена численной модели на нейронную сеть. Таким образом, архитектура глубокой нейронной сети может обеспечить заданную физическую согласованность. Паннекук и др. [13] перевели физические уравнения в архитектуру нейронных сетей с помощью инструмента «подключи и работай». 3) Анализ выходного несоответствия численной модели и данных наблюдений. Нейронные сети можно использовать для выявления, визуализации и понимания закономерностей неточностей модели, а также для динамической коррекции отклонений модели. Патил и др. [14] применили несоответствие между результатами численной модели и данными наблюдений для обучения нейронной сети для прогнозирования температуры поверхности моря (ТПМ). Хэм и др. [15] обучили сверточную нейронную сеть на основе трансферного обучения. Сначала они обучают свою модель на данных числовой модели, а затем используют данные повторного анализа для калибровки модели. Однако было обнаружено, что третий подход страдает от проблемы долгосрочной систематической ошибки, когда эффективность прогнозирования ухудшается по мере увеличения количества дней прогнозирования.

Чтобы решить вышеупомянутые проблемы, в этом исследовании мы используем генеративно-состязательные сети (GAN) для передачи физических знаний из исторических наблюдаемых данных в данные численной модели, как показано на рис. 1. В отличие от традиционной числовой модели, предлагаемая Метод может исправить физическую часть данных численной модели, чтобы улучшить качество прогнозирования. Точнее, как показано на рис. 2, мы сначала получили физическую особенность на основе наблюдаемых данных, используя предыдущую модель сети, состоящую из кодера и GAN. После этого мы получили SST с улучшенными физическими данными, передав данные численной модели в предварительно обученную модель. После этого были приняты улучшенные физические характеристики SST для обучения пространственно-временной модели для прогнозирования SST. Тем временем мы провели эксперименты по абляции, чтобы в полной мере использовать новые полученные данные.

Основной вклад этой статьи состоит из трех частей:

• Насколько нам известно, мы первые, кто перенес физические знания из исторических данных наблюдений в данные численной модели, используя GAN для прогнозирования ТПО.

• Разница между расширенными данными, основанными на физических знаниях, и прогнозируемыми результатами использовалась для корректировки веса модели во время обучения.

• Результаты экспериментов показывают, что предложенный нами метод может покрыть недостаток физических знаний в численной модели и повысить точность прогнозирования.

Оставшаяся часть теста организована следующим образом. В разделе II представлен обзор литературы, связанной с нашим методом, а конструкция нашего метода подробно описана в разделе III. Затем результаты экспериментов представлены в разделе IV. Раздел V завершает эту статью.