paint-brush
Глубокая нейронная сеть для прогнозирования температуры поверхности моря: предлагаемый методк@oceanography
163 чтения

Глубокая нейронная сеть для прогнозирования температуры поверхности моря: предлагаемый метод

Слишком долго; Читать

В этой статье исследователи улучшают прогнозирование ТПО, перенося физические знания из исторических наблюдений в числовые модели.
featured image - Глубокая нейронная сеть для прогнозирования температуры поверхности моря: предлагаемый метод
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Авторы:

(1) Юйсинь Мэн;

(2) Фэн Гао;

(3) Эрик Ригалл;

(4) Ран Донг;

(5) Джуню Донг;

(6) Цянь Ду.

Таблица ссылок

III. ПРЕДЛАГАЕМЫЙ МЕТОД

Численная модель может вместе предсказать пространственное распределение SST и его глобальных телекоммуникационных соединений. Он хорошо работает при коротких упреждениях для прогнозирования SST. Тем не менее, мы утверждаем, что перенос физических знаний из наблюдаемых данных может еще больше улучшить производительность численной модели для прогнозирования ТПО. С этой целью мы используем GAN для изучения физических знаний в наблюдаемых данных.


Чжу и др. [53] предложили метод инверсии GAN, который не только точно восстанавливает входные данные, но и гарантирует, что инвертированный латентный код является семантически значимым. Они продемонстрировали, что изучения только значений пикселей целевого изображения недостаточно и что изученные функции не могут представить изображение на семантическом уровне. Вдохновленные этой работой, мы разрабатываем кодировщик в GAN для изучения физических знаний на основе наблюдаемых данных, называемый предшествующей сетью. Эта предыдущая сеть не только изучает значения пикселей целевых наблюдаемых данных, но также собирает физическую информацию. Это эффективно повышает точность прогнозирования ТПО.


Далее мы представляем предлагаемый метод следующим образом: 1) Обзор метода, 2) Априорная сеть, 3) Прогноз ТПО с расширенными данными.


А. Обзор метода


В этом подразделе мы суммируем предлагаемый метод прогнозирования ТПМ и подробно описываем входные и выходные данные каждого этапа. Как показано на рисунке 2, предлагаемый метод прогнозирования SST состоит из двух этапов: предварительного обучения сети и прогнозирования SST с расширенными данными.


1) Предварительное обучение сети. Этот этап состоит из трех шагов. На первом этапе наблюдаемое SST (данные GHRST) используется для обучения модели GAN. На втором этапе предварительно обученный генератор и данные GHRSST используются для обучения кодировщика. На третьем этапе предварительно обученный генератор и кодер объединяются в предыдущую сеть. Предыдущая сеть используется для передачи физических знаний из наблюдаемых данных в числовую модель. Числовая модель SST (данные HYCOM) затем передается в предыдущую сеть для улучшения представления ее объектов.


2) Прогноз ТПО с расширенными данными. Данные, дополненные физическими данными, передаются в модель ConvLSTM для прогнозирования ТПО. SST следующего дня, следующих 3 дней и следующих 7 дней прогнозируется отдельно.


Следует отметить, что большинство существующих работ [26] [27] используют данные наблюдений только для обучения ConvLSTM. Напротив, наш метод использует данные с улучшенной физикой для обучения ConvLSTM. Далее мы подробно опишем предварительное обучение сети и прогнозирование SST с использованием расширенных данных.


B. Этап 1: Предварительное обучение сети


Мы создаем априорную сеть для изучения физических знаний в наблюдаемых данных и сохраняем ее семантическую/физическую информацию постоянной после обучения. Как показано на рис. 2, предварительное обучение сети состоит из трех этапов: обучение модели GAN, обучение кодировщика и генерация данных с учетом физики. Далее мы предоставим подробное описание каждого шага.


Обучение модели GAN. Модель GAN используется для изучения распределения данных по наблюдаемым ТПО. Целевая функция выглядит следующим образом:



Процесс обучения модели GAN обобщен в алгоритме 1. Мы обучаем модель по наблюдаемому SST до тех пор, пока генератор G не захватит физические характеристики из наблюдаемых данных SST.



где F(·) представляет собой извлечение признаков через сеть VGG. Сеть VGG означает сеть, предложенную Visual Geometry Group [54], и это классическая глубокая сверточная нейронная сеть.


Обучение кодировщика описано в алгоритме 2. Параметры генератора G фиксированы, а параметры кодера E и дискриминатора D обновляются на основе уравнения. 2 и уравнение. 3 соответственно.


Мотивацией этапа 1 является построение априорной сети, которая сможет исправить неправильные компоненты в данных числовой модели. С этой целью мы сначала разрабатываем модель GAN, которая фиксирует распределение данных наблюдаемого ТПО и может генерировать высококачественные данные ТПО. Впоследствии кодер обучается гарантировать, что сгенерированные скрытые коды сохраняют семантическую/физическую информацию в наблюдаемом SST. Мы утверждаем, что посредством состязательного обучения предыдущая сеть (состоящая из кодера и генератора) может исправить неверные части входных данных, поскольку физические знания были встроены в предшествующую сеть. Следовательно, на третьем этапе, когда данные числовой модели подаются в предыдущую сеть, встроенные физические знания могут исправить неверные компоненты в данных числовой модели.




C. Этап 2: Прогноз ТПО с использованием расширенных данных


ConvLSTM — эффективный инструмент для прогнозирования пространственно-временных данных. Это рекуррентная нейронная сеть, которая включает в себя сверточные блоки как при переходах от входа к состоянию, так и при переходах между состояниями. В отличие от традиционного уровня LSTM, ConvLSTM не только сохраняет последовательные отношения, но и извлекает из данных пространственные объекты. Таким образом, мы можем использовать его для получения надежных пространственно-временных характеристик. Целевая функция ConvLSTM формулируется следующим образом:



Данные ТПО, дополненные физическими данными, передаются в модель ConvLSTM для прогнозирования ТПО следующим образом:



Веса, полученные генератором, повторно используются в алгоритме 2, где фиксированы только веса генератора. Введенный кодер и дискриминатор проходят еще один процесс обучения по наблюдаемому SST. Их веса обновляются на основе уравнения. 2 и уравнение. 3 соответственно. После обучения код, сгенерированный кодировщиком, будет воплощать изученные физические знания.


Наконец, мы получаем данные, подкрепленные физическими знаниями, используя предварительно обученную выше модель. Веса



генератор и кодер из алгоритма 2 используются повторно, а численная модель SST используется для создания данных числовой модели, подкрепленных физикой.


В алгоритме 3 данные, дополненные физическими знаниями, используются для обучения пространственно-временной модели ConvLSTM для прогнозирования ТПО. В этой статье ТПО следующего дня, следующих 3 дней и следующих 7 дней прогнозируется отдельно. В этой части мы провели исследование абляции, чтобы эффективно использовать усиленные данные.


Этот документ доступен на arxiv под лицензией CC 4.0.