paint-brush
Глубокая нейронная сеть для прогнозирования температуры поверхности моря: предысторияк@oceanography
152 чтения

Глубокая нейронная сеть для прогнозирования температуры поверхности моря: предыстория

Слишком долго; Читать

В этой статье исследователи улучшают прогнозирование ТПО, перенося физические знания из исторических наблюдений в числовые модели.
featured image - Глубокая нейронная сеть для прогнозирования температуры поверхности моря: предыстория
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Авторы:

(1) Юйсинь Мэн;

(2) Фэн Гао;

(3) Эрик Ригалл;

(4) Ран Донг;

(5) Джуню Донг;

(6) Цянь Ду.

Таблица ссылок

II. ФОН

А. Генеративно-состязательная сеть


В 2014 году Гудфеллоу и др. [16] предложили новую структуру генеративной модели, обучаемой состязательным способом. В их методе генеративная модель G и дискриминативная модель D обучались одновременно. Модель G применялась для косвенного определения распределения входных данных через модель D и создания аналогичных данных. В то время как модель D оценивает вероятность того, что ее входные выборки были получены из обучающих данных, а не из модели G. Процесс обучения G определялся вероятностными ошибками D. В этом состязательном процессе G и D направляют обучение и постепенно усиливают способности друг друга. для достижения выдающихся результатов.


GAN применялись в физических задачах. Например, Ян и др. [17] применили основанные на физике GAN для решения задач большой размерности и решили стохастические дифференциальные уравнения, Lutjens ¨ et al. [18] получили более реалистичные данные о прибрежных наводнениях, используя GAN для изучения особенностей данных численной модели, Zheng et al. [19] вывели неизвестные пространственные данные с потенциальным физическим законом, который изучается GAN. Однако в этих работах их модель была реализована с использованием GAN для замены всей числовой модели, что сильно отличается от нашей работы. В этой статье мы используем модель GAN для переноса физических знаний из наблюдаемых данных в данные числовой модели, чтобы исправить и улучшить физические характеристики численной модели. Кроме того, существующие методы изучают только детерминированную модель, не учитывая, соответствует ли код, сгенерированный кодировщиком, семантическим знаниям, полученным GAN.


Б. Сверточная долговременная краткосрочная память


В 2015 году ConvLSTM [20] было предложено для решения текущего прогноза осадков. Сетевая структура ConvLSTM способна захватывать локальные пространственные особенности, как в классических сверточных нейронных сетях (CNN) [21], при этом создавая последовательные отношения, унаследованные от блоков долгосрочной краткосрочной памяти (LSTM). Более того, авторы провели эксперименты, чтобы показать, что ConvLSTM работает лучше, чем LSTM, в пространственно-временных отношениях. Помимо задач прогнозирования погоды, ConvLSTM может применяться для различных задач пространственно-временного последовательного прогнозирования, например, распознавания действий [22], [23].


C. Прогноз температуры поверхности моря


Линс и др. [24] исследовали ТПО в тропической Атлантике с помощью SVM. Патил и др. [25] применили искусственную нейронную сеть для прогнозирования температуры поверхности моря. Он хорошо работает только в случае прогнозирования с заблаговременностью от 1 до 5 дней, а затем точность снижается. Чжан и др. [26] применили LSTM к


Рис. 2. Иллюстрация предлагаемого метода прогнозирования ТПО. Он состоит из двух этапов: предварительного обучения сети и прогнозирования SST с использованием расширенных данных. На первом этапе предыдущая сеть обучается генерированию SST с улучшенной физикой. На втором этапе SST с улучшенной физикой используется для прогнозирования SST с помощью ConvLSTM.


прогнозировать ССТ. Ян и др. [27] предсказали SST, построив полностью связанную модель LSTM. С другой точки зрения, Patil et al. [28] использовали вейвлет-нейронную сеть для прогнозирования ежедневного ТПО, а Quala et al. [29] предложили метод нейронной сети на уровне патчей для прогнозирования SST. Однако эти методы полагаются только на данные и игнорируют лежащие в их основе физические знания. Хэм и др. [15] применили трансферное обучение для прогнозирования ЭНСО и их классификации. В этой работе мы проводим сравнительные эксперименты, и результаты показывают, что наш метод уменьшает краткосрочные ошибки, а также долгосрочную погрешность.


D. Увеличение данных


Шортен и др. [30] рассмотрели новейшие методы увеличения данных изображений для глубокого обучения. Целью увеличения данных является улучшение возможностей представления нейронных сетей и лучшее изучение распределения исходных данных. В последние годы широко используются два типа методов увеличения данных: преобразование данных и повторная выборка. Подход к преобразованию данных включает геометрическое преобразование [31], преобразование цветового пространства [32]–[34], случайное стирание [35]–[37], состязательное обучение [38]–[41] и перенос стиля [42]–[45]. ]. В методе повторной выборки особое внимание уделяется композиции новых экземпляров, такой как смешивание изображений [46]–[48], улучшение пространства признаков [49], [50] и генеративно-состязательная сеть (GAN) [16]. Геометрические преобразования могут обеспечить хорошую производительность, например, переворот изображения, обрезка, вращение, перемещение и введение шума [51]. Результаты экспериментов в [30] показали, что метод случайной обрезки работает хорошо. Преобразование цветового пространства требует большого потребления памяти и длительного времени вычислений. Методы случайного стирания могут повысить надежность сети в случаях окклюзии за счет использования масок. Хотя состязательное обучение также может повысить надежность, конечное число естественных состязательных выборок в значительной степени ограничивает производительность сети на практике. Подход нейронного переноса стиля эффективен только для конкретных задач, тогда как его практическое применение ограничено. Расширение пространства признаков реализует возможность интерполяции представлений в пространстве признаков. Методы расширения на основе GAN были применены для достижения современной производительности сети [52]. Однако не существует эффективного метода увеличения данных, который мог бы использовать преимущества числовой модели и глубокого обучения. В этой статье мы стремимся предложить новый метод улучшения данных, основанный на физических знаниях. Предложенный метод обеспечивает лучшую производительность, чем расширение на основе GAN.


Этот документ доступен на arxiv под лицензией CC 4.0.