Авторы:
(1) Юйсинь Мэн;
(2) Фэн Гао;
(3) Эрик Ригалл;
(4) Ран Донг;
(5) Джуню Донг;
(6) Цянь Ду.
A. Зона исследования и условия проведения эксперимента
Южно-Китайское море расположено в западной части Тихого океана, на юге материкового Китая. Его площадь составляет около 3,5 миллионов квадратных километров при средней глубине 1212 метров. В данной статье выбрана область исследования (3,99° с.ш. ~ 24,78° с.ш., 98,4° в.д. ~ 124,4° в.д.).
В качестве данных наблюдений мы используем данные спутникового дистанционного зондирования высокого разрешения от GHRSST (Группы по температуре поверхности моря с высоким разрешением) [55]. GHRSST предоставляет различные данные о температуре морской поверхности, включая координаты спутниковой полосы обзора, данные с координатной сеткой и продукты с координатной сеткой без пробелов. Здесь мы использовали продукты с сеткой без пробелов, которые генерируются путем объединения дополнительных спутниковых и натурных наблюдений в рамках оптимальной интерполяции. В качестве численной модели выбран HYCOM [56]. Их пространственное разрешение составляет 1/20°×1/20° и 1/12°×1/12° соответственно. Временное разрешение составляет один день. Данные с мая 2007 г. по декабрь 2013 г. используются для обучения, а остальные данные с января 2014 г. по декабрь 2014 г. используются для тестирования. Следует отметить, что мы используем безоблачные данные, предоставленные GHRSST. Данные были получены с помощью микроволновых приборов, которые могут проникать сквозь облака. Таким образом, данные полностью охватывают исследуемую территорию. Кроме того, точное время каждого пикселя в продукте GHRSST SST одинаково.
Стандартизация Z-показателя использовалась для предварительной обработки как:
где x обозначает SST модели GHRSST и HYCOM, z обозначает нормализованные данные, µ и σ обозначают среднее значение и стандартное отклонение соответственно. Мы преобразовали данные в квадратные тепловые карты размером 256 × 256.
Более конкретно, данные GHRSST и 512-мерный случайный вектор используются на первом этапе предварительного обучения сети. Размер входных данных GHRSST составляет N × H × W, где N представляет размер пакета, H указывает высоту входных данных, а W обозначает ширину входных данных. На втором этапе предыдущей сети мы используем данные GHRSST только для обучения кодировщиков. Размеры входных и выходных данных для обоих этапов составляют N × H × W. Аналогично, на третьем этапе предварительного обучения сети данные HYCOM SST передаются в предварительно обученную модель. Здесь размеры входов и выходов составляют N × H × W. В наших реализациях мы устанавливаем N равным 2430, а H и W — равными 256.
Мы провели обширные эксперименты на NVIDIA GeForce 2080Ti с 8 графическими процессорами. Предыдущая сеть использует ту же сетевую структуру и конфигурацию, что и упомянутые в [53], для получения физических знаний из исторических наблюдаемых данных. Затем полученные физические знания переносятся в данные численной модели с целью восстановления и улучшения неверных компонентов в численной модели. Конфигурация модели ConvLSTM, используемая в этой статье, такая же, как и модель ConvLSTM в работе Ши [20]. Набор данных GHRSST SST используется в качестве эталона для сравнения и оценки в этой статье.
B. Влияние числа прошедших дней на прогноз SST
Как упоминалось в разделе III. C, t обозначает количество прошлых дней, используемых для прогнозирования. Это критический параметр, который может повлиять на эффективность прогнозирования ТПО. В этой статье мы пытаемся предсказать следующую однодневную, трехдневную и семидневную ТПО. Мы провели обширные эксперименты, чтобы найти
правильное количество прошлых дней для будущего прогноза SST. В качестве критериев оценки применяются среднеквадратическая ошибка (RMSE) и коэффициент детерминации (R2). Более низкие значения RMSE и более высокие значения R2 указывают на более точные результаты.
В таблице I приведены результаты прогнозирования на следующий день с использованием данных за прошедший один день, три дня и пять дней отдельно. Можно заметить, что предложенная модель работает лучше всего при использовании данных за последние пять дней, где результаты RMSE и R2 составляют 0,3618 и 0,9967 соответственно. Они немного лучше других схем. По сравнению с двумя другими схемами значения RMSE и R2 улучшаются на 0,0086, 0,001 и 0,0028, 0,0006. Следовательно, данные за последние пять дней принимаются для следующего однодневного прогноза ТПО.
Мы анализируем влияние t для следующего трехдневного прогноза ТПО в Таблице II. Видно, что чем дольше использовались исторические данные, тем выше была эффективность прогнозирования. Значение RMSE, основанное на данных за последние семь дней, дает наилучшие результаты. Он улучшен на 0,0025 по сравнению с данными за последние пять дней. Между тем, R2 работает лучше всего, используя данные за последние семь дней, по сравнению с двумя другими схемами. Поэтому данные за последние семь дней были использованы для следующего трехдневного прогноза ТПО.
Экспериментальные результаты следующего семидневного прогноза ТПО проиллюстрированы в Таблице III. Как видно, результаты прогнозирования с использованием данных за последние десять дней достигают наилучшей производительности. Поэтому мы используем данные за последние десять дней для следующего семидневного прогноза ТПО.
C. Исследование абляции
Чтобы проверить эффективность предыдущего обучения сети и GAN, мы проводим эксперименты по абляции. Как показано на рис. 3, два варианта предназначены для сравнения следующим образом:
• Схема А. Заменяется последовательность предыдущей сети и ConvLSTM. Данные численной модели SST сначала подаются в ConvLSTM, а затем выходные данные подаются в хорошо обученную априорную сеть.
• Схема Б. Предыдущая сеть не была хорошо обучена. В частности, обучение модели GAN (первый шаг на рис. 2) при предыдущем обучении сети было опущено.
Результаты эксперимента показаны в Таблице IV. Как видно, наш метод обеспечивает наилучшие значения RMSE и R2. В частности, предлагаемый метод превосходит схему A, которая демонстрирует, что правильная последовательность предшествующей сети и ConvLSTM может повысить производительность прогнозирования SST. Очевидно, что предыдущая сеть эффективно восстанавливает неправильные компоненты данных числовой модели, а восстановленные данные лучше работают при прогнозировании ТПО. Кроме того, предлагаемый метод имеет превосходящую производительность по сравнению со схемой B, что демонстрирует, что моделирование GAN является важным шагом. Моделирование GAN позволяет изучить распределение данных наблюдаемого ТПО и помогает предшествующей сети лучше захватывать физическую информацию о наблюдаемом ТПО. Подводя итог, в предлагаемом методе мы используем состязательное обучение для предварительного предварительного обучения сети, которое может эффективно передавать физические знания из наблюдаемых данных SST в предыдущую сеть. Это может способствовать быстрой сходимости обучения и повышению эффективности прогнозирования SST.
D. Экспериментальные результаты и обсуждение.
На рис. 4 сравнивается прогнозируемая следующая однодневная ТПО с наблюдаемыми наземными данными. Мы видим, что предсказанные результаты нашего метода хорошо совпадают с наблюдаемыми данными. Аналогично, наблюденные данные и соответствующая прогнозируемая ТПО на следующие три дня и семь дней отображены на рис. 5 и рис. 6 соответственно. Визуализированные результаты показывают, что предлагаемый метод может генерировать устойчивые и надежные результаты для прогнозирования ТПМ.
Диаграмма рассеяния прогноза ТПМ на следующий день показана на рис. 7. Можно заметить, что точки данных
примерно равномерно распределены вблизи красной линии. На рис. 8 и рис. 9 представлены диаграммы разброса результатов прогноза на следующие три дня и следующие семь дней соответственно. Диаграммы рассеяния демонстрируют эффективность предложенного метода прогнозирования ТПМ.
Чтобы проверить эффективность предлагаемого метода, мы сравниваем предлагаемый метод с семью близкородственными методами: ConvLSTM [20], Hybrid-NN [14], Hybrid-TL [15], Gen-END [57], VAE- GAN [58], Tra-NM и Tra-ASL. Район исследования для этих методов составляет (3,99° с.ш. ~ 24,78° с.ш., 98,4° в.д. ~ 124,4° в.д.). Все эти методы использовали данные обучения за последние 5 дней для следующего 1-дневного прогноза, данные за последние 7 дней для следующего 3-дневного прогноза и данные за последние 10 дней для следующего 7-дневного прогноза. прогноз.
ConvLSTM обсуждается в разделе III. C, и это эффективная пространственно-временная модель для прогнозирования ТПМ. HybridNN использует несоответствие между наблюдаемыми данными и данными числовой модели для управления обучением глубоких нейронных сетей. Hybrid-TL сочетает в себе преимущества численных моделей и нейронных сетей посредством трансферного обучения. GenEND — это генеративный кодер, который можно использовать для прогнозирования SST. VAE-GAN объединяет вариационный автоэнкодер и
GAN, и он может захватывать семантические функции высокого уровня для прогнозирования SST. Данные HYCOM SST используются для обучения модели ConvLSTM для следующего прогноза на 1, 3 и 7 дней (называемого Tra-NM). Tra-ASL — это традиционный метод ассимиляции, в котором используются корреляции между несколькими типами данных (наблюденные данные и данные численной модели).
Данные GHRSST сначала используются для обучения модели ConvLSTM, которая служит базовой линией. Это широко используемый подход к прогнозированию ТПО на основе данных. Hybrid-NN, HybridTL, Gen-END и VAE-GAN используют для обучения данные GHRSST и HYCOM. Данные ассимиляции HYCOM [56]
здесь используются с пространственным разрешением 1/12°×1/12°. Наш метод улучшает и исправляет неверные компоненты в данных численной модели, вводя физические знания из исторических наблюдаемых данных. Скорректированные данные численной модели называются данными с улучшенной физикой. Для сравнения с физическими данными для обучения модели ConvLSTM аналогичным образом используются данные ассимиляции HYCOM (Tra-ASL) и данные HYCOM (Tra-NM).
Время обучения ConvLSTM, Hybrid-NN, Tra-NM и Tra-ASL для следующих 1-дневных, 3-дневных и 7-дневных прогнозов составляет 1,8, 4,4 и 8,2 часа соответственно. Метод Hybrid-TL обучал модель ConvLSTM дважды, продолжительность обучения для трех задач составила 3,6, 8,8 и 16,4 часа соответственно. Для обучения VAE-GAN требуется 181,6, 184,2 и 188,4 часа, тогда как для метода Gen-END требуется почти такое же количество времени: 196,8, 199,3 и 203,2 часа для трех задач прогнозирования ТПО соответственно.
Результаты последующего прогноза ТПО на 1, 3 и 7 дней представлены в таблице V. Видно, что метод TraNM дает неудовлетворительные результаты по сравнению с другими методами. Вероятно, это связано с неправильными компонентами в данных HYCOM, которые отрицательно влияют на качество прогнозирования ТПО. Метод Hybrid-NN также работает плохо, поскольку его средние значения RMSE являются вторыми по величине среди моделей. Модель Hybrid-TL работает лучше, чем ConvLSTM, для следующего однодневного прогноза ТПО, но не для двух других задач. Наш метод обеспечивает наилучшие значения RMSE и самые высокие значения R2. По сравнению с моделью ConvLSTM средние значения RMSE нашего метода значительно улучшены. Это показывает, что введение физических знаний
на основе наблюдаемых данных можно восстановить неверные компоненты в данных численной модели, тем самым повышая точность прогнозирования ТПО.
На рис. 10 представлены визуализированные результаты очередного однодневного прогноза ТПО, наблюдаемые данные ТПО и их различия соответственно. Видно, что прогнозируемые результаты очень похожи на наблюдаемые данные ТПО во всем регионе Южно-Китайского моря. На рис. 11 показаны визуализированные результаты для следующего трехдневного прогноза ТПО. Замечено, что существуют значительные различия значений в Тонкинском заливе и в других окраинных районах Южно-Китайского моря. На рис. 12 показаны визуализированные результаты следующего семидневного прогноза ТПО. Обнаружено, что основные значения различий в основном сосредоточены на Тонкинском заливе для следующего семидневного прогноза и превышают результаты для двух других задач.
E. Ограничения и обсуждение
На рисунках 7–9 можно заметить, что существуют некоторые неточности в ТПО среднего диапазона, которые визуализируются на рис. 13. Яркие пиксели указывают на большие ошибки прогнозирования ТПО, тогда как темные пиксели обозначают точные прогнозы ТПО. Как видно, эти точки расположены в основном в северо-западной части Тайваньского пролива, где прогнозируемая температура поверхности моря ниже наблюденных данных. Ошибка прогноза в основном вызвана моделью ConvLSTM и маской суши. В наших реализациях маска земли применяется к исследуемой области. ConvLSTM использует пространственные и временные особенности всей исследуемой территории. На особенности северо-западной части Тайваньского пролива в некоторой степени влияет маска суши, что приводит к ошибкам прогнозирования. Если бы можно было получить обучающие данные с более высоким разрешением, точность прогнозов в этом регионе была бы еще выше.
На рис. 11 и 12 видно, что существенного увеличения ошибок с опережением дня не наблюдается. Это может быть связано с тем, что наш метод использует достаточное количество обучающих данных, а глубокие нейронные сети способны эффективно улавливать временные особенности. Кроме того, сохранение SST также является важным фактором.
Этот документ доступен на arxiv под лицензией CC 4.0.