paint-brush
해수면 온도 예측을 위한 심층신경망: 실험 결과 및 분석~에 의해@oceanography
202 판독값

해수면 온도 예측을 위한 심층신경망: 실험 결과 및 분석

너무 오래; 읽다

본 논문에서 연구자들은 역사적 관측의 물리적 지식을 수치 모델로 전환하여 SST 예측을 향상시킵니다.
featured image - 해수면 온도 예측을 위한 심층신경망: 실험 결과 및 분석
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

저자:

(1) 멍 위신;

(2) 펑 가오;

(3) 에릭 리갈;

(4) 란동;

(5) 준유동;

(6) 키안 두.

링크 표

IV. 실험 결과 및 분석

가. 연구영역 및 실험환경


남중국해는 중국 본토 남부의 서태평양에 위치하고 있습니다. 면적은 약 350만 평방킬로미터, 평균 깊이는 1,212미터이다. 본 논문에서 선정된 연구지역은 (3.99°N∼24.78°N, 98.4°E∼124.4°E)이다.


관측자료로는 GHRSST(고해상도 해수면 온도 그룹)[55]의 고해상도 위성 원격탐사 자료를 사용한다. GHRSST는 위성 폭 좌표, 그리드 데이터, 간격 없는 그리드 제품을 포함한 다양한 해수면 온도 데이터를 제공합니다. 여기에서는 최적의 보간 프레임워크 내에서 보완 위성과 현장 관측을 결합하여 생성된 간격 없는 그리드 제품을 사용했습니다. 수치모델로는 HYCOM[56]이 선택되었다. 공간 해상도는 각각 1/20°×1/20° 및 1/12°×1/12°입니다. 시간적 해결은 하루입니다. 학습에는 2007년 5월부터 2013년 12월까지의 데이터를 사용하고, 2014년 1월부터 2014년 12월까지의 나머지 데이터를 테스트에 사용합니다. 우리는 GHRSST에서 제공하는 클라우드리스 데이터를 사용한다는 점에 유의해야 합니다. 데이터는 구름을 통과할 수 있는 마이크로파 장비로 캡처되었습니다. 따라서 데이터는 연구 영역을 완전히 포괄합니다. 또한 GHRSST SST 제품의 모든 픽셀의 정확한 시간은 동일합니다.


Z-점수 표준화는 다음과 같이 전처리에 활용되었습니다.



여기서 x는 GHRSST 및 HYCOM 모델 SST를 나타내고, z는 정규화된 데이터를 나타내고, μ 및 σ는 각각 평균값과 표준 편차를 나타냅니다. 데이터를 256×256 정사각형 모양의 히트맵으로 변환했습니다.


보다 구체적으로, GHRSST 데이터와 512차원 랜덤 벡터는 이전 네트워크 훈련의 첫 번째 단계에서 활용됩니다. 입력 GHRSST 데이터의 크기는 N × H × W이며, 여기서 N은 배치 크기, H는 입력 데이터의 높이, W는 입력 데이터의 너비를 나타냅니다. 이전 네트워크의 두 번째 단계에서는 인코더 훈련에 GHRSST 데이터만 사용했습니다. 두 단계의 입력 및 출력 크기는 N × H × W입니다. 마찬가지로 이전 네트워크 훈련의 세 번째 단계에서는 HYCOM SST 데이터가 사전 훈련된 모델에 입력됩니다. 여기서 입력과 출력의 크기는 모두 N × H × W입니다. 구현에서는 N을 2430으로 설정하고 H와 W는 모두 256으로 설정했습니다.


그림 3. 절제 연구에 사용된 세 가지 모델의 그림. (a) 방식 A: 수치 모델 SST 데이터는 먼저 ConvLSTM에 입력되고, 그 다음 출력은 잘 훈련된 이전 네트워크에 입력됩니다. 이전 네트워크와 ConvLSTM의 순서가 대체됩니다. (b) 방식 B: 이전 네트워크는 잘 훈련되지 않았습니다. 특히, 이전 네트워크에서의 GAN 모델 훈련은 생략되었습니다. (c) 제안된 방법.


우리는 8개의 GPU를 갖춘 NVIDIA GeForce 2080Ti에 대해 광범위한 실험을 수행했습니다. 이전 네트워크는 과거 관측 데이터로부터 물리적 지식을 획득하기 위해 [53]에서 언급한 것과 동일한 네트워크 구조 및 구성을 사용합니다. 그런 다음 획득된 물리적 지식은 수치 모델의 잘못된 구성 요소를 복원하고 개선하기 위해 수치 모델 데이터로 전송됩니다. 본 논문에서 사용된 ConvLSTM 모델의 구성은 Shi의 연구[20]에 있는 ConvLSTM 모델과 동일하다. GHRSST SST 데이터세트는 본 백서에서 비교 및 평가를 위한 벤치마크로 활용됩니다.


B. SST 예측에 대한 전날 수치의 영향


섹션 III에서 언급한 바와 같습니다. C, t는 예측에 사용된 지난 일수를 나타냅니다. SST 예측 성능에 영향을 미칠 수 있는 중요한 매개변수입니다. 본 논문에서는 다음 1일, 3일, 7일 SST를 예측하려고 시도합니다. 우리는 그 원인을 찾기 위해 광범위한 실험을 실시했습니다.


표 I다음 일일 SST 예측에 대한 다양한 과거 일수에 대한 실험 결과


표 II 다음 3일 SST 예측에 대한 다양한 과거 일수에 대한 실험 결과


표 III 다음 7일 SST 예측에 대한 다양한 과거 일수에 대한 실험 결과


미래 SST 예측을 위한 적절한 과거 일수. 평가 기준으로는 RMSE(Root Mean Square Error)와 결정계수(R2)가 적용됩니다. RMSE가 낮고 R2 값이 높을수록 결과가 더 정확함을 나타냅니다.


표 Ⅰ은 지난 1일, 3일, 5일의 데이터를 각각 활용하여 다음날에 대한 예측 결과를 나열한 것이다. 제안된 모델은 지난 5일간의 데이터를 사용할 때 가장 좋은 성능을 보이는 것을 확인할 수 있으며, RMSE와 R2 결과는 각각 0.3618과 0.9967이다. 다른 계획보다 약간 낫습니다. 다른 두 방식에 비해 RMSE와 R2 값은 0.0086, 0.001 및 0.0028, 0.0006 향상되었습니다. 따라서 다음 일일 SST 예측에는 지난 5일간의 데이터가 채택됩니다.


우리는 표 2에서 다음 3일 SST 예측에 대한 t의 영향을 분석합니다. 과거 데이터를 오래 사용할수록 예측 성능이 좋아지는 것을 확인할 수 있습니다. 지난 7일간의 데이터를 이용한 RMSE 값이 가장 좋은 성능을 보인다. 지난 5일간의 데이터를 사용한 것과 비교하면 0.0025 개선된 수치이다. 한편 R2는 지난 7일 동안의 데이터를 사용하여 다른 두 가지 방식에 비해 가장 좋은 성능을 발휘합니다. 따라서 지난 7일간의 데이터를 다음 3일간의 SST 예측에 사용했습니다.


다음 7일 SST 예측의 실험 결과는 표 III에 설명되어 있습니다. 알 수 있듯이 지난 10일간의 데이터를 이용한 예측 결과가 가장 좋은 성능을 보이고 있다. 따라서 우리는 다음 7일간의 SST 예측을 위해 지난 10일간의 데이터를 활용합니다.


표 IV 10회 이상의 무작위 실행에 대한 평균 절제 연구의 실험 결과(평균±표준)


C. 절제 연구


이전 네트워크와 GAN 훈련의 효율성을 검증하기 위해 ablation 실험을 수행합니다. 그림 3에서 볼 수 있듯이 두 가지 변형이 비교를 위해 다음과 같이 설계되었습니다.


• Scheme A. 이전 네트워크와 ConvLSTM의 시퀀스가 교체됩니다. 수치 모델 SST 데이터는 먼저 ConvLSTM에 입력된 다음 출력이 잘 훈련된 이전 네트워크에 입력됩니다.


• 계획 B. 이전 네트워크는 잘 훈련되지 않았습니다. 구체적으로, 이전 네트워크 훈련에서 GAN 모델 훈련(그림 2의 첫 번째 단계)이 생략되었습니다.


실험 결과는 표 IV에 나와 있습니다. 볼 수 있듯이 우리의 방법은 최고의 RMSE 및 R2 값을 달성합니다. 특히, 제안된 방법은 이전 네트워크와 ConvLSTM의 올바른 시퀀스가 SST 예측 성능을 향상시킬 수 있음을 보여주는 Scheme A보다 성능이 뛰어납니다. 이전 네트워크가 수치 모델 데이터의 잘못된 구성 요소를 효과적으로 복원하고 복원된 데이터가 SST 예측에서 더 나은 성능을 발휘한다는 것이 분명합니다. 또한 제안된 방법은 Scheme B보다 우수한 성능을 보여 GAN 모델링이 필수 단계임을 보여줍니다. GAN 모델링은 관측된 SST의 데이터 분포를 학습할 수 있으며 이전 네트워크가 관측된 SST에서 더 나은 물리적 정보를 캡처하는 데 도움이 됩니다. 요약하자면, 제안된 방법에서는 사전 네트워크 사전 훈련을 위해 적대적 학습을 사용합니다. 이는 관찰된 SST 데이터의 물리적 지식을 이전 네트워크로 효과적으로 전달할 수 있습니다. 빠른 훈련 수렴을 안내하고 SST 예측 성능을 향상시킬 수 있습니다.


D. 실험 결과 및 고찰


그림 4는 예측된 다음 일일 SST를 관측된 실측 데이터와 비교합니다. 우리 방법의 예측 결과가 관찰된 데이터와 잘 일치하는 것을 볼 수 있습니다. 유사하게, 다음 3일과 7일 동안 관측된 데이터와 해당 예측 SST가 각각 그림 5와 그림 6에 표시됩니다. 시각화된 결과는 제안된 방법이 SST 예측에 대해 강력하고 신뢰할 수 있는 결과를 생성할 수 있음을 나타냅니다.


다음 날 SST 예측에 대한 산점도가 그림 7에 나와 있습니다. 데이터 포인트는 다음과 같습니다.


그림 4. 다음 일일 SST 예측 결과와 관측된 실제 데이터 비교.


그림 5. 다음 3일 SST 예측 결과와 관측된 실제 데이터 비교.


그림 6. 다음 7일 SST 예측 결과와 관측된 실제 데이터 비교.


그림 7. 다음 일일 SST 예측과 해당 관측 데이터를 비교하는 산점도


그림 8. 다음 3일 SST 예측과 해당 관측 데이터를 비교하는 산점도


빨간색 선 근처에 대략 고르게 분포되어 있습니다. 그림 8과 그림 9는 각각 다음 3일과 다음 7일에 대한 예측 결과의 산점도이다. 산점도는 제안된 SST 예측 방법의 효율성을 보여줍니다.


제안된 방법의 유효성을 검증하기 위해 제안된 방법을 ConvLSTM [20], Hybrid-NN [14], Hybrid-TL [15], Gen-END [57], VAE- 7가지 밀접하게 관련된 방법과 비교한다. GAN [58], Tra-NM 및 Tra-ASL. 이들 방법에 대한 연구지역은 (3.99°N∼24.78°N, 98.4°E∼124.4°E)이다. 이 모든 방법은 다음 1일 예측을 위해 지난 5일의 훈련 데이터, 다음 3일 예측을 위해 지난 7일의 데이터, 다음 7일을 위해 지난 10일의 데이터를 사용했습니다. 예측.


ConvLSTM은 섹션 III에서 논의됩니다. C이며 SST 예측을 위한 효과적인 시공간 모델입니다. HybridNN은 관찰된 데이터와 수치 모델 데이터 간의 불일치를 활용하여 심층 신경망 훈련을 안내합니다. Hybrid-TL은 전이학습을 통해 수치모델과 신경망의 장점을 결합합니다. GenEND는 SST 예측에 사용할 수 있는 생성 인코더입니다. VAE-GAN은 변형 자동 인코더를 통합하고


그림 9. 다음 7일 SST 예측과 해당 관측 데이터를 비교하는 산점도


GAN은 SST 예측을 위한 높은 수준의 의미론적 특징을 포착할 수 있습니다. HYCOM SST 데이터는 다음 1일, 3일 및 7일 예측(Tra-NM이라고 함)을 위해 ConvLSTM 모델을 훈련하는 데 사용됩니다. Tra-ASL은 전통적인 동화 방법이며 여러 유형의 데이터(관찰 데이터 및 수치 모델 데이터) 간의 상관 관계를 활용합니다.


GHRSST 데이터는 기준선 역할을 하는 ConvLSTM 모델을 훈련하는 데 처음으로 활용됩니다. 이는 SST 예측을 위해 널리 사용되는 데이터 기반 접근 방식입니다. Hybrid-NN, HybridTL, Gen-END 및 VAE-GAN은 훈련을 위해 GHRSST 및 HYCOM 데이터를 사용합니다. HYCOM 동화 데이터 [56]


다양한 방법의 표 VSST 예측 결과


그림 10. 다음 일일 SST 예측에 대한 시각화된 결과.


그림 11. 다음 3일 SST 예측에 대한 시각화된 결과. 첫 번째 열은 예측된 SST의 결과를 보여줍니다. 관측된 지상 진실 SST 데이터는 두 번째 열에 표시됩니다. 세 번째 열에서는 차이점을 제시합니다.


여기서는 1/12°×1/12°의 공간 분해능을 사용합니다. 우리의 방법은 과거 관측 데이터로부터 물리적 지식을 도입하여 수치 모델 데이터의 잘못된 구성 요소를 개선하고 수정합니다. 수정된 수치 모델 데이터를 물리 강화 데이터라고 합니다. 물리학이 강화된 데이터와 비교하기 위해 HYCOM 동화 데이터(Tra-ASL)와 HYCOM 데이터(Tra-NM)를 유사하게 사용하여 ConvLSTM 모델을 훈련합니다.


다음 1일, 3일, 7일 예측에 대한 ConvLSTM, Hybrid-NN, Tra-NM 및 Tra-ASL의 훈련 시간은 각각 1.8시간, 4.4시간, 8.2시간입니다. Hybrid-TL 방법은 ConvLSTM 모델을 두 번 훈련시켰으며, 세 가지 작업에 대해 훈련 기간은 각각 3.6시간, 8.8시간, 16.4시간이었습니다. VAE-GAN은 훈련에 181.6, 184.2, 188.4시간이 필요한 반면, Gen-END 방법은 세 가지 SST 예측 작업에 각각 196.8, 199.3, 203.2시간으로 거의 동일한 시간이 필요합니다.


다음 1일, 3일, 7일 SST 예측에 대한 결과는 표 V에 나와 있습니다. TraNM 방법이 다른 방법에 비해 만족스럽지 못한 결과를 산출한다는 것은 분명합니다. 이는 HYCOM 데이터의 잘못된 구성 요소로 인해 SST 예측 성능에 부정적인 영향을 미칠 가능성이 높습니다. Hybrid-NN 방법 역시 평균 RMSE 값이 모델 중 두 번째로 낮기 때문에 성능이 좋지 않습니다. Hybrid-TL 모델은 다음 1일 SST 예측에 대해서는 ConvLSTM보다 성능이 우수하지만 다른 두 작업에 대해서는 성능이 좋지 않습니다. 우리의 방법은 최고의 RMSE 값과 가장 높은 R2 값을 달성합니다. ConvLSTM 모델과 비교하여 우리 방법의 평균 RMSE 값이 효과적으로 향상되었습니다. 물리적 지식을 도입하는 것을 보여줍니다.


그림 12. 다음 7일 SST 예측에 대한 시각화된 결과. 첫 번째 행은 예측된 SST의 결과를 보여줍니다. 관측된 실제 SST 데이터는 두 번째 행에 표시됩니다. 우리는 세 번째 행에 차이점을 제시합니다.


관측된 데이터로부터 수치 모델 데이터의 잘못된 구성 요소를 복원하여 SST 예측 정확도를 향상시킬 수 있습니다.


그림 10은 다음 일일 SST 예측, 관측된 SST 데이터 및 그 차이에 대한 시각화된 결과를 각각 나타냅니다. 예측 결과는 남중국해 전 지역에 걸쳐 관측된 SST 데이터와 매우 유사함을 알 수 있다. 그림 11은 다음 3일 SST 예측에 대한 시각화된 결과를 표시합니다. 통킹만과 남중국해의 다른 주변 지역에서는 상당한 차이가 있는 것으로 관찰되었습니다. 그림 12는 다음 7일 SST 예측에 대한 시각화된 결과를 보여줍니다. 주요 차이 값은 주로 다음 7일 예측에 대한 통킹 만에 집중되어 있으며 다른 두 작업에 대한 결과보다 큰 것으로 나타났습니다.


E. 제한사항 및 논의


그림 7부터 그림 9까지 그림 13에 시각화된 중간 범위 SST에 일부 부정확성이 있음을 볼 수 있습니다. 밝은 픽셀은 큰 SST 예측 오류를 나타내고 어두운 픽셀은 정확한 SST 예측을 나타냅니다. 보는 바와 같이 이들 지점은 주로 대만해협 북서부에 위치하며, 예상 해수면 온도가 관측 데이터보다 낮다. 예측 오류는 주로 ConvLSTM 모델과 랜드 마스크로 인해 발생합니다. 우리의 구현에서는 랜드 마스크가 연구 영역에 적용됩니다. ConvLSTM은 전체 연구 영역의 공간적, 시간적 특징을 활용합니다. 대만해협 북서부의 지형은 육지 마스크의 영향을 어느 정도 받기 때문에 예측 오류가 발생합니다. 더 높은 해상도의 훈련 데이터를 얻을 수 있다면 이 지역의 예측 정확도가 더욱 향상될 것입니다.


그림 13. SST 예측 오류의 시각화.


그림 11과 12에서 리드데이에 따른 오차의 큰 증가는 없음을 알 수 있다. 이는 우리의 방법이 충분한 양의 훈련 데이터를 사용하고 심층 신경망이 시간적 특징을 효과적으로 포착할 수 있다는 사실 때문일 수 있습니다. 또한 SST의 지속성도 중요한 요소입니다.


이 문서는 CC 4.0 라이선스에 따라 arxiv에서 볼 수 있습니다.