paint-brush
Mạng lưới thần kinh sâu để dự đoán nhiệt độ bề mặt biển: Phương pháp đề xuấttừ tác giả@oceanography
163 lượt đọc

Mạng lưới thần kinh sâu để dự đoán nhiệt độ bề mặt biển: Phương pháp đề xuất

dài quá đọc không nổi

Trong bài báo này, các nhà nghiên cứu nâng cao khả năng dự đoán SST bằng cách chuyển kiến thức vật lý từ các quan sát lịch sử sang mô hình số.
featured image - Mạng lưới thần kinh sâu để dự đoán nhiệt độ bề mặt biển: Phương pháp đề xuất
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

tác giả:

(1) Ngọc Tân Mạnh;

(2) Phùng Cao;

(3) Eric Rigall;

(4) Chạy Đông;

(5) Junyu Đồng;

(6) Càn Độ.

Bảng liên kết

III. PHƯƠNG ÁN ĐỀ XUẤT

Mô hình số có thể dự đoán sự phân bố không gian của SST và các kết nối từ xa toàn cầu của nó cùng nhau. Nó hoạt động tốt ở các khoảng thời gian ngắn để dự đoán SST. Tuy nhiên, chúng tôi lập luận rằng việc chuyển giao kiến thức vật lý từ dữ liệu được quan sát có thể cải thiện hơn nữa hiệu suất của mô hình số để dự đoán SST. Để đạt được mục đích này, chúng tôi áp dụng GAN để tìm hiểu kiến thức vật lý trong dữ liệu được quan sát.


Zhu và cộng sự. [53] đã đề xuất một phương pháp đảo ngược GAN không chỉ tái tạo lại một cách trung thực dữ liệu đầu vào mà còn đảm bảo rằng mã tiềm ẩn đảo ngược có ý nghĩa về mặt ngữ nghĩa. Họ đã chứng minh rằng việc học các giá trị pixel của hình ảnh mục tiêu là không đủ và các đặc điểm đã học không thể biểu diễn hình ảnh ở cấp độ ngữ nghĩa. Lấy cảm hứng từ công việc này, chúng tôi thiết kế một bộ mã hóa trong GAN để tìm hiểu kiến thức vật lý từ dữ liệu được quan sát, được gọi là mạng trước đó. Mạng trước này không chỉ tìm hiểu các giá trị pixel của dữ liệu được quan sát mục tiêu mà còn nắm bắt thông tin vật lý. Nó cải thiện hiệu quả độ chính xác dự đoán SST.


Tiếp theo, chúng tôi trình bày phương pháp được đề xuất như sau: 1) Tổng quan về phương pháp, 2) Mạng trước đó, 3) Dự đoán SST với dữ liệu nâng cao.


A. Tổng quan về phương pháp


Trong tiểu mục này, chúng tôi tóm tắt phương pháp dự đoán SST được đề xuất và mô tả chi tiết đầu vào và đầu ra của từng giai đoạn. Như được minh họa trong Hình 2, phương pháp dự đoán SST được đề xuất bao gồm hai giai đoạn: Huấn luyện mạng trước và dự đoán SST với dữ liệu nâng cao.


1) Đào tạo mạng trước. Giai đoạn này bao gồm ba bước. Ở bước đầu tiên, SST (dữ liệu GHRST) được quan sát sẽ được sử dụng để đào tạo mô hình GAN. Ở bước thứ hai, bộ tạo được huấn luyện trước và dữ liệu GHRSST được sử dụng để huấn luyện bộ mã hóa. Ở bước thứ ba, bộ tạo và bộ mã hóa được huấn luyện trước được kết hợp vào mạng trước đó. Mạng trước được sử dụng để chuyển kiến thức vật lý từ dữ liệu được quan sát sang mô hình số. Sau đó, mô hình số SST (dữ liệu HYCOM) được đưa vào mạng trước đó để nâng cao khả năng biểu diễn tính năng của nó.


2) Dự đoán SST với dữ liệu nâng cao. Dữ liệu nâng cao về mặt vật lý được đưa vào mô hình ConvLSTM để dự đoán SST. SST của ngày tiếp theo, 3 ngày tiếp theo và 7 ngày tiếp theo được dự đoán riêng.


Cần lưu ý rằng hầu hết các công trình hiện có [26] [27] chỉ sử dụng dữ liệu quan sát được để huấn luyện ConvLSTM. Ngược lại, phương pháp của chúng tôi tận dụng dữ liệu nâng cao về mặt vật lý để đào tạo ConvLSTM. Tiếp theo, chúng tôi mô tả chi tiết quá trình đào tạo mạng trước đó và dự đoán SST với dữ liệu nâng cao.


B. Giai đoạn 1: Đào tạo mạng lưới trước


Chúng tôi xây dựng một mạng trước để tìm hiểu kiến thức vật lý trong dữ liệu được quan sát và giữ thông tin ngữ nghĩa/vật lý của nó không đổi sau khi đào tạo. Như minh họa trong Hình 2, quá trình đào tạo mạng trước đó bao gồm ba bước: đào tạo mô hình GAN, đào tạo bộ mã hóa và tạo dữ liệu nâng cao vật lý. Tiếp theo chúng tôi cung cấp mô tả chi tiết của từng bước.


Đào tạo mô hình GAN. Mô hình GAN được sử dụng để tìm hiểu cách phân phối dữ liệu từ SST được quan sát. Hàm mục tiêu như sau:



Quá trình đào tạo của mô hình GAN được tóm tắt trong Thuật toán 1. Chúng tôi huấn luyện mô hình dựa trên SST được quan sát cho đến khi trình tạo G nắm bắt được các đặc điểm vật lý từ dữ liệu SST được quan sát.



trong đó F(·) biểu thị việc trích xuất tính năng thông qua mạng VGG. Mạng VGG là viết tắt của mạng được đề xuất bởi Visual Geometry Group [54] và nó là mạng nơ-ron tích chập sâu cổ điển.


Quá trình huấn luyện bộ mã hóa được mô tả trong Thuật toán 2. Các tham số của bộ tạo G được cố định, trong khi các tham số của bộ mã hóa E và bộ phân biệt đối xử D được cập nhật dựa trên biểu thức. 2 và phương trình. 3, tương ứng.


Động lực của Giai đoạn 1 là xây dựng một mạng trước đó có thể khắc phục các thành phần không chính xác trong dữ liệu mô hình số. Để đạt được mục đích này, trước tiên chúng tôi nghĩ ra một mô hình GAN nắm bắt phân phối dữ liệu từ SST được quan sát và có thể tạo ra dữ liệu SST chất lượng cao. Sau đó, bộ mã hóa được huấn luyện để đảm bảo rằng các mã tiềm ẩn được tạo sẽ bảo toàn thông tin ngữ nghĩa/vật lý trong SST được quan sát. Chúng tôi lập luận rằng thông qua học đối nghịch, mạng trước (bao gồm bộ mã hóa và bộ tạo) có thể sửa các phần không chính xác trong dữ liệu đầu vào, vì kiến thức vật lý đã được nhúng vào mạng trước. Do đó, ở bước thứ ba, khi dữ liệu mô hình số được đưa vào mạng trước đó, kiến thức vật lý được nhúng có thể sửa các thành phần không chính xác trong dữ liệu mô hình số.




C. Giai đoạn 2: Dự đoán SST với dữ liệu nâng cao


ConvLSTM là một công cụ hiệu quả để dự đoán dữ liệu không gian và thời gian. Nó là một mạng nơ-ron hồi quy kết hợp các khối tích chập trong cả quá trình chuyển đổi đầu vào sang trạng thái và chuyển đổi trạng thái sang trạng thái. Không giống như lớp LSTM truyền thống, ConvLSTM không chỉ duy trì mối quan hệ tuần tự mà còn trích xuất các đặc điểm không gian từ dữ liệu. Bằng cách này, chúng ta có thể tận dụng nó để nắm bắt các đặc điểm không gian-thời gian mạnh mẽ. Hàm mục tiêu của ConvLSTM được xây dựng như sau:



Dữ liệu SST tăng cường vật lý được đưa vào mô hình ConvLSTM để dự đoán SST như sau:



Các trọng số mà trình tạo thu được sẽ được sử dụng lại trong Thuật toán 2, trong đó chỉ các trọng số của trình tạo là cố định. Bộ mã hóa và bộ phân biệt được giới thiệu sẽ trải qua một quá trình huấn luyện khác qua SST được quan sát. Trọng số của chúng được cập nhật dựa trên phương trình. 2 và phương trình. 3, tương ứng. Sau khi huấn luyện, mã do bộ mã hóa tạo ra sẽ thể hiện kiến thức vật lý đã học.


Cuối cùng, chúng tôi thu được dữ liệu được củng cố dựa trên kiến thức vật lý bằng mô hình được đào tạo trước ở trên. Trọng lượng của



bộ tạo và bộ mã hóa từ Thuật toán 2 được tái sử dụng và mô hình số SST được khai thác để tạo ra dữ liệu mô hình số được củng cố về mặt vật lý.


Trong Thuật toán 3, dữ liệu nâng cao kiến thức vật lý được tận dụng để huấn luyện mô hình ConvLSTM không gian-thời gian cho dự đoán SST. Trong bài viết này, thuế TTĐB của ngày hôm sau, 3 ngày tiếp theo và 7 ngày tiếp theo được dự đoán riêng. Về phần này, chúng tôi đã tiến hành một nghiên cứu cắt bỏ để sử dụng dữ liệu được củng cố một cách hiệu quả.


Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.