tác giả:
(1) Ngọc Tân Mạnh;
(2) Phùng Cao;
(3) Eric Rigall;
(4) Chạy Đông;
(5) Junyu Đồng;
(6) Càn Độ.
Theo truyền thống, các mô hình số đã được triển khai trong nghiên cứu hải dương học để mô phỏng động lực học đại dương bằng cách biểu diễn các phương trình vật lý. Tuy nhiên, nhiều yếu tố liên quan đến động lực đại dương dường như chưa được xác định rõ ràng. Chúng tôi lập luận rằng việc chuyển giao kiến thức vật lý từ dữ liệu quan sát được có thể cải thiện hơn nữa độ chính xác của các mô hình số khi dự đoán Nhiệt độ bề mặt nước biển (SST). Gần đây, những tiến bộ trong công nghệ quan sát trái đất đã mang lại sự tăng trưởng vượt bậc về dữ liệu. Do đó, bắt buộc phải khám phá những cách để cải thiện và bổ sung các mô hình số sử dụng lượng dữ liệu quan sát lịch sử ngày càng tăng. Để đạt được mục đích này, chúng tôi giới thiệu một phương pháp dự đoán SST giúp chuyển kiến thức vật lý từ các quan sát lịch sử sang mô hình số. Cụ thể, chúng tôi sử dụng kết hợp bộ mã hóa và mạng đối thủ tổng hợp (GAN) để nắm bắt kiến thức vật lý từ dữ liệu được quan sát. Dữ liệu mô hình số sau đó được đưa vào mô hình được đào tạo trước để tạo ra dữ liệu nâng cao về mặt vật lý, sau đó có thể được sử dụng để dự đoán SST. Kết quả thử nghiệm chứng minh rằng phương pháp đề xuất tăng cường đáng kể hiệu suất dự đoán SST khi so sánh với một số đường cơ sở tiên tiến nhất.
Thuật ngữ chỉ mục —Nhiệt độ bề mặt nước biển, kiến thức vật lý, mạng lưới đối thủ tổng hợp, mô hình số
Các mô hình UMERICAL là một phương pháp tính toán toán học truyền thống để dự đoán động lực học đại dương. Theo số liệu thống kê của Chương trình Nghiên cứu Khí hậu Thế giới (WCRP), cộng đồng nghiên cứu đã phát triển hơn 40 mô hình số đại dương, mỗi mô hình đều có những ưu điểm và đặc điểm riêng. Ví dụ, hệ thống mô hình đại dương khu vực (ROMS) [1] có mô-đun phụ thuộc sinh thái mạnh mẽ, mô hình khí quyển đại dương nhanh (FOAM) [2] có hiệu quả cao trong các nghiên cứu khí quyển-đại dương kết hợp toàn cầu, mô hình đại dương ven biển có thể tích hữu hạn (FVCOM) [3] có khả năng điều chỉnh chính xác ranh giới bờ biển và địa hình tàu ngầm. Mô hình đại dương tọa độ lai (HYCOM) [4] có thể thực hiện ba loại tọa độ tự thích ứng. Các mô hình số này không thể thay thế cho nhau và việc sử dụng chúng phụ thuộc vào ứng dụng cụ thể. Cần lưu ý rằng các quá trình khác nhau của động lực đại dương được mô tả trong các mô hình số đều dựa trên các phương trình đơn giản hóa và
các thông số do sự hiểu biết hạn chế của chúng ta về đại dương. Những chuyển động và thay đổi trong đại dương thực sự rất đa dạng và phức tạp nên việc xác định nguồn gốc của một hiện tượng nào đó trở thành một thách thức thực sự. Do đó, việc tìm kiếm các mối quan hệ hoặc kiến thức mới từ dữ liệu lịch sử có tầm quan trọng đặc biệt để cải thiện hiệu suất của các mô hình số trong nghiên cứu động lực đại dương. Trong bài báo này, chúng tôi gọi năng lực có thể cải tiến mô hình số là kiến thức vật lý. Chúng tôi giả định rằng dữ liệu lịch sử có thể chứa đựng kiến thức vật lý cho đến nay vẫn chưa được khám phá.
Học sâu có khả năng vượt trội trong việc học các hàm rất phức tạp, biến dữ liệu gốc thành mức độ trừu tượng cao hơn nhiều. Trong [5], Lecun và cộng sự. đã mô tả các nguyên tắc cơ bản và lợi ích chính của học sâu. Gần đây, học sâu đã được áp dụng cho nhiều nhiệm vụ khác nhau, chẳng hạn như giám sát đa dạng sinh học biển [6], [7], xác định mục tiêu trong hình ảnh sonar [8], [9] và dự báo nồng độ băng biển [10]. Ví dụ, Bermant và cộng sự. [6] đã sử dụng mạng lưới thần kinh tích chập (CNN) để phân loại các ảnh phổ được tạo ra từ dữ liệu âm thanh của cá nhà táng. Allken và cộng sự. [7] đã phát triển mô hình CNN để phân loại loài cá, tận dụng dữ liệu tổng hợp để tăng cường dữ liệu huấn luyện. Lima và cộng sự. [8] đã đề xuất một phương pháp học chuyển sâu để nhận dạng mặt biển tự động, trích xuất kiến thức từ các mô hình CNN sâu được đào tạo trên dữ liệu lịch sử. Xu và cộng sự. [9] đã trình bày một cách tiếp cận kết hợp các mạng thế hệ sâu và học chuyển giao để phát hiện các vụ đắm tàu bằng sóng siêu âm. Ren và cộng sự. [10] đã đề xuất một khung mã hóa-giải mã với các mạng tích chập hoàn toàn có thể dự đoán nồng độ băng biển trước một tuần với độ chính xác cao. Thông qua việc áp dụng các phương pháp dựa trên deep learning vào nghiên cứu đại dương, chúng tôi đã đạt được những cải tiến đáng kể về hiệu suất phân loại và dự đoán.
Do kiến thức vật lý chưa đầy đủ trong các mô hình số và hiệu suất khái quát hóa yếu của mạng nơ-ron, nên có một số nỗ lực nhằm cải thiện hiệu suất dự đoán bằng cách kết hợp các ưu điểm của mô hình số và mạng nơ-ron. Trong khoa học địa lý, điều này có thể đạt được theo ba cách khác nhau [11]: 1) Tìm hiểu các tham số của mô hình số thông qua mạng lưới thần kinh. Mạng lưới thần kinh có thể mô tả tối ưu cảnh quan sát được từ mô hình chi tiết có độ phân giải cao, nhưng nhiều thông số khó suy ra, khiến việc ước tính của chúng trở nên khó khăn. Brenowitz và cộng sự. [12] đã đào tạo một mạng lưới thần kinh sâu dựa trên tham số hóa vật lý thống nhất và giải thích ảnh hưởng của sự đối lưu bức xạ và tích tụ. 2) Thay thế mô hình số bằng mạng nơ-ron. Bằng cách này, kiến trúc mạng lưới thần kinh sâu có thể nắm bắt được tính nhất quán vật lý được chỉ định. Pannekoucke và cộng sự. [13] đã dịch các phương trình vật lý sang kiến trúc mạng thần kinh bằng công cụ plug-and-play. 3) Phân tích sự không khớp đầu ra giữa mô hình số và dữ liệu quan sát. Mạng lưới thần kinh có thể được sử dụng để xác định, trực quan hóa và hiểu các mẫu không chính xác của mô hình và tự động điều chỉnh độ lệch của mô hình. Patil và cộng sự. [14] đã áp dụng sự khác biệt giữa kết quả của mô hình số và dữ liệu quan sát để huấn luyện mạng lưới thần kinh nhằm dự đoán nhiệt độ mặt nước biển (SST). Hàm và cộng sự. [15] đã đào tạo một mạng lưới thần kinh tích chập dựa trên phương pháp học chuyển giao. Đầu tiên, họ huấn luyện mô hình của mình trên dữ liệu mô hình số, sau đó sử dụng dữ liệu phân tích lại để hiệu chỉnh mô hình. Tuy nhiên, cách tiếp cận thứ ba được phát hiện là có vấn đề về sai lệch dài hạn, trong đó hiệu suất dự đoán giảm sút khi số ngày dự đoán tăng lên.
Để giải quyết các vấn đề trên, trong nghiên cứu này, chúng tôi sử dụng mạng đối thủ tổng quát (GAN) để chuyển kiến thức vật lý từ dữ liệu được quan sát lịch sử sang dữ liệu mô hình số, như minh họa trong Hình 1. Khác với mô hình số truyền thống, mô hình được đề xuất phương pháp có thể sửa phần vật lý trong dữ liệu mô hình số để cải thiện hiệu suất dự đoán. Cụ thể, như được minh họa trong Hình 2, trước tiên chúng tôi có được đặc điểm vật lý từ dữ liệu được quan sát bằng cách sử dụng mô hình mạng trước đó bao gồm bộ mã hóa và GAN. Sau đó, chúng tôi đã thu được SST tăng cường vật lý bằng cách cung cấp dữ liệu mô hình số cho mô hình đã được huấn luyện trước. Sau đó, SST tăng cường vật lý đã được áp dụng để huấn luyện mô hình không gian-thời gian nhằm dự đoán SST. Trong khi đó, chúng tôi đã thực hiện các thử nghiệm cắt bỏ để tận dụng tối đa dữ liệu mới được tạo.
Những đóng góp chính của bài viết này gồm ba phần:
• Theo hiểu biết tốt nhất của chúng tôi, chúng tôi là những người đầu tiên chuyển kiến thức vật lý từ dữ liệu quan sát lịch sử sang dữ liệu mô hình số bằng cách sử dụng GAN để dự đoán SST.
• Sự khác biệt giữa dữ liệu nâng cao dựa trên kiến thức vật lý và kết quả dự đoán được khai thác để điều chỉnh trọng số của mô hình trong quá trình huấn luyện.
• Kết quả thực nghiệm cho thấy phương pháp đề xuất của chúng tôi có thể giải quyết được sự thiếu hụt kiến thức vật lý trong mô hình số và cải thiện độ chính xác của dự đoán.
Phần còn lại của bài báo được tổ chức như sau. Phần II giới thiệu tổng quan tài liệu liên quan đến phương pháp của chúng tôi, trong khi thiết kế phương pháp của chúng tôi được trình bày chi tiết trong Phần III. Sau đó, kết quả thực nghiệm được trình bày ở Phần IV. Phần V cuối cùng kết thúc bài viết này.
Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.