paint-brush
Phương pháp tóm tắt rồi tìm kiếm để trả lời câu hỏi bằng video dài: Phương pháptừ tác giả@kinetograph
108 lượt đọc

Phương pháp tóm tắt rồi tìm kiếm để trả lời câu hỏi bằng video dài: Phương pháp

dài quá đọc không nổi

Trong bài viết này, các nhà nghiên cứu khám phá QA video không quay bằng GPT-3, vượt trội so với các mô hình được giám sát, tận dụng các bản tóm tắt tường thuật và kết hợp hình ảnh.
featured image - Phương pháp tóm tắt rồi tìm kiếm để trả lời câu hỏi bằng video dài: Phương pháp
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.

tác giả:

(1) Jiwan Chung, MIR Lab Đại học Yonsei ( https://jiwanchung.github.io/ );

(2) Youngjae Yu, MIR Lab Đại học Yonsei ( https://jiwanchung.github.io/ ).

Bảng liên kết

2. Phương pháp


Hình 2: Kết quả định tính cho thấy mô hình Câu chuyện ngắn (LSS) được đề xuất của chúng tôi tạo và truy xuất chỉ mục của cảnh quay video thô. Khi mô hình dự đoán câu trả lời cuối cùng từ (i) Tóm tắt được tạo và (ii) ngữ cảnh văn bản được truy xuất, CLIPCheck sẽ xác thực câu trả lời của từng ứng viên để sửa lại câu trả lời cuối cùng cho câu hỏi.

2.1. Tạo cốt truyện

2.2. Tìm kiếm tường thuật

Với câu chuyện tóm tắt và câu hỏi, chúng tôi muốn lấy đoạn clip tương đối ngắn có liên quan đến câu hỏi từ video dài. Các mô hình ngôn ngữ tạo ra văn bản mở không đều và thường ồn ào. Để truy xuất phần chính xác của video, chúng tôi điều khiển mô hình xuất ra các chỉ mục của cốt truyện thay vì dạng văn bản.



Các chỉ mục được tạo có thể vẫn bị nhiễu do tính chất mở của các mô hình ngôn ngữ. Khi mô hình đưa ra câu trả lời ở dạng văn bản, chúng tôi sử dụng điểm rouge-l [19] để tìm các ứng viên có độ tương tự với câu được tạo cao hơn ngưỡng chỉ định α ≥ 0,5.


2.3. Kiểm tra trực quan

L O A D I N G
. . . comments & more!

About Author

Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
Kinetograph: The Video Editing Technology Publication@kinetograph
The Kinetograph's the 1st motion-picture camera. At Kinetograph.Tech, we cover cutting edge tech for video editing.

chuyên mục

BÀI VIẾT NÀY CŨNG CÓ MẶT TẠI...