tác giả:  (1) Zhihang Ren, Đại học California, Berkeley và các tác giả này đã đóng góp như nhau cho công trình này (Email: peter.zhren@berkeley.edu);  (2) Jefferson Ortega, Đại học California, Berkeley và các tác giả này đã đóng góp như nhau cho công trình này (Email: jefferson_ortega@berkeley.edu);  (3) Yifan Wang, Đại học California, Berkeley và các tác giả này đã đóng góp như nhau cho công trình này (Email: wyf020803@berkeley.edu);  (4) Zhimin Chen, Đại học California, Berkeley (Email: zhimin@berkeley.edu);  (5) Yunhui Guo, Đại học Texas tại Dallas (Email: yunhui.guo@utdallas.edu);  (6) Stella X. Yu, Đại học California, Berkeley và Đại học Michigan, Ann Arbor (Email: stellayu@umich.edu);  (7) David Whitney, Đại học California, Berkeley (Email: dwhitney@berkeley.edu).  Bảng liên kết   Tóm tắt và giới thiệu   Chảo liên quan   Bộ dữ liệu VEATIC   Thí nghiệm   Cuộc thảo luận   Phần kết luận   Thông tin thêm về kích thích   Chi tiết chú thích   Xử lý ngoại lệ   Thỏa thuận chủ đề trên các video   Đánh giá và tài liệu tham khảo về sự quen thuộc và thích thú  2. Công việc liên quan  Gần đây, đã có một số bộ dữ liệu cung cấp các khung có cả thông tin về khuôn mặt và bối cảnh, như CAER [33] và EMOIC [32]. CAER [33] là tập dữ liệu dựa trên video chứa các nhãn phân loại của từng khung hình video và EMOTIC [32] là tập dữ liệu dựa trên hình ảnh chứa cả nhãn biểu thức phân loại và xếp hạng thống trị hóa trị-kích thích liên tục. Không giống như các tập dữ liệu này, tập dữ liệu của chúng tôi dựa trên video và chứa các xếp hạng hóa trị và kích thích liên tục. Có thể tìm thấy so sánh chi tiết giữa tập dữ liệu của chúng tôi với các tập dữ liệu trước đó trong Bảng 1.  Dựa trên các bộ dữ liệu cảm xúc khác nhau, các nghiên cứu đã bắt đầu tập trung vào cách tự động suy ra cảm xúc. Ảnh hưởng của con người có thể được suy ra từ nhiều phương thức, chẳng hạn như âm thanh [70, 68, 65], hình ảnh [40, 54, 55, 37] và văn bản [68, 22]. Đặc biệt, đối với đầu vào trực quan, có ba nhiệm vụ chính.   Nhiệm vụ ước tính hóa trị-kích thích nhằm mục đích dự đoán hóa trị và kích thích của từng hình ảnh/khung hình [71, 69, 29, 30]; nhiệm vụ nhận dạng biểu thức tập trung vào việc phân loại các loại cảm xúc của từng hình ảnh/khung hình [66, 57, 67]; và nhiệm vụ phát hiện đơn vị hành động (AU) nhằm mục đích phát hiện các hành động của cơ mặt từ khuôn mặt của mỗi hình ảnh/khung hình [25, 56, 35, 64]. Hiện nay, hầu hết các phương pháp được đề xuất đều dựa chủ yếu vào vùng mặt để suy ra trạng thái cảm xúc. Thật vậy, vùng mặt chứa đựng nhiều thông tin về trạng thái cảm xúc của con người. Tuy nhiên, yếu tố bối cảnh cũng cung cấp những thông tin cần thiết để con người suy luận và nhận thức chính xác trạng thái cảm xúc của người khác [8, 9, 10]. Một số nghiên cứu [33, 32, 40] đã bắt đầu kết hợp thông tin bối cảnh làm nguồn suy luận ảnh hưởng. Trong nghiên cứu này, chúng tôi cũng áp dụng cả thông tin về khuôn mặt và bối cảnh để đạt được nhiệm vụ mới, tức là suy ra hóa trị và sự kích thích cho từng khung hình video.  Để suy ra tác động của một người, chúng ta thường cần xử lý thông tin tạm thời của các đoạn âm thanh, khung hình video hoặc từ ngữ. Nhiều nghiên cứu [68, 69, 29, 30] bắt đầu sử dụng bộ nhớ dài hạn ngắn hạn (LSTM) [23], đơn vị tái phát có kiểm soát (GRU) [11] hoặc mạng thần kinh tái phát (RNN) [24, 50] để xử lý thông tin mang tính thời sự. Với sự xuất hiện của biến áp thị giác (ViT) [14], sự chú ý đã được thay đổi. Nhiều tác vụ hiểu video [19, 1, 36] đã sử dụng ViT để hiểu thông tin theo thời gian và đạt được hiệu suất cao nhất. Phương pháp cơ bản của chúng tôi cũng sử dụng ViT làm công cụ để xử lý thông tin tạm thời trong các video clip.  Bài viết này   theo giấy phép CC 4.0. có sẵn trên arxiv

Part of HackerNoon's growing list of open-source research papers, promoting free access to academic material.

Kinetopgraph.TECH

Read My Stories

kinetograph

Nghe bài viết này bằng Tiếng Anh, đọc bởi robot thông minh của HackerNoon

VEATIC: Theo dõi cảm xúc và tác động dựa trên video trong bộ dữ liệu ngữ cảnh: Công việc liên quan

About Author

BÌNH LUẬN

chuyên mục

BÀI VIẾT NÀY CŨNG CÓ MẶT TẠI

Related Stories

178 Stories To Learn About Essay

223 Stories To Learn About Science

309 Stories To Learn About Smart Contracts

581 Stories To Learn About Non Fiction

178 Stories To Learn About Essay

223 Stories To Learn About Science

309 Stories To Learn About Smart Contracts

581 Stories To Learn About Non Fiction

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps