paint-brush
Tạo đoạn giới thiệu phim thông qua phân tách tác vụ: Kết quả: Nghiên cứu cắt bỏtừ tác giả@kinetograph

Tạo đoạn giới thiệu phim thông qua phân tách tác vụ: Kết quả: Nghiên cứu cắt bỏ

dài quá đọc không nổi

Trong bài báo này, các nhà nghiên cứu mô hình hóa phim dưới dạng biểu đồ để tạo ra các đoạn giới thiệu, xác định cấu trúc tường thuật và dự đoán tình cảm, vượt qua các phương pháp được giám sát.
featured image - Tạo đoạn giới thiệu phim thông qua phân tách tác vụ: Kết quả: Nghiên cứu cắt bỏ
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

tác giả:

(1) Pinelopi Papalampidi, Viện Ngôn ngữ, Nhận thức và Tính toán, Trường Tin học, Đại học Edinburgh;

(2) Frank Keller, Viện Ngôn ngữ, Nhận thức và Tính toán, Trường Tin học, Đại học Edinburgh;

(3) Mirella Lapata, Viện Ngôn ngữ, Nhận thức và Tính toán, Trường Tin học, Đại học Edinburgh.

Bảng liên kết

C. Kết quả: Nghiên cứu cắt bỏ

D. Phân tích phân chia nhiệm vụ

Cấu trúc tường thuật kết nối với đoạn giới thiệu như thế nào Theo lý thuyết viết kịch bản [22], năm TP chia phim thành sáu đơn vị chủ đề, cụ thể là “Thiết lập”, “Tình huống mới”, “Tiến độ”, “Phức tạp và cổ phần cao hơn”, “Cú hích cuối cùng” và "Hậu quả". Để kiểm tra xem phần nào của phim phổ biến nhất trong đoạn giới thiệu, chúng tôi tính toán phân bổ cảnh quay theo đơn vị chủ đề trong đoạn giới thiệu vàng (sử dụng bộ phát triển mở rộng TRIPOD). Như được hiển thị trong Hình 4, các đoạn giới thiệu trung bình chứa các cảnh quay từ tất cả các phần của một bộ phim, thậm chí từ hai phần cuối, có thể tiết lộ phần kết. Hơn nữa, hầu hết các cảnh quay trailer (30,33%) được chọn từ giữa phim (tức là Tiến trình) cũng như từ đầu (tức là, lần lượt là 16,62% và 25,45% cho “Thiết lập” và “Tình huống mới”). Những quan sát thực nghiệm này chứng thực các nguyên tắc của ngành trong việc tạo ra xe kéo.[10]


Tiếp theo, chúng tôi nhận thấy tần suất đoạn giới thiệu bao gồm các loại sự kiện chính khác nhau được biểu thị bằng TP. Chúng tôi trình bày tỷ lệ phần trăm các đoạn giới thiệu (trên tập hợp phát triển) bao gồm ít nhất một cảnh quay cho mỗi TP trong Bảng 7. Như có thể thấy, hơn một nửa số đoạn giới thiệu (tức là 52,63% và 55,26%) bao gồm các cảnh quay liên quan đến phần đầu tiên. hai TP, trong khi chỉ có 34,21% số trailer có thông tin về hai TP cuối cùng. Điều này được mong đợi, vì TP đầu tiên mang tính chất giới thiệu câu chuyện và do đó quan trọng hơn khi làm đoạn giới thiệu, trong khi hai TP cuối cùng có thể chứa phần tiết lộ nội dung và thường bị tránh.


Mối liên hệ tình cảm với đoạn giới thiệu Các quy tắc thực nghiệm khi làm đoạn giới thiệu đề xuất rằng đoạn giới thiệu nên bắt đầu bằng những cảnh quay có cường độ trung bình để thu hút người xem, sau đó giảm cường độ tình cảm để truyền tải thông tin chính về bộ phim và cuối cùng là tăng cường sự căng thẳng cho đến khi đạt tới đỉnh điểm.


Ở đây, chúng tôi phân tích luồng cảm xúc trong đoạn giới thiệu thực từ tập hợp phát triển của chúng tôi dựa trên điểm cảm tính được dự đoán (xem Phần 3.5 và 4). Cụ thể, chúng tôi tính toán cường độ cảm xúc tuyệt đối (tức là bất kể cực dương/tiêu cực) trên mỗi cảnh quay trong đoạn giới thiệu (đúng). Theo thiết lập thử nghiệm của chúng tôi, chúng tôi lại ánh xạ các cảnh quay trong đoạn giới thiệu phim với các cảnh phim dựa trên sự tương đồng về mặt hình ảnh và xem xét điểm cảm tính tương ứng do mạng của chúng tôi dự đoán. Sau đó, chúng tôi phân đoạn đoạn giới thiệu thành ba phần bằng nhau và tính toán cường độ cảm xúc tuyệt đối trung bình trên mỗi phần. Bảng 8 trình bày kết quả. Đúng như dự đoán, trung bình phần thứ hai có cường độ cảm xúc ít mãnh liệt nhất, trong khi phần thứ ba có cường độ cảm xúc cao nhất. Cuối cùng, khi chúng tôi lại phân đoạn mỗi đoạn giới thiệu thành ba phần bằng nhau và đo lường luồng cảm xúc từ phần này sang phần tiếp theo, chúng tôi nhận thấy rằng 46,67% đoạn giới thiệu có hình chữ "V", tương tự như điều kiện cảm tính của chúng tôi khi tạo đoạn giới thiệu đề xuất bằng GRAPHTRAILER .


Ví dụ về các bước đi trong GRAPHTRAILER Chúng tôi trình bày trong Hình 5 và 6 một ví dụ thực tế về cách GRAPHTRAILER vận hành trên biểu đồ (cảnh quay) thưa thớt cho bộ phim ”The Shining”. Ở đây, chúng tôi hiển thị hoạt động bên trong của thuật toán trên một biểu đồ được cắt bớt thêm để hiển thị rõ hơn (Bước 1; Hình 5), trong khi trên thực tế, chúng tôi sử dụng biểu đồ đầy đủ làm đầu vào cho GRAPHTRAILER.


Hình 5. Chạy thuật toán GRAPHTRAILER cho phim “The Shining”. Bước 1 minh họa biểu đồ cấp độ cảnh quay (được cắt bớt để hiển thị rõ hơn) với các nút màu đại diện cho các loại TP khác nhau được dự đoán trong phim (tức là TP1, TP2, TP3, TP4, TP5). Thuật toán của chúng tôi bắt đầu bằng cách lấy mẫu một cảnh quay được xác định là TP1 bởi VIDEOGRAPH (Bước 1). Đối với mỗi bước tiếp theo, chúng tôi chỉ xem xét vùng lân cận ngay lập tức của cảnh quay hiện tại (tức là 6–12 người hàng xóm) và chọn cảnh quay tiếp theo dựa trên các tiêu chí sau: (1) sự tương đồng về ngữ nghĩa, (2) khoảng cách về thời gian, (3) tường thuật cấu trúc và (4) cường độ tình cảm (Bước 2-4). Thuật toán của chúng tôi tiếp tục trong Hình 6.


Chúng tôi bắt đầu với những cảnh quay đã được xác định là TP1 (tức là "Cơ hội"; sự kiện giới thiệu câu chuyện). Chúng tôi lấy mẫu một ảnh (tức là các nút màu xanh lục sáng trong biểu đồ) và khởi tạo đường dẫn của chúng tôi. Đối với các bước tiếp theo (2–7; trên thực tế, chúng tôi thực hiện tối đa 10 bước nhưng chúng tôi đã loại trừ một số bước để cho ngắn gọn), chúng tôi chỉ kiểm tra vùng lân cận ngay lập tức của nút hiện tại và chọn lần chụp tiếp theo để đưa vào đường dẫn dựa trên trên các tiêu chí sau: (1) sự mạch lạc về ngữ nghĩa, (2) khoảng cách về thời gian, (3) cấu trúc tường thuật và (4) cường độ tình cảm. Chúng tôi cung cấp thêm chi tiết về cách chúng tôi chính thức hóa và kết hợp các tiêu chí này trong Phần 3.1.


Chúng tôi nhận thấy rằng thuật toán của chúng tôi cố gắng bám sát các sự kiện quan trọng (các nút màu) trong khi tạo đường dẫn, điều đó có nghĩa là chúng tôi giảm xác suất chọn các cảnh quay ngẫu nhiên không liên quan đến câu chuyện chính. Cuối cùng, ở Bước 8, Hình 6, chúng tôi tập hợp đoạn giới thiệu đề xuất bằng cách ghép tất cả các cảnh quay trong đường dẫn được truy xuất. Chúng tôi cũng minh họa đường dẫn trong biểu đồ (tức là đường màu đỏ).


Ưu điểm trong cách tiếp cận của chúng tôi là nó dễ hiểu và có thể dễ dàng sử dụng như một công cụ có sự tham gia của con người. Cụ thể, với vùng lân cận ngay lập tức ở mỗi bước, người ta có thể chọn ảnh dựa trên các tiêu chí tự động khác nhau hoặc thậm chí theo cách thủ công. Cách tiếp cận của chúng tôi giảm đáng kể số lượng cảnh quay cần xem xét để tạo chuỗi đoạn giới thiệu xuống còn 10% thời lượng phim. Hơn nữa, tiêu chí của chúng tôi cho phép người dùng khám phá các phần khác nhau của phim và tạo các đoạn giới thiệu đa dạng.

Hình 6. Chúng tôi tiếp tục xây dựng đường đi của đoạn giới thiệu bằng cách chọn cảnh quay tiếp theo từ vùng lân cận dựa trên các tiêu chí có thể hiểu được (Bước 5–7). Cuối cùng, chúng tôi tập hợp đoạn giới thiệu đề xuất bằng cách ghép các cảnh quay trong đường dẫn. Thuật toán của chúng tôi cho phép người dùng xem xét các bức ảnh ứng cử viên ở mỗi bước và chọn thủ công bức ảnh đẹp nhất trong khi tính đến các tiêu chí của chúng tôi. GRAPHTRAILER cho phép người dùng tạo đoạn giới thiệu bằng cách chỉ xem lại khoảng 10% bộ phim dựa trên các đề xuất có thể hiểu được (ví dụ: sự mạch lạc với cảnh quay trước đó, mức độ liên quan đến câu chuyện hoặc cường độ).


Bài viết này có sẵn trên arxiv theo giấy phép CC BY-SA 4.0 DEED.


[10] https://archive.nytimes.com/www.nytimes.com/interactive/2013/02/19/movies/ Awardsseason/oscar-trailers.html?_r=0


[11] https://www.derek-lieu.com/blog/2017/9/10/the ma trận-is-a-trailer-editors-dream