Bài viết này có sẵn trên arxiv theo giấy phép CC BY-NC-SA 4.0 DEED.
tác giả:
(1) Yejin Bang, Trung tâm Nghiên cứu Trí tuệ Nhân tạo (CAiRE), Đại học Khoa học và Công nghệ Hồng Kông;
(2) Nayeon Lee, Trung tâm Nghiên cứu Trí tuệ Nhân tạo (CAiRE), Đại học Khoa học và Công nghệ Hồng Kông;
(3) Pascale Fung, Trung tâm Nghiên cứu Trí tuệ Nhân tạo (CAiRE), Đại học Khoa học và Công nghệ Hồng Kông.
Định kiến đóng khung đóng một vai trò quan trọng trong việc làm trầm trọng thêm sự phân cực chính trị bằng cách bóp méo nhận thức về các sự kiện thực tế. Các phương tiện truyền thông có quan điểm chính trị khác nhau thường sử dụng ngôn ngữ phân cực khi đưa tin về cùng một sự kiện. Chúng tôi đề xuất một hàm mất mát mới khuyến khích mô hình giảm thiểu chênh lệch phân cực giữa các vật phẩm đầu vào phân cực để giảm độ lệch khung. Cụ thể, sự mất mát của chúng tôi được thiết kế để cùng tối ưu hóa mô hình nhằm ánh xạ các đầu phân cực theo hai chiều. Kết quả thử nghiệm của chúng tôi chứng minh rằng việc kết hợp tổn thất giảm thiểu phân cực được đề xuất sẽ dẫn đến giảm đáng kể độ lệch khung khi so sánh với mô hình tóm tắt đa tài liệu dựa trên BART. Đáng chú ý, chúng tôi nhận thấy rằng hiệu quả của phương pháp này thể hiện rõ nhất khi mô hình được huấn luyện để giảm thiểu sự mất phân cực liên quan đến sai lệch khung thông tin (tức là lựa chọn thông tin sai lệch để báo cáo).
Định kiến thiên vị đã trở thành một vấn đề phổ biến trong các phương tiện truyền thông hiện đại, làm hiểu sai lệch sự hiểu biết về những gì thực sự đã xảy ra thông qua việc lựa chọn sai lệch thông tin và ngôn ngữ (Entman, 2007, 2010; Gentzkow và Shapiro, 2006). Tác động đáng chú ý nhất của định kiến thiên vị là sự phân cực ngày càng tăng giữa các đảng chính trị xung đột và các cơ quan truyền thông. Giảm thiểu sai lệch trong khuôn khổ là rất quan trọng để thúc đẩy việc cung cấp thông tin chính xác và khách quan.
Một mô hình giảm nhẹ đầy hứa hẹn là tạo ra một phiên bản trung hòa của một bài báo bằng cách tổng hợp nhiều lượt xem từ các bài báo có nguồn sai lệch (Sides, 2018; Lee và cộng sự, 2022). Để đạt được sự trung hòa tin tức hiệu quả hơn, chúng tôi giới thiệu một tổn thất giảm thiểu phân cực nhằm thúc đẩy sai lệch quy nạp nhằm khuyến khích mô hình ưu tiên tạo ra sự khác biệt về phân cực ở mức tối thiểu. Sự mất mát được đề xuất của chúng tôi huấn luyện mô hình có khả năng ánh xạ các bài viết đồng thời tốt từ đầu này của phổ phân cực đến đầu kia của phổ và ngược lại như được minh họa trong Hình 1. Theo trực giác, mô hình buộc phải tìm hiểu và tập trung vào khía cạnh được chia sẻ giữa các cực tương phản từ hai đầu đối diện.
Trong công việc này, chúng tôi chứng minh tính hiệu quả của hàm mất mát được đề xuất bằng cách giảm thiểu tính phân cực trong các khía cạnh khác nhau của sai lệch khung – từ vựng và thông tin (Entman, 2002). Sự phân cực từ vựng là kết quả của việc lựa chọn các từ có hóa trị và kích thích khác nhau để giải thích cùng một thông tin (ví dụ: "phản đối" và "bạo loạn"). Sự phân cực thông tin là kết quả của việc lựa chọn thông tin khác nhau để đề cập, thường bao gồm những thông tin không cần thiết hoặc không liên quan liên quan đến vấn đề đang được đề cập. Cuộc điều tra của chúng tôi cho thấy rằng việc tìm hiểu các cực đối lập khác biệt về chiều thông tin cho phép mô hình có được khả năng tập trung tốt hơn vào điểm chung và giảm thiểu sai lệch trong các bài viết đầu vào phân cực. Cuối cùng, sự mất mát được đề xuất của chúng tôi cho phép loại bỏ thông tin gây sai lệch và tạo ra các lựa chọn ngôn ngữ trung lập hơn.