Bài viết này có sẵn trên arxiv theo giấy phép CC BY-NC-SA 4.0 DEED.
tác giả:
(1) Yejin Bang, Trung tâm Nghiên cứu Trí tuệ Nhân tạo (CAiRE), Đại học Khoa học và Công nghệ Hồng Kông;
(2) Nayeon Lee, Trung tâm Nghiên cứu Trí tuệ Nhân tạo (CAiRE), Đại học Khoa học và Công nghệ Hồng Kông;
(3) Pascale Fung, Trung tâm Nghiên cứu Trí tuệ Nhân tạo (CAiRE), Đại học Khoa học và Công nghệ Hồng Kông.
Nghiên cứu bị hạn chế bởi việc tuân thủ thiết lập nhiệm vụ dựa trên tiếng Anh của điểm chuẩn. Việc phân tích bị giới hạn trong các hệ tư tưởng chính trị ở Hoa Kỳ và ngôn ngữ tiếng Anh. Ngoài ra, giới hạn đầu vào mã thông báo phụ 1024 của mô hình BART hạn chế số lượng bài viết nguồn sai lệch có thể được đưa vào làm đầu vào. Điều quan trọng cần lưu ý là những hạn chế này, mặc dù có khả năng ảnh hưởng đến phạm vi kết quả nghiên cứu, nhưng không phải là hiếm trong nghiên cứu xử lý ngôn ngữ tự nhiên. Tuy nhiên, nghiên cứu trong tương lai có thể được hưởng lợi từ việc giải quyết những hạn chế này bằng cách khám phá các phương pháp thay thế cho phạm vi rộng hơn về các hệ tư tưởng chính trị (các hệ tư tưởng chính trị không thuộc Hoa Kỳ) và các ngôn ngữ, cũng như kết hợp các văn bản đầu vào dài hơn để nắm bắt được phạm vi bài viết nguồn toàn diện hơn.
Vấn đề về các bài viết thiên vị có khung đã được nghiên cứu rộng rãi, vì nó có thể dẫn đến sự phân cực bằng cách ảnh hưởng đến quan điểm của người đọc đối với một người, nhóm hoặc chủ đề nhất định. Để giải quyết vấn đề này, nghiên cứu của chúng tôi tập trung vào việc giới thiệu một hàm mất mát có thể được kết hợp để cho phép mô hình giảm sai lệch khung trong bản tóm tắt được tạo.
Tuy nhiên, điều quan trọng là phải nhận ra rằng công nghệ tự động cũng có thể gây ra những hậu quả tiêu cực ngoài ý muốn nếu không được phát triển với sự cân nhắc cẩn thận về tác động rộng hơn của chúng. Ví dụ: các mô hình học máy có thể gây ra sai lệch trong kết quả đầu ra của chúng, thay thế sai lệch nguồn đã biết bằng một dạng sai lệch khác (Lee và cộng sự, 2022). Để giảm thiểu rủi ro này, Lee et al. (2022) đã đề xuất bao gồm việc đề cập rõ ràng đến các bài viết nguồn cùng với các bản tóm tắt trung lập được tạo tự động. Hơn nữa, mặc dù công việc của chúng tôi nhằm mục đích loại bỏ thành kiến đóng khung trong các bài viết do con người tạo ra, nhưng vẫn có khả năng xảy ra ảo giác trong thế hệ, đây là một vấn đề nổi tiếng của các mô hình sáng tạo (Ji và cộng sự, 2023). Vì vậy, điều quan trọng là phải trang bị một lan can bảo vệ (ví dụ: cung cấp tài liệu tham khảo nguồn) nếu công nghệ tự động đó được triển khai cho các trường hợp sử dụng thực tế.
Bất chấp những thách thức này, nghiên cứu của chúng tôi có thể góp phần vào nỗ lực giảm thiểu thành kiến đóng khung do con người tạo ra nhằm giảm sự phân cực trong xã hội. Một trong những trường hợp sử dụng có thể là hỗ trợ các chuyên gia con người trong quá trình cung cấp các bài viết tổng hợp nhiều chế độ xem mà không có sai lệch về khung. Về tác động xã hội rộng hơn, chúng tôi hy vọng công việc của chúng tôi có thể giúp người dùng trực tuyến truy cập nhiều thông tin khử cực hơn trên mạng.
2021. Trung tâm – xếp hạng thiên vị truyền thông "trung tâm" nghĩa là gì?
Ramy Baly, Giovanni Da San Martino, James Glass và Preslav Nakov. 2020. Chúng tôi có thể phát hiện thành kiến của bạn: Dự đoán hệ tư tưởng chính trị của các bài báo. Trong Kỷ yếu của Hội nghị năm 2020 về các phương pháp thực nghiệm trong xử lý ngôn ngữ tự nhiên (EMNLP), trang 4982–4991, Trực tuyến. Hiệp hội ngôn ngữ học tính toán.
Adriana Beratšová, Kristína Krcová, Nikola Gažová và Michal Jirásek. 2016. Định khung và sai lệch: tổng quan tài liệu về những phát hiện gần đây. Tạp chí quản lý Trung Âu, 3(2).
Dennis Chong và James N Druckman. 2007. Lý thuyết đóng khung. Annu. Mục sư Chính trị. Khoa học., 10:103–126.
Robert M Entman. 2002. Định khung: Hướng tới làm rõ một mô hình bị rạn nứt. McQuail's Reader trong lý thuyết truyền thông đại chúng. Luân Đôn, California và New Delhi: Hiền nhân.
Robert M Entman. 2007. Định kiến thiên vị: Truyền thông trong việc phân bổ quyền lực. Tạp chí truyền thông, 57(1):163–173.
Robert M Entman. 2010. Truyền thông đóng khung những thành kiến và quyền lực chính trị: Giải thích sự thiên vị trong tin tức về chiến dịch năm 2008. Báo chí, 11(4):389–408.
Alexander R Fabbri, Irene Li, Tianwei She, Suyi Li và Dragomir R Radev. 2019. Multi-news: Bộ dữ liệu tóm tắt đa tài liệu quy mô lớn và mô hình phân cấp trừu tượng. bản in trước arXiv arXiv:1906.01749
Lisa Fan, Marshall White, Eva Sharma, Ruisi Su, Prafulla Kumar Choubey, Ruihong Huang và Lu Wang. 2019. Rõ ràng: Sự thiên vị của giới truyền thông qua lăng kính đưa tin thực tế. bản in trước arXiv arXiv:1909.02670.
Matthew Gentzkow và Jesse M Shapiro. 2006. Sự thiên vị và danh tiếng của giới truyền thông. Tạp chí Kinh tế Chính trị, 114(2):280–316.
Matthew Gentzkow, Jesse M Shapiro và Daniel F Stone. 2015. Sự thiên vị của giới truyền thông trên thị trường: Lý thuyết. Trong Sổ tay kinh tế truyền thông, tập 1, trang 623–645. Khác.
Erving Goffman. 1974. Phân tích khung: Tiểu luận về tổ chức kinh nghiệm. Nhà xuất bản Đại học Harvard
Felix Hamborg, Karsten Donnay và Bela Gipp. 2019. Tự động xác định xu hướng truyền thông trong các bài báo: đánh giá tài liệu liên ngành. Tạp chí Quốc tế về Thư viện Số, 20(4):391–415.
Felix Hamborg, Norman Meuschke và Bela Gipp. 2017. Tổng hợp tin tức dựa trên ma trận: khám phá các quan điểm tin tức khác nhau. Năm 2017 Hội nghị chung ACM/IEEE về Thư viện số (JCDL), trang 1–10. IEEE.
Ziwei Ji, Nayeon Lee, Rita Frieske, Tiezheng Yu, Dan Su, Yan Xu, Etsuko Ishii, Ye Jin Bang, Andrea Madotto và Pascale Fung. 2023. Khảo sát ảo giác trong việc tạo ra ngôn ngữ tự nhiên. Máy tính ACM. Sống sót., 55(12).
Daniel Kahneman và Amos Tversky. 2013. Lý thuyết triển vọng: Phân tích quyết định có rủi ro. Trong Sổ tay những nguyên tắc cơ bản của việc ra quyết định tài chính: Phần I, trang 99–127. Khoa học thế giới.
Philippe Laban và Marti A Hearst. 2017. newslens: xây dựng và hình dung các câu chuyện tin tức dài hạn. Trong Kỷ yếu các sự kiện và câu chuyện trong Hội thảo Tin tức, trang 1–9.
Nayeon Lee, Yejin Bang, Tiezheng Yu, Andrea Madotto và Pascale Fung. 2022. NeuS: Tóm tắt nhiều tin tức trung lập để giảm thiểu sai lệch trong khuôn khổ. Trong Kỷ yếu Hội nghị năm 2022 của Chi hội Bắc Mỹ của Hiệp hội Ngôn ngữ học Tính toán: Công nghệ Ngôn ngữ Con người, trang 3131–3148, Seattle, Hoa Kỳ. Hiệp hội ngôn ngữ học tính toán.
Mike Lewis, Yinhan Liu, Naman Goyal, Marjan Ghazvininejad, Abdelrahman Mohamed, Omer Levy, Ves Stoyanov và Luke Zettlemoyer. 2019. Bart: Khử nhiễu đào tạo trước theo trình tự để tạo, dịch và hiểu ngôn ngữ tự nhiên. bản in trước arXiv arXiv:1910.13461.
Yujian Liu, Xinliang Frederick Zhang, David Wegsman, Nicholas Beauchamp và Lu Wang. 2022. CHÍNH TRỊ: Đào tạo trước bằng cách so sánh bài viết cùng một câu chuyện để dự đoán hệ tư tưởng và phát hiện lập trường. Trong Những phát hiện của Hiệp hội Ngôn ngữ học tính toán: NAACL 2022, trang 1354–1374, Seattle, Hoa Kỳ. Hiệp hội ngôn ngữ học tính toán.
Saif Mohammad. 2018. Đạt được xếp hạng đáng tin cậy của con người về hóa trị, sự kích thích và sự thống trị đối với 20.000 từ tiếng Anh. Trong Kỷ yếu Hội nghị thường niên lần thứ 56 của Hiệp hội Ngôn ngữ học tính toán (Tập 1: Bài viết dài), trang 174–184.
Fred Morstatter, Liang Wu, Uraz Yavanoglu, Stephen R Corman và Huân Liu. 2018. Xác định định kiến thiên vị trong tin tức trực tuyến. Giao dịch ACM trên điện toán xã hội, 1(2):1–18.
Kishore Papineni, Salim Roukos, Todd Ward và WeiJing Zhu. 2002. Bleu: phương pháp đánh giá tự động dịch máy. Trong Kỷ yếu cuộc họp thường niên lần thứ 40 của Hiệp hội Ngôn ngữ học tính toán, trang 311–318.
Souneil Park, Seungwoo Kang, Sangyoung Chung và Junehwa Song. 2009. Newscube: cung cấp nhiều khía cạnh của tin tức để giảm thiểu sự thiên vị của giới truyền thông. Trong Kỷ yếu của hội nghị SIGCHI về yếu tố con người trong hệ thống máy tính, trang 443–452.
Dietram A Scheufele. 2000. Xem xét lại việc thiết lập chương trình nghị sự, chuẩn bị và định khung: Một cái nhìn khác về tác động nhận thức của truyền thông chính trị. Truyền thông đại chúng và xã hội, 3(2-3):297–316.
Tât cả mọi mặt. 2018. Xếp hạng thiên vị của giới truyền thông. Allsides.com.
Timo Spinde, Christina Kreuter, Wolfgang Gaissmaier, Felix Hamborg, Bela Gipp và Helge Giese. Năm 2021. Bạn có nghĩ nó thiên vị không? làm thế nào để yêu cầu nhận thức về sự thiên vị của giới truyền thông. Hội nghị chung ACM/IEEE về Thư viện số (JCDL) năm 2021, trang 61–69. IEEE.
Esther van den Berg và Katja Markert. 2020. Bối cảnh trong việc phát hiện sai lệch thông tin. Trong Kỷ yếu của Hội nghị quốc tế lần thứ 28 về Ngôn ngữ học tính toán, trang 6315–6326, Barcelona, Tây Ban Nha (Trực tuyến). Ủy ban quốc tế về ngôn ngữ học tính toán.
George Wright và Paul Goodwin. 2002. Loại bỏ định kiến đóng khung bằng cách sử dụng các hướng dẫn đơn giản để 'suy nghĩ kỹ hơn' và những người trả lời có kinh nghiệm quản lý: Bình luận về 'phá vỡ khuôn khổ'. Tạp chí quản lý chiến lược, 23(11):1059–1067.
Jingqing Zhang, Yao Zhao, Mohammad Saleh và Peter J. Liu. 2019a. Pegasus: Huấn luyện trước bằng cách trích xuất các câu còn chỗ trống để tóm tắt một cách trừu tượng.
Tianyi Zhang*, Varsha Kishore*, Felix Wu*, Kilian Q. Weinberger và Yoav Artzi. 2020. Bertscore: Đánh giá việc tạo văn bản bằng bert. Trong Hội nghị quốc tế về đại diện học tập.
Yifan Zhang, Giovanni Da San Martino, Alberto BarrónCedeno, Salvatore Romeo, Jisun An, Haewoon Kwak, Todor Staykovski, Israa Jaradat, Georgi Karadzhov, Ramy Baly, và những người khác. 2019b. Tanbih: Tìm hiểu những gì bạn đang đọc. EMNLP-IJCNLP 2019, trang 223.