Tác giả:
(1) Yigit Ege Bayiz, Kỹ thuật Điện và Máy tính Đại học Texas tại Austin Austin, Texas, Hoa Kỳ (Email: [email protected]);
(2) Ufuk Topcu, Kỹ thuật hàng không vũ trụ và Cơ học kỹ thuật Đại học Texas tại Austin Austin, Texas, Hoa Kỳ (Email: [email protected]).
Prebunking tạm thời cách đều nhau
Kết luận và tài liệu tham khảo
Chúng tôi phân loại các phương pháp chống thông tin sai lệch thành bốn loại, kiểm duyệt, vạch trần, vạch trần và nhận dạng. Ba loại đầu tiên đều cố gắng giảm tác động của thông tin sai lệch. Kiểm duyệt đề cập đến bất kỳ phương pháp nào nhằm mục đích hạn chế sự lan truyền thông tin sai lệch bằng cách cố gắng kiểm soát việc truyền bá thông tin trên mạng [7], [8]. Kiểm duyệt là vấn đề phổ biến trên các nền tảng mạng xã hội, tuy nhiên nó đặt ra những vấn đề quan trọng liên quan đến quyền tự do ngôn luận.
Việc vạch trần đề cập đến việc sửa thông tin sai lệch bằng cách cung cấp cho người dùng thông tin chính xác sau khi thông tin sai lệch đã lan truyền, trong khi việc vạch trần đề cập đến việc cung cấp thông tin chính xác trước khi thông tin sai lệch lan truyền. Một ví dụ tự động về việc vạch trần là nhiều phương pháp xác minh thông tin tự động đều nhằm mục đích vạch trần nội dung văn bản chứa thông tin sai lệch [9], [10]. Sự hiểu biết hiện tại về tâm lý xã hội cho thấy việc vạch trần vượt trội hơn so với vạch trần về tính hiệu quả trong việc chống lại thông tin sai lệch [4], [6], [11]. Trong bài viết này, chúng tôi góp phần tự động hóa quá trình cài sẵn bằng cách phát triển các thuật toán để tự động tối ưu hóa thời gian phân phối prebunk cho người dùng trên nền tảng mạng xã hội.
Nhận dạng đề cập đến bất kỳ phương pháp nào nhằm phát hiện nội dung thông tin sai lệch trong mạng xã hội. Các mô hình này thường sử dụng các mô hình xử lý ngôn ngữ tự nhiên [12], [13]. Del Vicario và cộng sự. [14] đã chỉ ra rằng đặc điểm lan truyền của thông tin sai lệch cho phép phát hiện mà không cần dựa vào phân loại nội dung. Gần đây hơn, Shaar et al. [15] giới thiệu một phương pháp để xác định các tuyên bố đã được kiểm chứng thực tế. Trong bài viết này, chúng tôi không trực tiếp sử dụng tính năng phát hiện thông tin sai lệch. Tuy nhiên, chúng tôi cho rằng chúng tôi đã biết nội dung thông tin sai lệch, do đó việc phát hiện thông tin sai lệch một cách chính xác vẫn là điều kiện tiên quyết cho các phương pháp mà chúng tôi trình bày.
Việc xác định thời gian tối ưu cho việc phân phối trước đòi hỏi phải ước tính chính xác thời điểm thông tin sai lệch sẽ đến tay người dùng quan tâm. Ước tính này đòi hỏi một mô hình lan truyền tin đồn. Trong bài báo này, chúng tôi chủ yếu dựa vào các mô hình dịch bệnh [16], còn được gọi là mô hình ngăn, để mô hình hóa việc truyền bá thông tin sai lệch. Đúng như tên gọi của chúng, các mô hình này dựa trên dịch tễ học và mô hình lan truyền tin đồn bằng cách phân chia người dùng thành các danh mục khác nhau, chẳng hạn như dễ bị tổn thương hoặc bị nhiễm bệnh, sau đó xác định các quy tắc mà các phân vùng này tương tác theo thời gian. Có rất nhiều mô hình dịch bệnh được sử dụng trong mô hình thông tin sai lệch [17]. Nhiều nhất trong số này là các mẫu SI [18], SIR [19], [20], SIS [21], [22]. Các mô hình SI (dễ bị lây nhiễm) rất dễ lập mô hình và thường là mô hình duy nhất cho phép phân tích bằng các mô hình đồ thị tùy ý. SIR (được phục hồi dễ bị lây nhiễm) và SIS (có thể bị lây nhiễm-nhạy cảm) tinh chỉnh mô hình SI, làm cho chúng chính xác hơn mà không tạo ra độ phức tạp tính toán đáng kể cho mô phỏng. Bất chấp những cải tiến này, việc truyền bá SI vẫn được sử dụng do tính đơn giản của nó và do có hành vi tương đương với các mô hình SIS và SIR trong giai đoạn đầu của việc truyền bá thông tin sai lệch, đây là giai đoạn quan trọng nhất để chống lại thông tin sai lệch. Trong suốt bài viết này, chúng tôi sử dụng mô hình SI để ước tính mức độ lan truyền thông tin sai lệch.
Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.