paint-brush
Tiêu thụ tin tức và thông tin sai lệch ở châu Âu: Kết quả và thảo luậntừ tác giả@newsbyte
123 lượt đọc

Tiêu thụ tin tức và thông tin sai lệch ở châu Âu: Kết quả và thảo luận

từ tác giả NewsByte.Tech9m2024/06/07
Read on Terminal Reader

dài quá đọc không nổi

Trong bài viết này, các nhà nghiên cứu phân tích mô hình tiêu thụ tin tức ở châu Âu, các nguồn thông tin sai lệch và hành vi của khán giả trên Twitter.
featured image - Tiêu thụ tin tức và thông tin sai lệch ở châu Âu: Kết quả và thảo luận
NewsByte.Tech HackerNoon profile picture
0-item

tác giả:

(1) Anees Baqir, Đại học Ca' Foscari ở Venice, Ý;

(2) Alessandro Galeazzi, Đại học Ca' Foscari ở Venice, Ý;

(3) Fabiana Zollo, Đại học Ca' Foscari ở Venice, Ý và Viện Mới về Nhân văn Môi trường, Ý.

Bảng liên kết

3. Kết quả và thảo luận

Trong phần này, chúng tôi trình bày kết quả phân tích của chúng tôi, được tổ chức như sau. Đầu tiên, chúng tôi cung cấp cái nhìn tổng quan về bối cảnh thông tin ở một số quốc gia Châu Âu được chọn trong ba năm. Bước này rất quan trọng để xác định các chủ đề chính được chia sẻ rộng rãi giữa các quốc gia và phân biệt giữa các nguồn đáng tin cậy và đáng tin cậy, tạo điều kiện cho sự so sánh mạch lạc. Tiếp theo, chúng tôi xem xét cả những điểm tương đồng và khác biệt giữa các quốc gia trong các cuộc thảo luận trực tuyến về các chủ đề này, tập trung vào mức độ tương tác và mô hình tiêu dùng của người dùng.

3.1 Sự phát triển của diễn ngôn công cộng giữa các quốc gia

Để so sánh bối cảnh diễn ngôn công khai ở các quốc gia được chọn, bước đầu tiên của chúng tôi bao gồm việc xác định các chủ đề chung được thảo luận rộng rãi ở cả bốn quốc gia và bởi cả các nguồn đáng tin cậy và đáng tin cậy. Để đạt được mục tiêu này, chúng tôi sử dụng BERTopic(Grootendorst, 2022) để thực hiện lập mô hình chủ đề về nội dung do tài khoản của các hãng tin tức tạo ra trong khoảng thời gian ba năm (xem Phần 2 để biết thêm chi tiết). Để xác định các chủ đề phù hợp cho phân tích của chúng tôi, chúng tôi chia tập dữ liệu theo năm, theo quốc gia và chạy thuật toán BERTopic trên mỗi tập hợp con. Kết quả được báo cáo trong Hình 1 cho thấy các chủ đề được tranh luận nhiều nhất mỗi năm theo quốc gia và danh mục nguồn. Quy mô của mỗi chủ đề thể hiện số lượng nguồn tin tức đóng góp cho nó, trong khi vị trí của nó phản ánh mức độ liên quan của nó với các chủ đề bao quát. Sơ đồ luồng cho thấy mức độ phổ biến của chủ đề trên các kênh tin tức theo thời gian.


Hình 1 nêu bật mức độ chú ý của các hãng tin tới các chủ đề khác nhau ở các quốc gia và loại nguồn tin tức khác nhau như thế nào. Đáng chú ý, ngoài một số chủ đề được quan tâm chung, các cơ quan báo chí có xu hướng ưu tiên các chủ đề liên quan đến quốc gia như biểu tình, ảnh hưởng của nước ngoài, tôn giáo, ô tô điện, hợp pháp hóa ma túy. Chúng tôi cũng quan sát thấy sự khác biệt trong các chủ đề được đề cập bởi các nguồn đáng tin cậy và đáng ngờ trong cùng một quốc gia. Ví dụ: tỷ lệ các hãng tin đưa tin về vắc xin ngừa vi-rút Corona ở Ý đối với các nguồn đáng tin cậy cao hơn so với các nguồn có vấn đề. Hơn nữa, một số chủ đề nhất định chỉ dành riêng cho một loại nguồn, như "Chuyến bay" (Ý, đáng tin cậy), "Quản lý nước" (Pháp, đáng tin cậy) hoặc "Cuộc đấu tranh của người Palestine" (Anh, nghi vấn). Những phát hiện này chỉ ra rằng mức độ quan tâm bị ảnh hưởng bởi cả quốc gia và loại nguồn được xem xét, trong đó các nguồn có vấn đề thể hiện phạm vi quan tâm rộng hơn và những nguồn đáng tin cậy tập trung nhiều hơn vào các chủ đề chung cho tất cả các quốc gia.


Điều quan trọng là phân tích của chúng tôi nhấn mạnh sự hiện diện của các chủ đề chung giữa các cuộc tranh luận đáng nghi ngờ và đáng tin cậy của tất cả các quốc gia. Cụ thể, ba chủ đề xuất hiện liên tục trong các cuộc tranh luận ở tất cả các quốc gia: “Brexit”(2019), “Coronavirus”(2020) và “Covid Vaccine”(2021). Do đó, trong phân tích tiếp theo, chúng tôi chỉ tập trung vào các chủ đề này để kiểm tra diễn ngôn xuyên quốc gia. Lý do đằng sau lựa chọn này là để làm nổi bật sự khác biệt và tương đồng trong cách các chủ đề này được các hãng tin tức và người dùng từ nhiều quốc gia khác nhau đưa tin và sử dụng, từ đó giảm thiểu tác động của các biến thể theo chủ đề cụ thể đối với phân tích của chúng tôi. Ngoài ra, những chủ đề này đã được thảo luận rộng rãi ở cấp độ Châu Âu, khiến cho phân tích của chúng tôi có giá trị để hiểu cách các chủ đề có tầm quan trọng của Châu Âu được nhìn nhận ở các quốc gia khác nhau.


Để nhấn mạnh mức độ liên quan của ba chủ đề đã chọn trong các cuộc tranh luận công khai trực tuyến và xác thực tính chính xác của khung thời gian được chỉ định cho từng chủ đề, chúng tôi tiến hành phân tích tìm kiếm trên Google Xu hướng


Hình 1: Kết quả mô hình hóa chủ đề về nội dung nguồn tin tức đáng tin cậy và đáng tin cậy ở các quốc gia. Quy mô của mỗi chủ đề được xác định bằng tỷ lệ các nguồn tin tức duy nhất đóng góp cho chủ đề đó. Các luồng thể hiện sự thay đổi mối quan tâm của các hãng tin tức về các chủ đề khác nhau theo thời gian.


quan tâm đến Brexit, Vi rút Corona và Vắc xin Covid ở Pháp, Đức, Ý và Vương quốc Anh từ năm 2019 đến năm 2021, như trong Hình 2.


Phân tích của Google Xu hướng xác nhận rằng các chủ đề được chọn đã thu hút sự chú ý cao nhất trong các khung thời gian được chỉ định trong bối cảnh trực tuyến rộng hơn. Do đó, trong tương lai, phân tích của chúng tôi tập trung vào ba chủ đề này (Brexit, Virus Corona và Vắc xin Covid) để xem xét sự khác biệt và tương đồng trong việc sản xuất và tiêu thụ tin tức trong bối cảnh Châu Âu. Để tiến hành phân tích riêng về các chủ đề này, chúng tôi lọc dòng thời gian của các hãng tin tức để chỉ chọn các tweet có liên quan đến chủ đề đã chọn trong phạm vi thời gian tương ứng (xem Phần 2 để biết chi tiết).

3.2 Sự tham gia của người dùng và cấu trúc cộng đồng

Chúng tôi tiếp tục nghiên cứu bằng cách so sánh mức độ tương tác với nội dung liên quan đến các chủ đề đã xác định trên nền tảng truyền thông xã hội. Hình 3 cho thấy sự phân bổ các tương tác tweet theo quốc gia, được tính bằng tổng số lượt thích, số lượt tweet lại, trích dẫn và trả lời đối với các nguồn tin tức đáng tin cậy (màu xanh) và các nguồn tin tức có vấn đề (màu cam), do NewsGuard phân loại (xem Phần 2), cho mỗi trong ba chủ đề. Bất chấp những khác biệt nhỏ về mặt địa lý, việc phân bổ tương tác của người dùng hiển thị phân bổ dài hạn tương tự cho cả ba chủ đề, trong đó một số lượng nhỏ tweet nhận được số lượng tương tác lớn trong khi phần lớn nhận được rất ít. Các nguồn tin tức đáng tin cậy thường nhận được nhiều tương tác hơn những nguồn đáng nghi vấn


Hình 2: Phân tích của Google Trends về mức độ quan tâm tìm kiếm đối với Brexit, vi-rút Corona và Vắc-xin Covid ở Pháp, Đức, Ý và Vương quốc Anh từ năm 2019 đến năm 2021. Các biểu đồ hiển thị mức độ quan tâm tìm kiếm đối với từng chủ đề phát triển theo thời gian, với mỗi hàng đại diện cho một chủ đề . Xu hướng quan tâm cho thấy Brexit phổ biến nhất vào năm 2019, sau đó giảm mạnh vào năm 2020 và 2021 với một số ngoại lệ vào cuối năm 2020. Virus Corona đạt đỉnh điểm vào đầu năm 2020 và suy giảm sau đó, trong khi Covid Vaccine đạt đà vào đầu năm 2021, đạt mức tối đa. vào giữa năm 2021 và chứng kiến một đợt tăng đột biến khác vào cuối năm 2021. Dấu ngoặc thể hiện khoảng thời gian được tính đến khi phân tích cho từng chủ đề.


các nguồn, được thể hiện bằng sự phân bố rộng hơn của chúng dọc theo trục x. Tuy nhiên, vẫn có một số trường hợp ngoại lệ, chẳng hạn như trường hợp của Vương quốc Anh trong các cuộc thảo luận về vắc xin ngừa Covid-19 và trường hợp của Pháp trong các cuộc tranh luận về vi rút Corona. Hơn nữa, trong diễn ngôn về Brexit, các nguồn đáng nghi vấn có sự hiện diện đáng chú ý ở phần cuối của sự phân bổ ở Đức và Ý, mặc dù chúng ít nổi bật hơn trong các cuộc thảo luận khác. Nhìn chung, sự hiện diện của các nguồn nghi vấn và sự tham gia mà chúng tạo ra có thể khác nhau, tùy thuộc vào cả quốc gia và chủ đề cụ thể đang được xem xét.


Sau đó, chúng tôi chuyển sự chú ý sang các mô hình tiêu thụ tin tức để làm nổi bật sự khác biệt và tương đồng về khán giả của các hãng tin tức. Phân tích dữ liệu Twitter về Brexit, Vi rút Corona và Vắc xin Covid, chúng tôi khám phá xem liệu các hãng tin tức cùng loại có được khán giả tương tự sử dụng hay không. Chúng tôi xác định số liệu dựa trên độ tương tự cosine (xem Phần 2) trên những người đăng lại để định lượng độ tương tự giữa các hãng tin tức về mặt khán giả. Các hãng tin tức chia sẻ tỷ lệ người tweet lại cao có giá trị số liệu tương tự cao hơn (gần bằng 1), trong khi các hãng tin chỉ có một số người chia sẻ lại có giá trị tương tự thấp (gần bằng 0).


Sau đó, chúng tôi xây dựng một mạng vô hướng trong đó các đầu ra tin tức được thể hiện dưới dạng các nút và các cạnh có trọng số cho biết mức độ tương tự giữa chúng. Chúng tôi tạo một mạng cho mỗi quốc gia và chủ đề được xem xét để có thể so sánh công bằng. Các mạng kết quả được hiển thị trong Hình 4. Để chỉ làm nổi bật các kết nối mạnh hơn, chúng tôi loại bỏ các cạnh có trọng số thấp hơn mức trung bình tổng thể của các cạnh của mỗi mạng (xem Hình 1 và 2 của SI để biết kết quả với các mạng hoàn chỉnh).


Chúng tôi có thể quan sát các biến thể trong cấu trúc mạng tùy thuộc vào quốc gia và chủ đề đang được xem xét. Thật vậy, Pháp, Đức và Ý có xu hướng hiển thị một nhóm nguồn có vấn đề có thể xác định rõ ràng (hình tam giác màu cam), cho thấy sự hiện diện của các cộng đồng chủ yếu sử dụng nội dung có vấn đề. Ở Anh, sự khác biệt này ít rõ ràng hơn. Khi xem xét sự khác biệt theo từng chủ đề cụ thể, chúng tôi thấy rằng đối với tất cả các quốc gia ngoại trừ Vương quốc Anh, các mạng có xu hướng thưa thớt hơn, với mật độ biên thấp hơn, trong trường hợp Brexit. Đối với các cuộc thảo luận về Vi rút Corona và Vắc xin Covid, các mạng được kết nối nhiều hơn và có mật độ biên cao hơn (xem Bảng 2 của SI). Điều này được thể hiện ở sự tách biệt giữa các nguồn tin đáng tin cậy và đáng tin cậy: trong cuộc tranh luận về Brexit, sự tách biệt giữa hai loại tin tức có vẻ rõ ràng hơn, trong khi ở các cuộc tranh luận khác, chúng có số lượng kết nối cao hơn, như thể hiện trong Bảng 3 của SI. . Để định lượng hành vi này hơn nữa, chúng tôi áp dụng khả năng phân loại danh nghĩa đã điều chỉnh cho các mạng của mình (Karimi và Oliveira, 2022), cho thấy rằng mức độ phân loại danh nghĩa cao hơn đã đạt được trong bối cảnh cuộc tranh luận về Brexit. Tuy nhiên, Vương quốc Anh thể hiện hành vi khác, có thể do nước này trực tiếp tham gia vào cuộc tranh luận.


Hình 3: Phân bổ các tương tác tweet theo quốc gia đối với các nguồn tin tức đáng tin cậy (màu xanh) và nghi vấn (màu cam) xung quanh Brexit (hàng trên cùng), Virus Corona (hàng giữa) và Vắc xin Covid (hàng dưới cùng). Tương tác Tweet được tính bằng tổng số lượt thích, lượt tweet lại, trích dẫn và nhận xét mà mỗi tweet nhận được.


Phân tích của chúng tôi cũng cho thấy rằng không có sự tách biệt tuyệt đối giữa các hãng tin đáng tin cậy và đáng tin cậy. Điều này cho thấy rằng một số người dùng chủ yếu hoặc độc quyền sử dụng nội dung đáng tin cậy hoặc có vấn đề, trong khi những người khác có chế độ ăn tin tức hỗn hợp, tiêu thụ cả hai loại với tỷ lệ khác nhau. Để tìm hiểu sâu hơn về câu hỏi này, chúng tôi phân tích tỷ lệ tin tức nghi vấn được mỗi người dùng sử dụng và trình bày mức phân bổ trong Hình 5. Kết quả chỉ ra rằng phần lớn người dùng trong mỗi cuộc tranh luận chủ yếu dựa vào các nguồn tin tức đáng tin cậy (xem thêm Bảng 4 của SI ). Tuy nhiên, trong mọi cuộc tranh luận, có một bộ phận nhỏ nhưng đáng chú ý người dùng chỉ tán thành những tin tức có vấn đề, mặc dù với mức độ nổi bật khác nhau. Đáng chú ý, Hình mô tả sự phân bố hai chiều đặc biệt, với rất ít người dùng nằm ngoài các cực của quang phổ. Những người dùng này đóng một vai trò quan trọng trong việc thu hẹp khoảng cách giữa tin tức đáng ngờ và tin tức đáng tin cậy trong các mạng tương tự. Hơn nữa, các nguồn tin tức đáng tin cậy có xu hướng chiếm vị trí cốt lõi của mạng, trong khi các nguồn có vấn đề thường nằm ở các vị trí ngoại vi hơn. Thật vậy, trong số 25 nguồn hàng đầu được xác định bằng thuật toán PageRank trong mỗi mạng (Bakshy và cộng sự, 2011), phần lớn đáng kể (ít nhất 95,3%) được coi là nguồn tin tức đáng tin cậy (xem SI để biết thêm chi tiết). Chúng tôi kết thúc phân tích của mình bằng cách kiểm tra cấu trúc cộng đồng của các mạng tương tự. Chúng tôi thực hiện phát hiện cộng đồng bằng cách sử dụng phân cụm Louvain


Hình 4: Mạng lưới tương tự giữa các hãng tin tức, trong đó mỗi nguồn tin tức được thể hiện dưới dạng một nút và các cạnh thể hiện sự tương đồng của khán giả giữa các hãng tin tức. Màu sắc và hình dạng của các nút biểu thị sự phân loại của nguồn tin tức và độ dày của các cạnh thể hiện mức độ tương tự của người tweet lại giữa hai nguồn tin tức. Chúng tôi đã loại bỏ các cạnh có trọng số thấp hơn mức trung bình tổng thể của các cạnh. Mỗi mạng thể hiện sự tương đồng của các hãng tin tức về một chủ đề đối với một quốc gia.


thuật toán (Blondel và cộng sự, 2008) và báo cáo kết quả trong Hình 6. Các cụm được mã hóa màu dựa trên tỷ lệ các cửa hàng tin tức có vấn đề, với các màu tối hơn cho thấy tỷ lệ nguồn có vấn đề cao hơn.


Trên tất cả các quốc gia và chủ đề, phần lớn các cụm chủ yếu bao gồm các hãng tin tức đáng tin cậy và trong các cụm này, chúng tôi cũng tìm thấy các nút quan trọng nhất theo phân loại PageRank. Tuy nhiên, phân tích của chúng tôi cũng cho thấy sự hiện diện của các cụm nhỏ với tỷ lệ cao các hãng tin đáng nghi vấn. Số lượng và quy mô của các cụm này khác nhau tùy theo quốc gia và chủ đề. Ví dụ, ở Đức và Ý, có một cụm như vậy cho mỗi chủ đề, trong khi trong cuộc tranh luận về Brexit ở Pháp, có hai cụm. Ở Anh, sự phân chia ít rõ ràng hơn, không có cụm nào có tỷ lệ tin tức đáng nghi vấn cao. Chúng tôi cũng nhận thấy rằng các cụm đáng tin cậy có xu hướng có kích thước nhỏ hơn nhưng số lượng nhiều hơn, trong khi các cụm nghi vấn có xu hướng lớn hơn và thường là duy nhất trong mỗi mạng. Điều này cho thấy rằng người dùng xem nội dung có vấn đề có xu hướng xác nhận hầu hết các nguồn có vấn đề của mạng, trong khi người tiêu dùng tin tức đáng tin cậy tập trung vào ít hãng tin tức hơn.


Nhìn chung, phân tích của chúng tôi cung cấp cái nhìn theo chiều dọc về bối cảnh tiêu thụ tin tức trực tuyến ở các quốc gia được chọn, nêu bật ưu thế của các nguồn tin tức đáng tin cậy, đồng thời tiết lộ sự hiện diện của các cụm có tỷ lệ nguồn tin tức đáng nghi vấn cao hơn ở nhiều quốc gia và chủ đề. Sự tồn tại của các cụm như vậy cho thấy sự hiện diện của một nhóm người dùng tiêu thụ nội dung từ nhiều nguồn đáng ngờ trong khi tránh những nguồn đáng tin cậy. Hành vi này phù hợp với sự hiện diện tiềm tàng của buồng vang, một hiện tượng được quan sát rộng rãi trong các cuộc tranh luận trực tuyến (Cinelli và cộng sự, 2021; Falkenberg và cộng sự, 2022; Cota và cộng sự, 2019).


Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.