tác giả:
(1) Xiaohan Ding, Khoa Khoa học Máy tính, Virginia Tech, (e-mail: [email protected]);
(2) Mike Horning, Phòng Truyền thông, Virginia Tech, (e-mail: [email protected]);
(3) Eugenia H. Rho, Khoa Khoa học Máy tính, Virginia Tech, (e-mail: [email protected] ).
Nghiên cứu 2: Những từ mô tả sự phân cực ngữ nghĩa giữa Fox News và CNN năm 2020
Với sự phát triển của tin tức trực tuyến trong thập kỷ qua, các nghiên cứu thực nghiệm về diễn ngôn chính trị và tiêu thụ tin tức đã tập trung vào hiện tượng bong bóng lọc và buồng phản âm. Tuy nhiên, gần đây, các học giả đã tiết lộ ít bằng chứng xung quanh tác động của hiện tượng như vậy, khiến một số người lập luận rằng sự phân biệt đảng phái đối với khán giả tin tức không thể được giải thích đầy đủ chỉ bằng việc tiêu thụ tin tức trực tuyến và vai trò của các phương tiện truyền thông truyền thống có thể nổi bật trong việc phân cực diễn ngôn công chúng. xung quanh các sự kiện hiện tại. Trong công việc này, chúng tôi mở rộng phạm vi phân tích để bao gồm cả phương tiện truyền thông trực tuyến và truyền thống hơn bằng cách điều tra mối quan hệ giữa ngôn ngữ truyền thông tin tức và diễn ngôn trên mạng xã hội. Bằng cách phân tích giá trị của phụ đề chi tiết trong một thập kỷ (2,1 triệu lượt diễn giả) từ CNN và Fox News cùng với diễn ngôn tương ứng theo chủ đề từ Twitter, chúng tôi cung cấp một khuôn khổ mới để đo lường sự phân cực ngữ nghĩa giữa hai mạng phát sóng lớn của Mỹ để chứng minh mức độ phân cực ngữ nghĩa giữa các kênh này đã phát triển (Nghiên cứu 1), đạt đến đỉnh điểm (Nghiên cứu 2) và ảnh hưởng đến các cuộc thảo luận đảng phái trên Twitter (Nghiên cứu 3) trong suốt thập kỷ qua. Kết quả của chúng tôi chứng minh sự phân cực tăng mạnh về cách thảo luận các từ khóa quan trọng theo chủ đề giữa hai kênh, đặc biệt là sau năm 2016, với mức cao nhất nói chung xảy ra vào năm 2020. Hai đài thảo luận về các chủ đề giống nhau trong bối cảnh hoàn toàn khác biệt vào năm 2020, đến mức có hầu như không có sự trùng lặp về mặt ngôn ngữ trong cách thảo luận về ngữ cảnh của các từ khóa giống hệt nhau. Hơn nữa, chúng tôi chứng minh ở quy mô lớn, sự phân chia đảng phái như vậy trong ngôn ngữ truyền thông phát sóng định hình đáng kể xu hướng phân cực ngữ nghĩa trên Twitter (và ngược lại), lần đầu tiên liên kết theo kinh nghiệm, các cuộc thảo luận trực tuyến bị ảnh hưởng như thế nào bởi truyền thông truyền hình. Chúng tôi cho thấy ngôn ngữ đặc trưng cho các câu chuyện truyền thông đối lập về các sự kiện tin tức tương tự trên TV có thể làm tăng mức độ diễn ngôn đảng phái trực tuyến như thế nào. Cuối cùng, công việc của chúng tôi có ý nghĩa về việc sự phân cực truyền thông trên TV đóng một vai trò quan trọng như thế nào trong việc cản trở thay vì hỗ trợ diễn ngôn dân chủ trực tuyến.
Phương tiện thông tin đại chúng đóng một vai trò quan trọng trong các quá trình dân chủ bằng cách ảnh hưởng đến cách các thể chế vận hành, các nhà lãnh đạo chính trị giao tiếp và quan trọng nhất là cách người dân tham gia vào chính trị (McLeod, Scheufele và Moy 1999). Mặc dù không có gì ngạc nhiên khi hai phe chính trị ở Mỹ nói những ngôn ngữ khác nhau (Westfall và cộng sự 2015), nghiên cứu cũng chỉ ra rằng ngôn ngữ đảng phái trên các phương tiện truyền thông tin tức đã tăng mạnh trong những năm gần đây, đặc biệt là trong tin tức phát sóng (Horning 2018). Điều này đáng lo ngại vì việc tiêu thụ tin tức là rất quan trọng để giúp công chúng hiểu được các sự kiện xung quanh họ. Theo Lý thuyết Thiết lập Chương trình nghị sự, ngôn ngữ được các phương tiện truyền thông sử dụng để định hình và trình bày các sự kiện hiện tại sẽ tác động đến cách công chúng nhìn nhận những vấn đề nào là quan trọng (McCombs 1997; Russell Neuman và cộng sự 2014).
Trong khi một số người có thể có ấn tượng rằng các phương tiện truyền thông chính thống truyền thống đang giảm dần mức độ phù hợp trong bối cảnh sự phát triển bùng nổ của tin tức trực tuyến qua các trang web và mạng xã hội, lượng tiêu thụ tin tức ở Mỹ vẫn chủ yếu đến từ truyền hình, chiếm gần gấp 5 lần lượng tiêu thụ tin tức trực tuyến trên toàn công chúng. (Allen và cộng sự 2020). Bất chấp quan điểm cho rằng việc xem tin tức trên truyền hình “thụ động” hơn đọc tin tức, nghiên cứu cho thấy mọi người có xu hướng nhớ lại tin tức trên truyền hình tốt hơn tin tức trực tuyến (Eveland, Seo và Marton 2002). Hơn nữa, một nghiên cứu gần đây so sánh việc xem truyền hình và xem tin tức trên internet cho thấy số người Mỹ theo đảng phái qua TV nhiều gấp 4 lần so với qua tin tức trực tuyến. Trên thực tế, khán giả xem tin tức truyền hình có nhiều khả năng duy trì chế độ ăn tin tức theo đảng phái của họ theo thời gian và nguồn của họ bị thu hẹp hơn nhiều trong khi ngay cả những người đọc tin tức trực tuyến theo đảng phái cũng có xu hướng xem từ nhiều nguồn khác nhau (Muise và cộng sự 2022).
Tuy nhiên, các nghiên cứu về sự phân cực của phương tiện truyền thông và diễn ngôn công khai tiếp theo chủ yếu dựa trên nội dung trực tuyến (Garimella và cộng sự 2021). Ví dụ: ngay cả nghiên cứu phân tích dữ liệu từ các hãng tin tức truyền thống cũng chỉ dựa vào các tweet từ tài khoản Twitter chính thức của các tờ báo, chương trình truyền hình và chương trình phát thanh thay vì sao chép trực tiếp nội dung từ các nguồn truyền thông cũ này (Recuero, Soares và Gruzd 2020). Điều này là do thực tế là không giống như thông tin trực tuyến, dữ liệu truyền thông cũ (ví dụ: phụ đề chi tiết) khó thu thập hơn, tồn tại ở các định dạng không tương thích để xử lý trước nhanh chóng (ví dụ: tệp srt) và nằm rải rác trên các tổ chức thiếu động lực chia sẻ dữ liệu với các học giả. Do đó, phần lớn các phương tiện truyền thông truyền thống chính thống ảnh hưởng đến diễn ngôn trực tuyến như thế nào vẫn chưa được biết rõ.
Theo nghĩa đó, phân tích của chúng tôi về giá trị của phụ đề trong một thập kỷ từ các chương trình tin tức truyền hình phát sóng 24 giờ từ hai đài tin tức lớn nhất của Mỹ mang đến một cơ hội duy nhất để chứng minh bằng thực nghiệm sự phân cực ngôn ngữ trong các phương tiện truyền thông phát sóng đã phát triển theo thời gian như thế nào và nó đã tác động đến xã hội như thế nào. diễn ngôn truyền thông. Trong nghiên cứu này, chúng tôi xem xét sự khác biệt về ngữ nghĩa trong ngôn ngữ truyền thông phát sóng đã phát triển như thế nào trong 11 năm qua giữa CNN và Fox News (Nghiên cứu 1), những từ nào là đặc trưng của các đỉnh phân cực ngữ nghĩa trong ngôn ngữ truyền thông phát sóng (Nghiên cứu 2), liệu ngữ nghĩa tính phân cực trong ngôn ngữ tin tức truyền hình dự báo xu hướng phân cực trong diễn ngôn trên mạng xã hội và cách ngôn ngữ đóng vai trò trong việc thúc đẩy các mô hình quan hệ từ mô hình này sang mô hình khác (Nghiên cứu 3).
Trong Nghiên cứu 1, chúng tôi tận dụng các kỹ thuật xử lý ngôn ngữ tự nhiên (NLP) để phát triển một phương pháp nắm bắt một cách định lượng mức độ phân cực ngữ nghĩa giữa CNN và Fox News đã phát triển từ năm 2010 đến năm 2020 bằng cách tính toán độ phân cực ngữ nghĩa của các chủ đề quan trọng về mặt xã hội nhưng lại bị chia rẽ về mặt chính trị ( phân biệt chủng tộc, Black Lives Matter, cảnh sát, nhập cư, biến đổi khí hậu và chăm sóc sức khỏe) được hai kênh tin tức thảo luận. Sau đó, chúng tôi sử dụng kỹ thuật diễn giải mô hình trong học sâu để giải thích về mặt ngôn ngữ những gì có thể thúc đẩy những mức tăng đột biến này bằng cách trích xuất các mã thông báo theo ngữ cảnh có khả năng dự đoán tốt nhất về cách mỗi đài thảo luận về các từ khóa chủ đề vào năm 2020 (Nghiên cứu 2). Để điều tra xem liệu xu hướng đảng phái trong ngôn ngữ truyền thông phát sóng có ảnh hưởng đến mô hình phân cực trong diễn ngôn trên mạng xã hội hay không, chúng tôi sử dụng quan hệ nhân quả Granger để kiểm tra xem liệu sự phân cực ngữ nghĩa giữa hai đài tin tức truyền hình có dự báo sự phân cực trên các khán giả Twitter trả lời @CNN và @FoxNews (Nghiên cứu 3) hay không . Cuối cùng, để hiểu ngôn ngữ thúc đẩy mối quan hệ nhân quả Granger về mức độ ảnh hưởng của xu hướng phân cực ngữ nghĩa trong tin tức truyền hình đến người dùng Twitter (và ngược lại), chúng tôi xác định các mã thông báo có khả năng dự đoán tốt nhất về cách thảo luận các từ khóa theo chủ đề trên TV so với Twitter. , được phân tách bằng độ dài độ trễ tương ứng với ý nghĩa quan hệ nhân quả Granger. Đóng góp của chúng tôi như sau:
• Chúng tôi cung cấp một khuôn khổ mới để định lượng sự phân cực ngữ nghĩa giữa hai thực thể bằng cách xem xét tính tạm thời liên quan đến sự phát triển của sự phân cực ngữ nghĩa theo thời gian. Nghiên cứu trước đây định lượng sự phân cực như một thước đo tổng hợp từ một kết xuất dữ liệu theo chiều dọc duy nhất thường bỏ qua các động lực và bối cảnh thời gian quan trọng xung quanh cách phân cực diễn ra theo thời gian. Khung của chúng tôi kết hợp các biến động theo thời gian bằng cách tính toán các dịch chuyển lịch đại bằng cách sử dụng các từ nhúng theo ngữ cảnh với các tính năng thời gian.
• Khi cho thấy sự phân cực ngữ nghĩa trong phương tiện truyền thông phát sóng đã phát triển như thế nào trong 11 năm qua, chúng tôi không chỉ cung cấp định lượng phân cực đơn thuần như một thước đo bằng cách sử dụng Chuyển màu tích hợp để xác định các mã thông báo thuộc tính làm proxy để hiểu ngôn ngữ ngữ cảnh thúc đẩy sự phát triển năm 2020 về sự phân cực ngữ nghĩa giữa hai đài tin tức.
• Chúng tôi giải quyết câu hỏi liệu sự phân cực trong ngôn ngữ tin tức truyền hình có dự báo xu hướng phân cực ngữ nghĩa trên Twitter hay không và bằng cách nào, cung cấp bằng chứng mới về cách khán giả trực tuyến được định hình trong diễn ngôn của họ bằng ngôn ngữ tin tức truyền hình — một liên kết quan trọng chưa được thiết lập theo kinh nghiệm ở quy mô lớn trong nghiên cứu trước đây.
• Cuối cùng, chúng tôi sử dụng giải thích mô hình để trích xuất các đặc điểm từ vựng từ các thực thể khác nhau, để chỉ ra những từ nào tạo ra các mẫu nhân quả Granger quan trọng trong cách ngôn ngữ truyền thông phát sóng định hình diễn ngôn Twitter và ngược lại, từ đó làm nổi bật cách thức mà ngôn ngữ đóng vai trò quan trọng trong thúc đẩy mối quan hệ phân cực ngữ nghĩa giữa các cuộc thảo luận trực tuyến và ngôn ngữ truyền thông phát sóng.
Phát hiện của chúng tôi là một trong những phát hiện đầu tiên định lượng cách ngôn ngữ đặc trưng cho các câu chuyện truyền thông đối lập về các sự kiện tin tức tương tự trên TV có thể làm tăng mức độ diễn ngôn đảng phái trực tuyến. Kết quả từ công trình này hỗ trợ cho nghiên cứu gần đây về truyền thông, đưa ra giả thuyết rằng cả phương tiện truyền thông và chương trình nghị sự của công chúng đều có thể ảnh hưởng lẫn nhau, và những động lực như vậy có thể phân cực cách thức mà công chúng tham gia vào diễn ngôn, từ đó ảnh hưởng đến việc ra quyết định dân chủ tại- lớn.
Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.