Autores:
(1) Xiaohan Ding, Departamento de Ciência da Computação, Virginia Tech, (e-mail: [email protected]);
(2) Mike Horning, Departamento de Comunicação, Virginia Tech, (e-mail: [email protected]);
(3) Eugenia H. Rho, Departamento de Ciência da Computação, Virginia Tech, (e-mail: [email protected]).
Estudo 1: Evolução da Polaridade Semântica na Linguagem dos Meios de Transmissão (2010-2020)
Estudo 2: Palavras que caracterizam a polaridade semântica entre Fox News e CNN em 2020
Discussão e Declaração de Ética
Com o crescimento das notícias online na última década, os estudos empíricos sobre o discurso político e o consumo de notícias concentraram-se no fenómeno das bolhas de filtro e das câmaras de eco. No entanto, recentemente, os estudiosos revelaram evidências limitadas sobre o impacto de tal fenómeno, levando alguns a argumentar que a segregação partidária entre as audiências de notícias não pode ser totalmente explicada apenas pelo consumo de notícias online e que o papel dos meios de comunicação social tradicionais pode ser igualmente saliente na polarização do discurso público. em torno de eventos atuais. Neste trabalho, expandimos o âmbito da análise para incluir tanto os meios de comunicação online como os mais tradicionais, investigando a relação entre a linguagem dos meios de comunicação social e o discurso dos meios de comunicação social. Ao analisar uma década de legendas ocultas (2,1 milhões de turnos de locutor) da CNN e da Fox News, juntamente com o discurso correspondente do Twitter, fornecemos uma nova estrutura para medir a polarização semântica entre as duas principais redes de transmissão da América para demonstrar como a polarização semântica entre esses meios de comunicação evoluiu (Estudo 1), atingiu o pico (Estudo 2) e influenciou discussões partidárias no Twitter (Estudo 3) ao longo da última década. Nossos resultados demonstram um aumento acentuado na polarização na forma como palavras-chave de importância tópica são discutidas entre os dois canais, especialmente depois de 2016, com picos gerais mais altos ocorrendo em 2020. As duas estações discutem tópicos idênticos em contextos drasticamente distintos em 2020, na medida em que há quase não há sobreposição linguística na forma como palavras-chave idênticas são discutidas contextualmente. Além disso, demonstramos, em escala, como essa divisão partidária na linguagem da mídia de transmissão molda significativamente as tendências de polaridade semântica no Twitter (e vice-versa), vinculando empiricamente, pela primeira vez, como as discussões on-line são influenciadas pela mídia televisiva. Mostramos como a linguagem que caracteriza narrativas mediáticas opostas sobre acontecimentos noticiosos semelhantes na televisão pode aumentar os níveis de discurso partidário online. Para este fim, o nosso trabalho tem implicações sobre a forma como a polarização dos meios de comunicação social na televisão desempenha um papel significativo no impedimento, em vez de no apoio, ao discurso democrático online.
Os meios de comunicação social desempenham um papel vital nos processos democráticos, influenciando a forma como as instituições funcionam, os líderes políticos comunicam e, mais importante, como os cidadãos se envolvem na política (McLeod, Scheufele e Moy 1999). Embora não seja surpresa que as duas divisões políticas da América falem línguas diferentes (Westfall et al. 2015), a investigação também mostrou que a linguagem partidária nos meios de comunicação social aumentou acentuadamente nos últimos anos, particularmente nas notícias transmitidas (Horning 2018). Isto é preocupante, dado que o consumo de notícias é fundamental para ajudar o público a compreender os acontecimentos que o rodeiam. De acordo com a Teoria do Agenda Setting, a linguagem utilizada pelos meios de comunicação para enquadrar e apresentar os acontecimentos actuais tem impacto na forma como o público percebe quais as questões que são importantes (McCombs 1997; Russell Neuman et al. 2014).
Embora alguns possam ter a impressão de que a relevância da grande mídia tradicional está diminuindo em meio ao crescimento explosivo de notícias on-line através de sites e mídias sociais, o consumo de notícias nos Estados Unidos ainda provém predominantemente da televisão, representando quase cinco vezes mais que o consumo de notícias on-line pelo público. (Allen et al. 2020). Apesar da noção de que o consumo de notícias televisivas é mais “passivo” do que a leitura de notícias, a investigação mostra que as pessoas tendem a recordar melhor as notícias televisivas do que as notícias online (Eveland, Seo e Marton 2002). Além disso, um estudo recente comparando o consumo de notícias na TV e na Internet descobriu que há quatro vezes mais americanos segregados partidariamente através da TV do que através de notícias online. Na verdade, as audiências de notícias televisivas são várias vezes mais propensas a manter as suas dietas noticiosas partidárias ao longo do tempo e são muito mais restritas nas suas fontes, enquanto mesmo os leitores de notícias online partidárias tendem a consumir de uma variedade de fontes (Muise et al. 2022).
No entanto, os estudos sobre a polarização dos meios de comunicação social e o consequente discurso público baseiam-se esmagadoramente em conteúdos online (Garimella et al. 2021). Por exemplo, mesmo pesquisas que analisam dados de meios de comunicação tradicionais baseiam-se apenas em tweets das contas oficiais de jornais, programas de TV e programas de rádio no Twitter, em vez da transcrição direta do conteúdo dessas fontes de mídia legadas (Recuero, Soares e Gruzd). 2020). Isto se deve ao fato de que, diferentemente da informação on-line, os dados de mídia legados (por exemplo, legendas ocultas) são mais difíceis de coletar, existem em formatos incompatíveis para pré-processamento rápido (por exemplo, arquivos srt) e estão espalhados por instituições que não têm incentivos para compartilhar. dados com acadêmicos. Conseqüentemente, não se sabe muito sobre como a mídia tradicional afeta o discurso on-line.
Nesse sentido, a nossa análise de uma década de legendas ocultas de noticiários televisivos transmitidos 24 horas por dia das duas maiores estações de notícias dos Estados Unidos apresenta uma oportunidade única para demonstrar empiricamente como a polarização linguística nos meios de transmissão evoluiu ao longo do tempo e como impactou as redes sociais. discurso midiático. Neste trabalho, examinamos como as diferenças semânticas na linguagem da mídia de transmissão evoluíram nos últimos 11 anos entre a CNN e a Fox News (Estudo 1), quais palavras são características dos picos de polaridade semântica na linguagem da mídia de transmissão (Estudo 2), se a polaridade na linguagem dos noticiários televisivos prevê tendências de polarização no discurso das redes sociais e como a linguagem desempenha um papel na condução de padrões relacionais de um para o outro (Estudo 3).
No Estudo 1, aproveitamos técnicas de processamento de linguagem natural (PNL) para desenvolver um método que captura quantitativamente como a polarização semântica entre CNN e Fox News evoluiu de 2010 a 2020, calculando a polaridade semântica de quão importantes são os tópicos socialmente importantes, mas politicamente divididos ( racismo, Black Lives Matter, polícia, imigração, alterações climáticas e cuidados de saúde) são discutidos pelos dois canais de notícias. Em seguida, usamos uma técnica de interpretação de modelo em aprendizagem profunda para desvendar linguisticamente o que pode estar causando esses picos, extraindo tokens contextuais que são mais preditivos de como cada estação discute palavras-chave temáticas em 2020 (Estudo 2). Para investigar se as tendências partidárias na linguagem da mídia de transmissão influenciam os padrões de polaridade no discurso da mídia social, usamos a causalidade de Granger para testar se e como a polarização semântica entre as duas estações de notícias de TV prevê a polarização entre as audiências do Twitter que respondem a @CNN e @FoxNews (Estudo 3) . Finalmente, para entender a linguagem que impulsiona as relações causais de Granger em como as tendências de polaridade semântica nas notícias televisivas afetam isso entre os usuários do Twitter (e vice-versa), identificamos tokens que são mais preditivos de como as palavras-chave do tópico são discutidas na TV versus Twitter. , separados por comprimentos de defasagem que correspondem à significância da causalidade de Granger. Nossas contribuições são as seguintes:
• Fornecemos uma nova estrutura para quantificar a polarização semântica entre duas entidades, considerando a temporalidade associada à forma como a polarização semântica evolui ao longo do tempo. Pesquisas anteriores que quantificam a polarização como uma medida agregada de um único despejo de dados longitudinais muitas vezes deixam de fora as principais dinâmicas temporais e contextos em torno de como a polaridade se desdobra ao longo do tempo. Nossa estrutura incorpora flutuações temporais calculando mudanças diacrônicas usando incorporações contextuais de palavras com características temporais.
• Ao mostrar como a polarização semântica na mídia de transmissão evoluiu nos últimos 11 anos, vamos além de fornecer uma mera quantificação da polarização como uma métrica, usando Gradientes Integrados para identificar tokens atributivos como um proxy para compreender a linguagem contextual que impulsiona a ascensão de 2020 na polaridade semântica entre as duas emissoras de notícias.
• Abordamos a questão de se e como a polarização na linguagem dos noticiários televisivos prevê tendências de polaridade semântica no Twitter, fornecendo novas evidências sobre como as audiências on-line são moldadas em seu discurso pela linguagem dos noticiários televisivos — um elo importante que não foi empiricamente estabelecido em escala. em pesquisas anteriores.
• Finalmente, usamos a interpretação de modelos para extrair características lexicais de diferentes entidades, para mostrar quais palavras impulsionam padrões causais de Granger significativos em como a linguagem da mídia de transmissão molda o discurso do Twitter e vice-versa, destacando assim a maneira pela qual a linguagem desempenha um papel fundamental na conduzindo relações de polaridade semântica entre discussões online e linguagem da mídia de transmissão.
Nossas descobertas são uma das primeiras a quantificar como a linguagem que caracteriza narrativas midiáticas opostas sobre eventos noticiosos semelhantes na TV pode aumentar os níveis de discurso partidário online. Os resultados deste trabalho apoiam estudos recentes em investigação em comunicação, que teorizam que tanto os meios de comunicação como as agendas públicas podem influenciar-se mutuamente, e que tais dinâmicas podem polarizar a forma como o público se envolve no discurso, influenciando assim a tomada de decisão democrática. grande.
Este artigo está disponível no arxiv sob licença CC 4.0.