作者:
(1)丁小寒,弗吉尼亚理工大学计算机科学系,(电子邮箱:[email protected])
(2)弗吉尼亚理工大学传播系 Mike Horning(电子邮箱:[email protected])
(3)Eugenia H. Rho,弗吉尼亚理工大学计算机科学系,(电子邮箱:[email protected])。
研究 2:2020 年 Fox News 与 CNN 语义极性的词汇
研究三:广播媒体语言中的语义极性如何预测社交媒体话语中的语义极性
随着过去十年网络新闻的发展,政治话语和新闻消费的实证研究集中在过滤气泡和回音室现象上。然而,最近,学者们发现的有关这种现象影响的证据有限,这导致一些人认为,新闻受众之间的党派隔离不能完全用网络新闻消费来解释,传统媒体在当前事件公众话语两极分化方面的作用可能同样突出。在这项工作中,我们通过调查广播新闻媒体语言与社交媒体话语之间的关系,将分析范围扩大到包括在线和更传统的媒体。通过分析 CNN 和 Fox News 十年来的隐藏字幕(210 万次发言)以及 Twitter 上与主题相对应的话语,我们提供了一个衡量美国两大广播网络之间语义两极分化的新框架,以展示这些媒体之间的语义两极分化在过去十年中如何演变(研究 1)、达到顶峰(研究 2)并影响 Twitter 上的党派讨论(研究 3)。我们的结果表明,两个频道在讨论重要主题关键词时出现的两极分化急剧增加,尤其是在 2016 年之后,2020 年出现了总体最高峰值。2020 年,两个电台在截然不同的背景下讨论相同的主题,以至于在讨论相同关键词的语境中几乎没有任何语言重叠。此外,我们还大规模展示了广播媒体语言中的这种党派分歧如何显著影响了 Twitter 上的语义极性趋势(反之亦然),并首次在实证上将在线讨论如何受到电视媒体的影响联系起来。我们展示了描述电视上关于类似新闻事件的对立媒体叙事的语言如何增加在线党派话语的水平。为此,我们的工作对电视媒体两极分化如何在阻碍而不是支持在线民主话语方面发挥重要作用具有启示意义。
大众媒体在民主进程中发挥着至关重要的作用,它影响着机构的运作方式、政治领导人的沟通方式,最重要的是,影响着公民参与政治的方式 (McLeod、Scheufele 和 Moy 1999)。尽管美国两大政治阵营使用不同的语言并不令人意外 (Westfall 等人 2015),但研究也表明,近年来,新闻媒体中的党派语言急剧增加,尤其是在广播新闻中 (Horning 2018)。这令人担忧,因为新闻消费对于帮助公众了解周围事件至关重要。根据议程设置理论,媒体用来构建和呈现时事的语言会影响公众如何看待哪些问题很重要 (McCombs 1997;Russell Neuman 等人 2014)。
尽管有些人可能认为,在网站和社交媒体等在线新闻爆炸式增长的背景下,主流传统媒体的相关性正在下降,但美国的新闻消费仍然主要来自电视,占公众在线新闻消费的近五倍(Allen 等人,2020 年)。尽管人们认为电视新闻消费比阅读新闻更“被动”,但研究表明,人们往往比在线新闻更容易记住电视新闻(Eveland、Seo 和 Marton,2002 年)。此外,最近一项比较电视和互联网新闻消费的研究发现,通过电视进行党派隔离的美国人是通过在线新闻进行党派隔离的四倍。事实上,电视新闻观众随着时间的推移保持党派新闻饮食的可能性要高出几倍,而且他们的来源要狭窄得多,而即使是党派在线新闻读者也倾向于从各种来源消费(Muise 等人,2022 年)。
然而,关于媒体两极分化和随之而来的公共话语的研究绝大多数是基于在线内容(Garimella 等人,2021 年)。例如,即使是分析传统新闻媒体数据的研究,也仅仅依赖于报纸、电视节目和广播节目官方 Twitter 账户的推文,而不是这些传统媒体来源内容的直接转录(Recuero、Soares 和 Gruzd,2020 年)。这是因为与在线信息不同,传统媒体数据(例如隐藏字幕)更难收集,以与快速预处理不兼容的格式存在(例如 srt 文件),并且分散在缺乏与学者共享数据的动机的机构中。因此,主流传统媒体如何影响在线话语的大部分内容尚不清楚。
从这个意义上讲,我们对美国两大新闻台 24 小时播出的电视新闻节目十年来的隐藏字幕的分析提供了一个独特的机会,可以通过实证研究展示广播媒体的语言两极分化如何随着时间的推移而演变,以及它如何影响社交媒体话语。在这项研究中,我们研究了过去 11 年来 CNN 和 Fox News 之间广播媒体语言的语义差异是如何演变的(研究 1),哪些词是广播媒体语言语义极性峰值的特征(研究 2),电视新闻语言中的语义极性是否预示了社交媒体话语中的两极分化趋势,以及语言如何在推动关系模式从一个到另一个方面发挥作用(研究 3)。
在研究 1 中,我们利用自然语言处理 (NLP) 技术开发了一种方法,通过计算两家新闻频道讨论的社会重要但政治上存在分歧的话题(种族主义、黑人的命也是命、警察、移民、气候变化和医疗保健)的语义极性,定量捕捉 CNN 和 Fox News 之间语义两极分化从 2010 年到 2020 年的演变情况。然后,我们使用深度学习中的模型解释技术,通过提取最能预测每个电视台在 2020 年如何讨论主题关键词的上下文标记,从语言上解析可能导致这些峰值的原因(研究 2)。为了调查广播媒体语言中的党派趋势是否会影响社交媒体话语中的极性模式,我们使用格兰杰因果关系来测试两家电视新闻台之间的语义两极分化是否以及如何预测回复 @CNN 和 @FoxNews 的 Twitter 观众之间的两极分化(研究 3)。最后,为了了解驱动格兰杰因果关系的语言,即电视新闻中的语义极性趋势如何影响 Twitter 用户(反之亦然),我们确定了最能预测电视和 Twitter 上讨论主题关键词的方式的标记,这些标记由与格兰杰因果关系显著性相对应的滞后长度分隔。我们的贡献如下:
• 我们通过考虑语义极化随时间演变的时间性,提供了一个量化两个实体之间语义极化的新框架。先前的研究将极化量化为来自单个纵向数据转储的总体度量,但通常会忽略极性随时间演变的关键时间动态和背景。我们的框架通过使用具有时间特征的上下文词嵌入计算历时变化来整合时间波动。
• 在展示广播媒体中语义两极分化在过去 11 年中如何演变时,我们不仅仅是提供对两极分化的简单量化作为指标,还使用综合梯度来识别属性标记作为代理,以理解推动 2020 年两家新闻台之间语义极性上升的语境语言。
• 我们探讨电视新闻语言的两极分化是否以及如何预测 Twitter 上的语义极性趋势,为在线观众的话语如何受到电视新闻语言的影响提供了新证据——这一重要联系在先前的研究中尚未得到大规模的实证证实。
• 最后,我们使用模型解释从不同的实体中提取词汇特征,以展示哪些词语在广播媒体语言如何塑造 Twitter 话语以及反之亦然中驱动了显著的 Granger 因果模式,从而强调了语言在驱动在线讨论和广播媒体语言之间的语义极性关系方面发挥的关键作用。
我们的研究结果是首次量化了电视上关于类似新闻事件的对立媒体叙述的语言如何增加网络上党派言论的水平。这项研究的结果支持了最近的传播研究,该研究认为媒体和公众议程可以相互影响,这种动态可以使公众参与讨论的方式两极分化,从而影响整个民主决策。