Autores:
(1) Xiaohan Ding, Departamento de Ciencias de la Computación, Virginia Tech, (correo electrónico: [email protected]);
(2) Mike Horning, Departamento de Comunicación, Virginia Tech, (correo electrónico: [email protected]);
(3) Eugenia H. Rho, Departamento de Ciencias de la Computación, Virginia Tech, (correo electrónico: [email protected]).
Estudio 1: Evolución de la polaridad semántica en el lenguaje de los medios de difusión (2010-2020)
Estudio 2: Palabras que caracterizan la polaridad semántica entre Fox News y CNN en 2020
Discusión y Declaración de Ética
Con el crecimiento de las noticias en línea durante la última década, los estudios empíricos sobre el discurso político y el consumo de noticias se han centrado en el fenómeno de las burbujas de filtro y las cámaras de eco. Sin embargo, recientemente, los académicos han revelado evidencia limitada sobre el impacto de tal fenómeno, lo que lleva a algunos a argumentar que la segregación partidista entre las audiencias de noticias no puede explicarse completamente sólo por el consumo de noticias en línea y que el papel de los medios tradicionales heredados puede ser igualmente destacado en la polarización del discurso público. en torno a los acontecimientos actuales. En este trabajo, ampliamos el alcance del análisis para incluir tanto los medios en línea como los más tradicionales investigando la relación entre el lenguaje de los medios de comunicación y el discurso de las redes sociales. Al analizar una década de subtítulos (2,1 millones de turnos de locutor) de CNN y Fox News junto con el discurso temático correspondiente de Twitter, proporcionamos un marco novedoso para medir la polarización semántica entre las dos principales redes de transmisión de Estados Unidos para demostrar cómo la polarización semántica entre estos medios ha evolucionado (Estudio 1), alcanzó su punto máximo (Estudio 2) e influyó en las discusiones partidistas en Twitter (Estudio 3) a lo largo de la última década. Nuestros resultados demuestran un fuerte aumento en la polarización en la forma en que se discuten las palabras clave de importancia temática entre los dos canales, especialmente después de 2016, con picos más altos en general en 2020. Las dos estaciones discuten temas idénticos en contextos drásticamente distintos en 2020, en la medida en que Apenas existe superposición lingüística en la forma en que se discuten contextualmente palabras clave idénticas. Además, demostramos a escala cómo esa división partidista en el lenguaje de los medios de difusión da forma significativamente a las tendencias de polaridad semántica en Twitter (y viceversa), vinculando empíricamente por primera vez cómo las discusiones en línea están influenciadas por los medios televisados. Mostramos cómo el lenguaje que caracteriza las narrativas mediáticas opuestas sobre eventos noticiosos similares en la televisión puede aumentar los niveles de discurso partidista en línea. Con este fin, nuestro trabajo tiene implicaciones sobre cómo la polarización de los medios en la televisión juega un papel importante a la hora de impedir, en lugar de apoyar, el discurso democrático en línea.
Los medios de comunicación desempeñan un papel vital en los procesos democráticos al influir en cómo operan las instituciones, cómo se comunican los líderes políticos y, lo más importante, cómo los ciudadanos participan en política (McLeod, Scheufele y Moy 1999). Si bien no sorprende que las dos divisiones políticas de Estados Unidos hablen idiomas diferentes (Westfall et al. 2015), las investigaciones también han demostrado que el lenguaje partidista en los medios de comunicación ha aumentado considerablemente en los últimos años, particularmente en las noticias transmitidas (Horning 2018). Esto es preocupante dado que el consumo de noticias es fundamental para ayudar al público a comprender los acontecimientos que lo rodean. Según la teoría del establecimiento de la agenda, el lenguaje utilizado por los medios para enmarcar y presentar los acontecimientos actuales impacta la forma en que el público percibe qué temas son importantes (McCombs 1997; Russell Neuman et al. 2014).
Si bien algunos pueden tener la impresión de que los medios tradicionales tradicionales están perdiendo relevancia en medio del crecimiento explosivo de las noticias en línea a través de sitios web y redes sociales, el consumo de noticias en Estados Unidos todavía proviene abrumadoramente de la televisión, representando casi cinco veces más que el consumo de noticias en línea entre el público. (Allen et al.2020). A pesar de la noción de que el consumo de noticias por televisión es más “pasivo” que leerlas, las investigaciones muestran que las personas tienden a recordar mejor las noticias televisadas que las noticias en línea (Eveland, Seo y Marton, 2002). Además, un estudio reciente que compara el consumo de noticias por televisión e Internet encontró que hay cuatro veces más estadounidenses que están segregados partidistamente a través de la televisión que a través de las noticias en línea. De hecho, las audiencias de noticias televisivas tienen muchas más probabilidades de mantener su dieta de noticias partidistas a lo largo del tiempo y tienen fuentes mucho más limitadas, mientras que incluso los lectores de noticias partidistas en línea tienden a consumir de una variedad de fuentes (Muise et al. 2022).
Sin embargo, los estudios sobre la polarización de los medios y el consiguiente discurso público se basan abrumadoramente en contenidos en línea (Garimella et al. 2021). Por ejemplo, incluso las investigaciones que analizan datos de medios de comunicación tradicionales se basan únicamente en tweets de las cuentas oficiales de Twitter de periódicos, programas de televisión y programas de radio, en lugar de la transcripción directa de contenidos de estas fuentes de medios tradicionales (Recuero, Soares y Gruzd). 2020). Esto se debe al hecho de que, a diferencia de la información en línea, los datos de medios heredados (por ejemplo, subtítulos) son más difíciles de recopilar, existen en formatos incompatibles para un procesamiento previo rápido (por ejemplo, archivos srt) y están dispersos entre instituciones que carecen de incentivos para compartir. datos con académicos. Por lo tanto, se desconoce gran parte de cómo los medios tradicionales afectan el discurso en línea.
En ese sentido, nuestro análisis de una década de subtítulos de programas de noticias de televisión transmitidos las 24 horas de las dos estaciones de noticias más importantes de Estados Unidos presenta una oportunidad única para demostrar empíricamente cómo la polarización lingüística en los medios de difusión ha evolucionado con el tiempo y cómo ha impactado las redes sociales. discurso mediático. En este trabajo, examinamos cómo han evolucionado las diferencias semánticas en el lenguaje de los medios de radiodifusión durante los últimos 11 años entre CNN y Fox News (Estudio 1), qué palabras son características de los picos de polaridad semántica en el lenguaje de los medios de radiodifusión (Estudio 2), si La polaridad en el lenguaje de las noticias televisivas pronostica tendencias de polarización en el discurso de las redes sociales y cómo el lenguaje juega un papel en impulsar patrones relacionales de uno a otro (Estudio 3).
En el Estudio 1, aprovechamos técnicas de procesamiento del lenguaje natural (PNL) para desarrollar un método que capture cuantitativamente cómo ha evolucionado la polarización semántica entre CNN y Fox News de 2010 a 2020 mediante el cálculo de la polaridad semántica de temas socialmente importantes, pero políticamente divididos ( Los dos canales de noticias analizan el racismo, Black Lives Matter, la policía, la inmigración, el cambio climático y la atención médica. Luego utilizamos una técnica de interpretación de modelos en aprendizaje profundo para desentrañar lingüísticamente lo que puede estar impulsando estos picos mediante la extracción de tokens contextuales que son más predictivos de cómo cada estación analiza las palabras clave de actualidad en 2020 (Estudio 2). Para investigar si las tendencias partidistas en el lenguaje de los medios de difusión influyen en los patrones de polaridad en el discurso de las redes sociales, utilizamos la causalidad de Granger para probar si la polarización semántica entre las dos estaciones de noticias de televisión pronostica la polarización entre las audiencias de Twitter que responden a @CNN y @FoxNews, y de qué manera (Estudio 3). . Finalmente, para comprender el lenguaje que impulsa las relaciones causales de Granger en cómo las tendencias de polaridad semántica en las noticias televisadas afectan a los usuarios de Twitter (y viceversa), identificamos los tokens que son más predictivos de cómo se discuten las palabras clave de actualidad en la televisión frente a Twitter. , separados por longitudes de rezago que corresponden a la importancia de la causalidad de Granger. Nuestras aportaciones son las siguientes:
• Proporcionamos un marco novedoso para cuantificar la polarización semántica entre dos entidades al considerar la temporalidad asociada con cómo la polarización semántica evoluciona con el tiempo. Investigaciones anteriores que cuantifican la polarización como una medida agregada a partir de un único volcado de datos longitudinales a menudo omiten dinámicas temporales clave y contextos sobre cómo se desarrolla la polaridad a lo largo del tiempo. Nuestro marco incorpora fluctuaciones temporales calculando cambios diacrónicos utilizando incrustaciones de palabras contextuales con características temporales.
• Al mostrar cómo ha evolucionado la polarización semántica en los medios de radiodifusión durante los últimos 11 años, vamos más allá de proporcionar una mera cuantificación de la polarización como métrica mediante el uso de gradientes integrados para identificar tokens atributivos como proxy para comprender el lenguaje contextual que impulsa el ascenso en 2020. en la polaridad semántica entre las dos estaciones de noticias.
• Abordamos la cuestión de si la polarización en el lenguaje de las noticias televisadas pronostica las tendencias de polaridad semántica en Twitter, y de qué manera, proporcionando nueva evidencia sobre cómo las audiencias en línea son moldeadas en su discurso por el lenguaje de las noticias televisivas, un vínculo importante que no se ha establecido empíricamente a escala. en investigaciones previas.
• Finalmente, utilizamos la interpretación de modelos para extraer características léxicas de diferentes entidades, para mostrar qué palabras impulsan patrones causales de Granger significativos en cómo el lenguaje de los medios de difusión da forma al discurso de Twitter y viceversa, resaltando así la manera en que el lenguaje juega un papel clave en impulsar las relaciones de polaridad semántica entre las discusiones en línea y el lenguaje de los medios de difusión.
Nuestros hallazgos son uno de los primeros en cuantificar cómo el lenguaje que caracteriza narrativas mediáticas opuestas sobre eventos noticiosos similares en la televisión puede aumentar los niveles de discurso partidista en línea. Los resultados de este trabajo respaldan estudios recientes en investigación de comunicaciones, que teorizan que tanto los medios como las agendas públicas pueden influirse entre sí, y que tales dinámicas pueden polarizar la manera en que el público participa en el discurso, influyendo así en los procesos de toma de decisiones democráticas. grande.
Este documento está disponible en arxiv bajo licencia CC 4.0.