Авторы:
(1) Анес Бакир, Венецианский университет Ка Фоскари, Италия;
(2) Алессандро Галеацци, Венецианский университет Ка Фоскари, Италия;
(3) Фабиана Золло, Университет Ка Фоскари, Венеция, Италия и Новый институт, Центр экологических гуманитарных наук, Италия.
В этом разделе мы представляем результаты нашего анализа, организованные следующим образом. Во-первых, мы представляем обзор информационного ландшафта в отдельных европейских странах за три года. Этот шаг имеет решающее значение для определения ключевых тем, которые широко распространены среди стран, и различения сомнительных и надежных источников, что позволяет провести последовательное сравнение. Далее мы исследуем как общие черты, так и различия между странами в их онлайн-обсуждениях этих тем, уделяя особое внимание вовлечению пользователей и моделям потребления.
Чтобы сравнить ландшафт общественного дискурса в выбранных странах, наш первый шаг включает в себя выявление общих тем, широко обсуждаемых во всех четырех странах как сомнительными, так и надежными источниками. С этой целью мы используем BERTopic (Grootendorst, 2022) для выполнения тематического моделирования контента, созданного аккаунтами новостных агентств за трехлетний период (более подробную информацию см. в разделе 2). Чтобы определить подходящие темы для нашего анализа, мы делим набор данных по годам и странам и запускаем алгоритм BERTopic для каждого подмножества. Результаты, представленные на рисунке 1, показывают наиболее обсуждаемые темы за каждый год по странам и категориям источников. Размер каждой темы отражает количество источников новостей, вносящих в нее вклад, а ее положение отражает ее актуальность для общих тем. Блок-схемы показывают распространенность этой темы в новостных агентствах с течением времени.
На рисунке 1 показано, как внимание новостных агентств к различным темам различалось в зависимости от страны и типа источников новостей. Примечательно, что помимо определенных тем, представляющих общий интерес, новостные агентства, как правило, отдавали приоритет темам национального значения, таким как протесты, влияние зарубежных стран, религия, электромобили и легализация наркотиков. Мы также наблюдаем расхождения в темах, освещаемых сомнительными и достоверными источниками внутри одной страны. Например, доля новостных агентств, сообщающих о вакцине от коронавируса в Италии, была выше для надежных источников, чем для сомнительных. Кроме того, некоторые темы были эксклюзивными для одного типа источника, например «Полеты» (Италия, достоверно), «Управление водными ресурсами» (Франция, достоверно) или «Палестинская борьба» (Великобритания, сомнительно). Эти результаты показывают, что на уровень интереса влияла как страна, так и тип рассматриваемого источника: сомнительные источники демонстрировали более широкий спектр интересов, а надежные источники больше фокусировались на темах, общих для всех стран.
Важно отметить, что наш анализ подчеркивает наличие общих тем как в сомнительных, так и в достоверных дебатах всех стран. В частности, в дебатах во всех странах последовательно фигурировали три темы: «Брекзит» (2019 г.), «Коронавирус» (2020 г.) и «Вакцина от Covid» (2021 г.). Поэтому в последующем анализе мы сосредоточиваемся исключительно на этих темах для межстранового изучения дискурса. Обоснование этого выбора состоит в том, чтобы подчеркнуть различия и сходства в том, как эти темы освещались и использовались новостными агентствами и пользователями из разных стран, тем самым сводя к минимуму влияние различий по конкретным темам на наш анализ. Кроме того, эти темы широко обсуждались на европейском уровне, что делает наш анализ ценным для понимания того, как предметы европейского значения воспринимаются в разных странах.
Чтобы подчеркнуть актуальность трех выбранных тем в публичных онлайн-дебатах и подтвердить точность временных рамок, отведенных для каждой темы, мы проводим анализ поисковых запросов Google Trends.
интерес к Брекситу, коронавирусу и вакцине от Covid во Франции, Германии, Италии и Великобритании в период с 2019 по 2021 год, как показано на рисунке 2.
Анализ Google Trends подтверждает, что выбранные темы привлекли наибольшее внимание в указанные периоды времени в более широком онлайн-контексте. Таким образом, в дальнейшем наш анализ фокусируется на этих трех темах (Брексит, коронавирус и вакцина от Covid), чтобы изучить различия и сходства в производстве и потреблении новостей в европейском ландшафте. Чтобы проводить анализ исключительно по этим темам, мы фильтруем временные рамки новостных агентств, чтобы выбрать только твиты, относящиеся к выбранной теме в соответствующем временном диапазоне (подробности см. в разделе 2).
Мы продолжаем наше исследование, сравнивая взаимодействие с контентом, связанным с выявленными темами на платформах социальных сетей. На рисунке 3 показано распределение взаимодействий в твитах по странам, рассчитанное как сумма лайков, ретвитов, цитат и ответов для надежных источников новостей (синий) и сомнительных источников новостей (оранжевый), согласно классификации NewsGuard (см. раздел 2). по каждой из трех тем. Несмотря на незначительные географические различия, распределение взаимодействий пользователей демонстрирует одинаковое распределение с длинным хвостом для всех трех тем: небольшое количество твитов получает большое количество взаимодействий, в то время как большинство получает очень мало. Надежные источники новостей обычно получают больше взаимодействий, чем сомнительные.
источники, о чем свидетельствует их более широкое распределение вдоль оси x. Однако наблюдаются несколько исключений, например, случай Великобритании в дискуссиях о вакцине против COVID-19 и Франции в дебатах о коронавирусе. Более того, в дискурсе о Брексите сомнительные источники заметно присутствуют в хвосте распределения в Германии и Италии, хотя в других дискуссиях они менее заметны. В целом, наличие сомнительных источников и вызванное ими участие могут различаться в зависимости как от страны, так и от конкретной рассматриваемой темы.
Затем мы обращаем внимание на модели потребления новостей, чтобы подчеркнуть различия и сходства в аудиториях новостных агентств. Анализируя данные Твиттера о Брексите, Коронавирусе и вакцине от Covid, мы выясняем, потребляют ли однотипные новостные агентства схожая аудитория. Мы определяем метрику, основанную на косинусном сходстве (см. раздел 2) ретвитеров, чтобы количественно оценить сходство между новостными агентствами с точки зрения аудитории. Новостные агентства с высоким процентом ретвиттеров имеют более высокое значение показателя сходства (близкое к 1), в то время как СМИ с небольшим количеством общих ретвиттеров получают низкое сходство (близкое к 0).
Затем мы строим ненаправленную сеть, в которой новостные агентства представлены в виде узлов, а взвешенные ребра указывают уровень сходства между ними. Мы создаем одну сеть для каждой рассматриваемой страны и темы, чтобы обеспечить справедливое сравнение. Полученные сети визуализируются на рисунке 4. Чтобы выделить только более сильные связи, мы отбрасываем ребра с весами ниже, чем общая медиана ребер каждой сети (результаты для полных сетей см. на рисунках 1 и 2 SI).
Мы можем наблюдать различия в структуре сети в зависимости от страны и рассматриваемой темы. Действительно, Франция, Германия и Италия, как правило, демонстрируют четко различимый кластер сомнительных источников (оранжевые треугольники), что указывает на наличие сообществ, в основном потребляющих сомнительный контент. В Великобритании это различие менее выражено. Глядя на различия по конкретным темам, мы обнаруживаем, что во всех странах, кроме Великобритании, сети, как правило, более разреженные и с меньшей плотностью границ, как в случае Брексита. Что касается обсуждений о коронавирусе и вакцине от Covid, сети более связаны и имеют более высокую плотность ребер (см. Таблицу 2 SI). Это отражается в разделении между сомнительными и надежными источниками новостей: в дебатах о Брексите разделение между этими двумя типами новостей кажется более четким, в то время как в других дебатах они имеют большее количество связей, как показано в Таблице 3 SI. . Для дальнейшей количественной оценки этого поведения мы применяем скорректированную номинальную ассортативность к нашим сетям (Карими и Оливейра, 2022), показывая, что более высокие уровни ассортативности достигаются в контексте дебатов о Брексите. Однако Великобритания демонстрирует иное поведение, возможно, из-за своего непосредственного участия в дебатах.
Наш анализ также показывает, что не существует абсолютного разделения между сомнительными и надежными новостными агентствами. Это говорит о том, что некоторые пользователи в основном или исключительно потребляют достоверный или сомнительный контент, в то время как другие придерживаются смешанной новостной диеты, потребляя оба типа в разных пропорциях. Чтобы глубже разобраться в этом вопросе, мы анализируем долю сомнительных новостей, потребляемых каждым пользователем, и представляем распределение на рисунке 5. Результаты показывают, что большинство пользователей в каждой дискуссии в первую очередь полагаются на надежные источники новостей (см. также Таблицу 4 SI). ). Однако в каждой дискуссии есть небольшая, но заметная доля пользователей, которые поддерживают исключительно сомнительные новости, хотя и с разной степенью известности. Примечательно, что на рисунке показано характерное бимодальное распределение, при этом очень немногие пользователи выходят за пределы крайних пределов спектра. Эти пользователи играют решающую роль в устранении разрыва между сомнительными и достоверными новостями в сетях сходства. Более того, надежные источники новостей, как правило, занимают ядро сети, тогда как сомнительные источники обычно располагаются на более периферийных позициях. Действительно, среди 25 лучших источников, определенных алгоритмом PageRank в каждой сети (Бакши и др., 2011), значительное большинство (не менее 95,3%) оказываются надежными источниками новостей (более подробную информацию см. в SI). Мы завершаем наш анализ, изучая структуру сообщества сетей сходства. Мы выполняем обнаружение сообществ с помощью кластеризации Лувена.
алгоритм (Blondel et al., 2008) и отобразите результаты на рисунке 6. Кластеры имеют цветовую маркировку в зависимости от доли сомнительных новостных агентств, причем более темные оттенки указывают на более высокий процент сомнительных источников.
По всем странам и тематикам большинство кластеров состояли в основном из надежных новостных агентств, и внутри этих кластеров мы также находим наиболее значимые узлы по классификации PageRank. Однако наш анализ также показывает наличие небольших кластеров с высокой долей сомнительных новостных агентств. Количество и размер этих кластеров варьируются в зависимости от страны и темы. Например, в Германии и Италии по каждой теме есть по одному такому кластеру, а в дебатах по Брекситу во Франции — два кластера. В Великобритании разделение менее четкое: ни в одной группе нет высокого процента сомнительных новостных агентств. Мы также заметили, что надежные кластеры, как правило, меньше по размеру, но более многочисленны, в то время как сомнительные кластеры, как правило, больше и часто уникальны в каждой сети. Это предполагает, что пользователи, потребляющие сомнительный контент, склонны поддерживать большинство сомнительных источников сети, в то время как надежные потребители новостей сосредотачиваются на меньшем количестве новостных агентств.
В целом, наш анализ дает продольный обзор ландшафта онлайн-потребления новостей в выбранных странах, подчеркивая преобладание надежных источников новостей, а также выявляя наличие кластеров с более высокой долей сомнительных источников новостей во многих странах и темах. Существование таких кластеров предполагает наличие группы пользователей, потребляющих контент из различных сомнительных источников, избегая при этом надежных. Такое поведение согласуется с потенциальным наличием эхо-камер — явлением, широко наблюдаемым в онлайн-дебатах (Cinelli et al., 2021; Falkenberg et al., 2022; Cota et al., 2019).
Этот документ доступен на arxiv под лицензией CC 4.0.