Auteurs:
(1) Anees Baqir, Université Ca' Foscari de Venise, Italie ;
(2) Alessandro Galeazzi, Université Ca' Foscari de Venise, Italie ;
(3) Fabiana Zollo, Université Ca' Foscari de Venise, Italie et The New Institute Center for Environmental Humanities, Italie.
Dans cette section, nous présentons les résultats de notre analyse, organisés comme suit. Tout d’abord, nous donnons un aperçu du paysage de l’information dans certains pays européens au cours des trois années. Cette étape est cruciale pour identifier les sujets clés largement partagés entre les pays et faire la distinction entre les sources douteuses et fiables, permettant ainsi une comparaison cohérente. Ensuite, nous examinons à la fois les points communs et les différences entre les pays dans leurs discussions en ligne sur ces sujets, en nous concentrant sur l'engagement des utilisateurs et les modes de consommation.
Pour comparer les paysages du discours public dans les pays sélectionnés, notre première étape consiste à identifier des sujets communs largement discutés dans les quatre pays et par des sources à la fois douteuses et fiables. Dans ce but, nous utilisons BERTopic (Grootendorst, 2022) pour effectuer une modélisation thématique du contenu produit par les comptes des médias sur une période de trois ans (voir la section 2 pour plus de détails). Pour identifier les sujets appropriés pour notre analyse, nous divisons l'ensemble de données par année et par pays et exécutons l'algorithme BERTopic sur chaque sous-ensemble. Les résultats présentés dans la figure 1 montrent les sujets les plus débattus pour chaque année par pays et catégorie de source. La taille de chaque sujet représente le nombre de sources d'information qui y contribuent, tandis que sa position reflète sa pertinence par rapport aux sujets généraux. Les organigrammes montrent la prévalence du sujet dans les médias au fil du temps.
La figure 1 montre comment l’attention des médias sur différents sujets varie selon les pays et les types de sources d’information. Notamment, outre certains sujets d’intérêt commun, les médias avaient tendance à donner la priorité à des sujets d’intérêt national, tels que les manifestations, l’influence des pays étrangers, la religion, les voitures électriques et la légalisation des drogues. On observe également des disparités dans les sujets traités par des sources douteuses et fiables au sein d’un même pays. Par exemple, la proportion de médias faisant état du vaccin contre le coronavirus en Italie était plus élevée pour les sources fiables que pour les sources douteuses. De plus, certains sujets étaient exclusifs à un type de source, comme « Vols » (Italie, fiable), « Gestion de l'eau » (France, fiable) ou « Lutte palestinienne » (Royaume-Uni, discutable). Ces résultats indiquent que le niveau d’intérêt était influencé à la fois par le pays et le type de source considéré, les sources douteuses affichant un plus large éventail d’intérêts et les sources fiables se concentrant davantage sur des sujets communs à tous les pays.
Fondamentalement, notre analyse met en évidence la présence de sujets communs entre les débats à la fois douteux et fiables de tous les pays. Plus précisément, trois sujets sont apparus de manière constante dans les débats dans tous les pays : le « Brexit » (2019), le « Coronavirus » (2020) et le « Vaccin Covid » (2021). C’est pourquoi, dans l’analyse qui suit, nous nous concentrons exclusivement sur ces sujets pour un examen du discours à l’échelle nationale. La justification de ce choix est de mettre en lumière les différences et les similitudes dans la manière dont ces sujets ont été rapportés et consommés par les médias et les utilisateurs de divers pays, minimisant ainsi l'impact des variations spécifiques à un sujet sur notre analyse. De plus, ces sujets ont été largement débattus au niveau européen, ce qui rend notre analyse précieuse pour comprendre comment les sujets d'importance européenne sont perçus dans différents pays.
Pour souligner la pertinence des trois sujets choisis dans les débats publics en ligne et valider l'exactitude des délais attribués à chaque sujet, nous effectuons une analyse Google Trends des recherches
intérêt pour le Brexit, le coronavirus et le vaccin Covid en France, en Allemagne, en Italie et au Royaume-Uni de 2019 à 2021, comme le montre la figure 2.
L'analyse de Google Trends confirme que les sujets sélectionnés ont attiré la plus grande attention pendant les périodes spécifiées dans le contexte en ligne plus large. Ainsi, à l’avenir, notre analyse se concentre sur ces trois sujets (Brexit, coronavirus et vaccin Covid) pour examiner les différences et les similitudes dans la production et la consommation d’informations au sein du paysage européen. Pour mener notre analyse exclusivement sur ces sujets, nous filtrons les chronologies des médias pour sélectionner uniquement les tweets pertinents au sujet choisi dans la plage horaire respective (voir la section 2 pour plus de détails).
Nous poursuivons notre étude en comparant l'engagement avec le contenu lié aux sujets identifiés sur les plateformes de médias sociaux. La figure 3 montre la répartition des interactions sur les tweets par pays, calculée comme la somme des likes, des retweets, des citations et des réponses, pour les sources d'information fiables (bleu) et les sources d'information douteuses (orange), telles que classées par NewsGuard (voir Section 2). pour chacun des trois thèmes. Malgré des variations géographiques mineures, les distributions des interactions des utilisateurs affichent une distribution similaire à longue traîne pour les trois sujets, où un petit nombre de tweets reçoivent un grand nombre d'interactions tandis que la majorité en reçoit très peu. Les sources d'information fiables ont généralement obtenu plus d'interactions que les sources douteuses
sources, comme le montre leur répartition plus large le long de l’axe des x. Cependant, quelques exceptions sont observées, comme le cas du Royaume-Uni dans les débats sur le vaccin contre la COVID-19 et de la France dans les débats sur le coronavirus. En outre, dans le discours sur le Brexit, les sources douteuses sont notablement présentes en queue de distribution en Allemagne et en Italie, bien qu’elles soient moins présentes dans d’autres discussions. Dans l’ensemble, la présence de sources douteuses et l’engagement qu’elles ont généré peuvent varier en fonction du pays et du sujet spécifique considéré.
Nous tournons ensuite notre attention vers les modes de consommation de l'information pour mettre en évidence les différences et les similitudes entre les audiences des médias. En analysant les données Twitter sur le Brexit, le coronavirus et le vaccin Covid, nous cherchons à savoir si les médias du même type sont consommés par des publics similaires. Nous définissons une métrique basée sur la similarité cosinus (voir section 2) sur les retweeteurs pour quantifier la similarité entre les médias en termes d'audience. Les médias partageant un pourcentage élevé de retweeteurs ont une valeur de mesure de similarité plus élevée (proche de 1), tandis que les médias avec seulement quelques retweeteurs partagés obtiennent une faible similarité (proche de 0).
Nous construisons ensuite un réseau non orienté dans lequel les médias sont représentés sous forme de nœuds et les bords pondérés indiquent le niveau de similarité entre eux. Nous créons un réseau pour chaque pays et sujet considéré afin de permettre une comparaison équitable. Les réseaux résultants sont visualisés dans la figure 4. Pour mettre en évidence uniquement les connexions les plus fortes, nous éliminons les arêtes dont les poids sont inférieurs à la médiane globale des arêtes de chaque réseau (voir les figures 1 et 2 de SI pour les résultats avec les réseaux complets).
Nous pouvons observer des variations dans la structure du réseau selon les pays et les thématiques considérées. En effet, la France, l’Allemagne et l’Italie ont tendance à afficher un ensemble de sources douteuses clairement identifiables (triangles orange), indiquant la présence de communautés consommant majoritairement des contenus douteux. Au Royaume-Uni, cette distinction est moins prononcée. En examinant les différences thématiques, nous constatons que pour tous les pays, à l’exception du Royaume-Uni, les réseaux ont tendance à être plus clairsemés, avec une densité de périphérie plus faible, dans le cas du Brexit. Pour les discussions sur le coronavirus et le vaccin Covid, les réseaux sont plus connectés et présentent une densité de périphérie plus élevée (voir le tableau 2 du SI). Cela se reflète dans la séparation entre les sources d'information douteuses et fiables : dans le débat sur le Brexit, la séparation entre les deux types d'informations apparaît plus claire, tandis que dans les autres débats, elles partagent un plus grand nombre de connexions, comme le montre le tableau 3 du SI. . Pour quantifier davantage ce comportement, nous appliquons l’assortativité nominale ajustée à nos réseaux (Karimi et Oliveira, 2022), montrant que des niveaux d’assortativité plus élevés sont atteints dans le contexte du débat sur le Brexit. Cependant, le Royaume-Uni affiche un comportement différent, peut-être en raison de son implication directe dans le débat.
Notre analyse révèle également qu’il n’existe pas de séparation absolue entre les médias douteux et fiables. Cela suggère que certains utilisateurs consomment principalement ou exclusivement des contenus fiables ou douteux, tandis que d’autres ont un régime d’information mixte, consommant les deux types dans des proportions variables. Pour approfondir cette question, nous analysons la fraction d'informations douteuses consommée par chaque utilisateur et présentons la répartition dans la figure 5. Les résultats indiquent que la majorité des utilisateurs dans chaque débat s'appuient principalement sur des sources d'informations fiables (voir également le tableau 4 du SI ). Cependant, dans chaque débat, il existe une fraction petite mais notable d’utilisateurs qui soutiennent exclusivement les informations douteuses, bien qu’avec des degrés d’importance variables. La figure illustre notamment une distribution bimodale distincte, avec très peu d’utilisateurs se situant en dehors des extrémités du spectre. Ces utilisateurs jouent un rôle crucial en comblant le fossé entre les informations douteuses et fiables au sein des réseaux de similarité. En outre, les sources d’information fiables ont tendance à occuper le cœur du réseau, tandis que les sources douteuses sont généralement situées dans des positions plus périphériques. En effet, parmi les 25 principales sources identifiées par l’algorithme PageRank dans chaque réseau (Bakshy et al., 2011), une majorité substantielle (au moins 95,3 %) s’avèrent être des sources d’information fiables (voir SI pour plus de détails). Nous concluons notre analyse en examinant la structure communautaire des réseaux de similarité. Nous effectuons la détection de communauté à l'aide du clustering de Louvain
(Blondel et al., 2008) et rapportent les résultats dans la figure 6. Les groupes sont codés par couleur en fonction de la proportion de médias douteux, les nuances plus foncées indiquant un pourcentage plus élevé de sources douteuses.
Dans tous les pays et tous les sujets, la majorité des clusters étaient principalement constitués de médias fiables, et au sein de ces clusters, nous trouvons également les nœuds les plus significatifs selon la classification PageRank. Cependant, notre analyse révèle également la présence de petits clusters avec une forte proportion de médias douteux. Le nombre et la taille de ces clusters varient selon les pays et les thématiques. Par exemple, en Allemagne et en Italie, il existe un cluster pour chaque sujet, tandis que dans le débat sur le Brexit en France, il existe deux clusters. Au Royaume-Uni, la séparation est moins nette, aucun cluster ne présentant un pourcentage élevé de médias douteux. Nous remarquons également que les clusters fiables ont tendance à être plus petits mais plus nombreux, tandis que les clusters douteux ont tendance à être plus grands et souvent uniques dans chaque réseau. Cela suggère que les utilisateurs qui consomment du contenu douteux ont tendance à approuver la plupart des sources douteuses du réseau, tandis que les consommateurs d'informations fiables se concentrent sur moins de médias.
Dans l’ensemble, notre analyse fournit une vue longitudinale du paysage de consommation d’informations en ligne dans les pays sélectionnés, soulignant la prédominance de sources d’information fiables tout en révélant également la présence de clusters avec une proportion plus élevée de sources d’information douteuses dans de nombreux pays et sujets. L’existence de tels clusters suggère la présence d’un groupe d’utilisateurs consommant du contenu provenant de diverses sources douteuses tout en évitant les sources fiables. Ce comportement est cohérent avec la présence potentielle de chambres d’écho, phénomène largement observé dans les débats en ligne (Cinelli et al., 2021 ; Falkenberg et al., 2022 ; Cota et al., 2019).
Cet article est disponible sur arxiv sous licence CC 4.0.