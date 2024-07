Cet article est disponible sur arxiv sous licence CC BY-NC-ND 4.0 DEED. Auteurs: (1) Brisha Jain, chercheuse indépendante Inde et [email protected] ; (2) Mainack Mondal, IIT Kharagpur Inde et [email protected].

3. COLLECTE DE DONNÉES

Dans cette section, nous décrivons notre processus de collecte de données sur Twitter. Nous avons spécifiquement collecté des données sur les interactions entre des hommes politiques indiens spécifiques et des journalistes sur Twitter, échantillonnés en fonction de leur popularité et de leur sexe. Tout d’abord, nous commençons par comment nous avons créé une liste de journalistes et d’hommes politiques indiens pour notre étude.

3.1. Identifier les comptes Twitter d'hommes politiques et de journalistes indiens





Identifier les comptes Twitter d'hommes politiques indiens individuels : nous avons exploité un ensemble de données d'hommes politiques indiens issus de recherches antérieures menées par Pal et al.[20]. Cet ensemble de données contenait les noms et identifiants de plusieurs comptes Twitter indiens impliqués dans la politique (étiquetés comme politiciens). Cependant, nous avons noté que cet ensemble de données contenait des récits d'organisations politiques (par exemple, le BJP pour les îles Andaman et Nicobar) ainsi que d'individus. À cette fin, nous avons d'abord nettoyé l'ensemble de données, en croisant les noms de cet ensemble de données avec les noms de MyNeta[3], une plateforme de référentiel de données ouverte gérée par l'Association pour les réformes démocratiques (ADR) pour apporter de la transparence aux élections indiennes. Pour chacun des récits politiques indiens de Pal et al. Dans l'ensemble de données de, nous avons recherché la plateforme MyNeta avec le nom du compte. Si la recherche n’a trouvé aucun politicien portant ce nom, alors nous écartons le récit de notre analyse car ce récit ne provient probablement pas d’un individu. Au terme de la procédure, nous nous retrouvons avec 4 484 comptes Twitter d'hommes politiques.





Identifier les comptes Twitter de journalistes politiques indiens individuels : nous nous concentrons ensuite sur les comptes Twitter marqués comme journalistes individuels à partir d'un ensemble de données d'influenceurs Twitter publié par les recherches précédentes de Pal et al. [3] (séparé des comptes des médias). Il y avait 4 099 comptes de ce type. Cependant, nous avons encore une fois été confrontés à un défi : comment pouvons-nous identifier les journalistes politiques ? Plus précisément, nous avons noté que cette liste contient plusieurs journalistes qui ne sont pas associés au journalisme politique et qui se concentrent sur des domaines tels que le divertissement, le sport, etc. Ainsi, nous avons décidé d'identifier les journalistes politiques - les comptes de journalistes qui mentionnaient directement les comptes de politiciens de manière non triviale. tweet (par exemple, après avoir actualisé les tweets contenant uniquement des émojis, des URL, des vœux d'anniversaire). À cette fin, nous avons collecté tous les tweets publiés par ces 4 099 comptes entre janvier 2020 et décembre 2022 à l’aide d’un outil open source appelé crape. Ensuite, nous avons écarté les tweets contenant uniquement des emoji, des URL, des salutations et vérifié si l'un des tweets finaux mentionnait le compte Twitter d'un homme politique indien (collecté comme décrit ci-dessus). Enfin, nous incluons 3 214 témoignages de journalistes (78,4 %) dans notre ensemble de données en tant que journalistes politiques.





Vérification de l'exactitude des comptes Twitter : Enfin, nous avons vérifié manuellement si notre approche de filtrage identifiait réellement les bons comptes Twitter d'hommes politiques et de journalistes politiques indiens. Nous avons échantillonné au hasard quarante comptes d’hommes politiques et vingt journalistes. Ensuite, un auteur a visité les comptes Twitter réels et lu les 20 premiers tweets pour s'assurer que le compte appartenait bien à un homme politique (ou journaliste politique) indien. Dans 92,5 % de l’échantillon aléatoire, notre approche de filtrage a correctement identifié les comptes Twitter d’hommes politiques (ou de journalistes politiques) indiens.

3.2. Déduire le sexe des hommes politiques et des journalistes politiques indiens

Nous déduisons ensuite le sexe des comptes Twitter des hommes politiques indiens (ou journalistes politiques) identifiés dans la section précédente. Pour cela, nous avons utilisé un service appelé Generize [25]. Ce service mappe les noms aux genres, est personnalisé aux noms indiens, et des études antérieures ont rapporté une grande précision dans l'inférence de genre à partir de ce service [19]. Une fois que nous avons déduit le sexe de tous les comptes, pour cette étude, nous nous sommes concentrés sur les comptes de politiciens et de journalistes les plus populaires (en nombre de followers). Plus précisément, nous avons trié les comptes de politiciens en fonction du nombre d'abonnés et identifié les 50 principaux comptes d'hommes politiques et de femmes politiques (tels qu'identifiés par Genderize). Nous avons en outre vérifié manuellement l'exactitude du sexe déduit pour ces 100 comptes Twitter. Nous avons également identifié les 100 comptes de journalistes les plus populaires (50 hommes et 50 femmes).

3.3. Collecte de données sur les interactions Twitter entre journalistes et politiciens

Enfin, pour répondre à nos questions de recherche, nous collectons des données d'interaction entre les récits des hommes politiques indiens et des journalistes politiques. Plus précisément, nous avons collecté tous les tweets publiés par 100 comptes de journalistes politiques populaires, puis filtré les tweets mentionnant l'un des 100 politiciens indiens populaires de notre ensemble de données. Ainsi, nous avons divisé nos tweets collectés dans les quatre catégories suivantes : les tweets de journalistes masculins mentionnant des hommes politiques ( MJ-MP ), les tweets de journalistes féminines mentionnant des hommes politiques ( FJ-MP ), les tweets de journalistes masculins mentionnant des femmes politiques ( MJ-FP ) et les femmes. journaliste mentionnant les femmes politiques ( FJ-FP ). Au total, nous avons collecté 21 188 tweets uniques. Notez qu’un seul tweet peut mentionner plusieurs comptes.









Nous notons que presque toutes les centaines de journalistes de tous genres ont mentionné collectivement les comptes politiques populaires que nous avons choisis dans leurs tweets. De plus, le tableau 1 présente le nombre de tweets dans nos quatre catégories. Il convient de noter que les récits de femmes politiques ont été considérablement moins mentionnés par les journalistes indiens, hommes et femmes. Nous avons maintenant analysé ces données d'interaction collectées sur Twitter pour identifier les préjugés sexistes potentiels dans les interactions journaliste-homme politique sur Twitter indien. De plus, le tableau 2 présente des extraits de tweets de chacune des quatre catégories. Ces exemples démontrent que de nombreux tweets de notre ensemble de données dans différentes catégories sont liés aux décisions politiques et à la gouvernance générale.









