Dieses Dokument ist auf arxiv unter der Lizenz CC BY-NC-ND 4.0 DEED verfügbar.
Autoren:
(1) Brisha Jain, unabhängige Forscherin in Indien und [email protected];
(2) Mainack Mondal, IIT Kharagpur Indien und [email protected].
In diesem Abschnitt beschreiben wir unseren Datenerfassungsprozess bei Twitter. Wir haben speziell Daten über die Interaktionen zwischen bestimmten indischen Politikern und Journalisten auf Twitter gesammelt, wobei wir Stichproben anhand ihrer Popularität und ihres Geschlechts ausgewählt haben. Zunächst beginnen wir damit, wie wir für unsere Studie eine Liste indischer Journalisten und Politiker erstellt haben.
Identifizierung der Twitter-Konten einzelner indischer Politiker: Wir nutzten einen Datensatz indischer Politiker aus einer früheren Studie von Pal et al. [20]. Dieser Datensatz enthielt Namen und Handles mehrerer indischer Twitter-Konten, die politisch aktiv sind (als Politiker gekennzeichnet). Wir stellten jedoch fest, dass dieser Datensatz sowohl Konten politischer Organisationen (z. B. BJP für die Andamanen und Nikobaren) als auch von Einzelpersonen enthielt. Zu diesem Zweck bereinigten wir zunächst den Datensatz, indem wir die Namen aus diesem Datensatz mit Namen aus MyNeta [3] abglichen, einer Open-Data-Repository-Plattform, die von der Association for Democratic Reforms (ADR) betrieben wird, um Transparenz bei indischen Wahlen zu schaffen. Für jeden der indischen politischen Accounts im Datensatz von Pal et al. durchsuchten wir die MyNeta-Plattform mit dem Namen des Accounts. Wenn die Suche keine Politiker mit diesem Namen ergab, schlossen wir den Account aus unserer Analyse aus, da dieser Account wahrscheinlich nicht von einer Einzelperson stammt. Am Ende des Verfahrens hatten wir 4.484 Twitter-Accounts von Politikern.
Identifizierung der Twitter-Konten einzelner indischer Politikjournalisten: Als Nächstes konzentrieren wir uns auf die Twitter-Konten, die als einzelne Journalisten gekennzeichnet sind, aus einem Datensatz von Twitter-Influencern, der von Pal et al. in ihrer früheren Forschung [3] veröffentlicht wurde (getrennt von den Konten der Medienhäuser). Es gab 4.099 solcher Konten. Wir standen jedoch erneut vor einer Herausforderung: Wie können wir die Politikjournalisten identifizieren? Insbesondere stellten wir fest, dass diese Liste mehrere Journalisten enthält, die nicht mit der politischen Berichterstattung in Verbindung stehen und sich auf Bereiche wie Unterhaltung, Sport usw. konzentrieren. Daher machten wir uns daran, Politikjournalisten zu identifizieren – Journalistenkonten, die die Konten von Politikern in einem nicht trivialen Tweet direkt erwähnten (z. B. nach Abzug von Tweets mit nur Emojis, URLs, Geburtstagsgrüßen). Zu diesem Zweck sammelten wir mit einem Open-Source-Tool namens crape alle Tweets, die zwischen Januar 2020 und Dezember 2022 von diesen 4.099 Konten gepostet wurden. Dann haben wir Tweets mit nur Emojis, URLs und Grüßen ausgeschlossen und überprüft, ob in einem der letzten Tweets der Twitter-Account eines einzelnen indischen Politikers erwähnt wurde (wie oben beschrieben erfasst). Schließlich haben wir 3.214 Journalisten-Accounts (78,4 %) als politische Journalisten in unseren Datensatz aufgenommen.
Überprüfung der Genauigkeit von Twitter-Konten: Abschließend überprüften wir manuell, ob unser Filteransatz tatsächlich die richtigen Twitter-Konten indischer Politiker und politischer Journalisten identifizierte. Wir wählten eine zufällige Stichprobe von vierzig Politiker- und zwanzig Journalistenkonten aus. Anschließend besuchte ein Autor die tatsächlichen Twitter-Konten und las die ersten 20 Tweets, um sicherzustellen, dass das Konto tatsächlich einem indischen Politiker (oder politischen Journalisten) gehörte. In 92,5 % der Zufallsstichprobe identifizierte unser Filteransatz die Twitter-Konten indischer Politiker (oder politischer Journalisten) korrekt.
Als nächstes ermitteln wir das Geschlecht der Twitter-Konten indischer Politiker (oder politischer Journalisten), wie im vorherigen Abschnitt ermittelt. Zu diesem Zweck verwendeten wir einen Dienst namens Generize [25]. Dieser Dienst ordnet Namen Geschlechtern zu, ist auf indische Namen zugeschnitten, und frühere Studien berichteten von einer hohen Genauigkeit der Geschlechtsermittlung durch diesen Dienst [19]. Nachdem wir das Geschlecht aller Konten ermittelt haben, konzentrierten wir uns für diese Studie auf die beliebtesten (nach Anzahl der Follower) Konten von Politikern und Journalisten. Insbesondere sortierten wir die Politikerkonten nach der Anzahl der Follower und ermittelten die Top 50 Konten für männliche und weibliche Politiker (wie von Genderize ermittelt). Die Genauigkeit des abgeleiteten Geschlechts für diese 100 Twitter-Konten haben wir anschließend manuell überprüft. Auf ähnliche Weise ermittelten wir die beliebtesten 100 Journalistenkonten (50 männliche und 50 weibliche).
Um unsere Forschungsfragen zu beantworten, erheben wir abschließend Interaktionsdaten zwischen den Accounts indischer Politiker und politischer Journalisten. Konkret haben wir alle Tweets von 100 populären politischen Journalistenaccounts gesammelt und dann die Tweets herausgefiltert, in denen einer der 100 populären indischen Politiker in unserem Datensatz erwähnt wurde. Daher haben wir unsere gesammelten Tweets in die folgenden vier Kategorien unterteilt: Tweets männlicher Journalisten mit Erwähnungen männlicher Politiker ( MJ-MP ), Tweets weiblicher Journalisten mit Erwähnungen männlicher Politiker ( FJ-MP ), Tweets männlicher Journalisten mit Erwähnungen weiblicher Politiker ( MJ-FP ) und weiblicher Journalisten mit Erwähnungen weiblicher Politiker ( FJ-FP ). Insgesamt haben wir 21.188 einzigartige Tweets gesammelt. Beachten Sie, dass ein einzelner Tweet mehrere Accounts erwähnen kann.
Wir stellen fest, dass fast alle hundert Journalisten beiderlei Geschlechts unsere ausgewählten Konten beliebter Politiker in ihren Tweets erwähnten. Darüber hinaus zeigt Tabelle 1 die Anzahl der Tweets in unseren vier Kategorien. Bemerkenswert ist, dass die Konten weiblicher Politiker von indischen Journalisten sowohl bei männlichen als auch bei weiblichen deutlich weniger erwähnt wurden. Nun haben wir diese von Twitter gesammelten Interaktionsdaten analysiert, um potenzielle geschlechtsspezifische Voreingenommenheit in den Interaktionen zwischen Journalisten und Politikern im indischen Twitter zu identifizieren. Darüber hinaus zeigt Tabelle 2 Tweet-Auszüge aus jeder der vier Kategorien. Diese Beispiele zeigen, dass sich viele der Tweets in unserem Datensatz in verschiedenen Kategorien auf politische Entscheidungen und allgemeine Regierungsführung beziehen.
[3] https://www.myneta.info/