Этот документ доступен на arxiv под лицензией CC BY-NC-ND 4.0 DEED.
Авторы:
(1) Бриша Джайн, независимый исследователь из Индии, [email protected];
(2) Майнак Мондал, ИИТ Харагпур Индия и [email protected].
В этой работе мы в первую очередь провели количественный анализ, чтобы выявить общую предвзятость во взаимодействии индийских журналистов и политиков. В частности, мы провели частотный анализ с использованием статистического тестирования, анализа эмоций и тематического анализа собранных твитов.
Статистический анализ частоты и популярности взаимодействия. Чтобы проанализировать гендерную предвзятость в частоте взаимодействия между журналистами и политиками, мы изучаем популярность твитов между журналистами и политиками независимо от пола политиков. Если журналисты действительно пропагандируют гендерную предвзятость, мы ожидали увидеть больше твитов журналистов-мужчин с упоминанием политиков-мужчин, чем с упоминанием политиков-женщин. Мы ожидаем, что женщины-журналисты будут меньше или столько же писать в Твиттере о политиках-мужчинах, как о политиках-женщинах. Чтобы проверить гендерную предвзятость в том, какую популярность твиты политиков получают от журналистов, мы также изучаем популярность твитов (посредством ретвитов, ответов и лайков на эти твиты). Мы используем H-тест Крускала-Уоллиса, чтобы определить, существуют ли существенные различия в разных категориях твитов. Кроме того, мы используем парный U-тест Манна-Уитни для более детального анализа различий в популярности между нашими четырьмя категориями.
Анализ эмоций. Чтобы изучить гендерную предвзятость в содержании твитов, адресованных политикам со стороны журналистов, мы используем эмоциональный анализ твитов (с использованием TweetNLP, передового многоязычного инструмента обнаружения эмоций на основе модели большого языка [6]) из Категории «MJ-MP», «MJ-FP», «FJ-MP» и «FJ-FP». В частности, мы стремимся проверить различия в этих твитах на предмет выражений «Гнев», «Радость», «Оптимизм» и «Печаль». Мы используем тест Крускала-Уоллиса H, чтобы определить, существуют ли существенные различия в оценках эмоций твитов (по четырем измерениям) из наших категорий.