이 문서는 CC BY-NC-ND 4.0 DEED 라이센스에 따라 arxiv에서 볼 수 있습니다.
저자:
(1) Brisha Jain, 인도 독립 연구원 및 [email protected];
(2) Mainack Mondal, IIT Kharagpur India 및 [email protected].
이 작업에서 우리는 주로 인도 언론인-정치인 상호 작용의 일반적인 편견을 밝히기 위해 정량적 분석을 수행했습니다. 구체적으로는 수집된 트윗을 대상으로 통계적 테스트, 감성분석, 주제분석 등을 활용한 빈도분석을 실시하였습니다.
상호작용 빈도 및 인기도에 대한 통계적 분석: 언론인과 정치인 간의 상호작용 빈도에 대한 성별 편향을 분석하기 위해 정치인의 성별에 따라 언론인과 정치인 간의 트윗 인기도를 조사합니다. 언론인들이 실제로 성 편견을 조장한다면, 우리는 남성 언론인들이 여성 정치인을 언급하는 것보다 남성 정치인을 언급하는 트윗을 더 많이 볼 것으로 예상했습니다. 우리는 여성 언론인들이 여성 정치인에 대해 하는 것만큼 남성 정치인에 대해 덜 또는 많이 트윗할 것으로 기대합니다. 정치인의 트윗이 언론인으로부터 받는 견인력에서 성별 편견을 확인하기 위해 우리는 트윗의 인기도(해당 트윗에 대한 리트윗, 답글, 좋아요를 통해)도 조사합니다. 우리는 Kruskal-Wallis H-Test를 사용하여 다양한 트윗 카테고리에 중요한 차이가 있는지 확인합니다. 또한, 우리는 쌍별 Mann-Whitney U-test를 사용하여 4개 범주의 인기도 차이를 보다 세부적으로 분석합니다.
감정 분석: 언론인이 정치인에게 보낸 트윗 내용의 성별 편견을 조사하기 위해 우리는 트윗의 감정 분석을 사용합니다(최첨단 대규모 언어 모델 기반 트위터 전용 다국어 감정 탐지 도구인 TweetNLP 사용[6]). "MJ-MP", "MJ-FP", "FJ-MP" 및 "FJ-FP" 카테고리입니다. 구체적으로 우리는 이러한 트윗에서 "분노", "기쁨", "낙천주의" 및 "슬픔" 표현에 대한 차이점을 테스트하려고 합니다. 우리는 KruskalWallis H 테스트를 사용하여 카테고리의 트윗 감정 점수(4개 차원에 따라)에 중요한 차이가 있는지 확인합니다.