이 문서는 CC BY-NC-ND 4.0 DEED 라이센스에 따라 arxiv에서 볼 수 있습니다.
저자:
(1) Brisha Jain, 인도 독립 연구원 및 [email protected];
(2) Mainack Mondal, IIT Kharagpur India 및 [email protected].
첫 번째 연구 질문에 대한 답을 탐색하기 위해 우리는 트위터에서 정치인과 언론인 간의 상호 작용 빈도(즉, 언급 빈도)에 성별 편견이 있는지 확인하는 것부터 시작했습니다.
언론인들은 남성 정치인을 더 자주 언급합니다. 그림 1a는 남성 정치인과 여성 정치인을 언급하는 언론인이 게시한 트윗 수의 CDF를 비교합니다. 우리는 이 그림에서 흥미로운 관찰을 합니다. 수신 정치인이 남성인 경우(예: MJ-MP 및 FJ-MP 카테고리) 여성 정치인이 수신 측에 있을 때 언급된 트윗 수(따라서 언론인-정치인 상호 작용 빈도)가 더 높습니다. 이를 위해 네 가지 범주 내 언론인당 트윗 수에 대한 Kruskal-Wallis 테스트를 통해 범주 전반에 걸쳐 통계적으로 상당히 유의미한 차이가 나타났습니다( p << 0.05). 그런 다음 네 가지 범주(MJ-MP, MJ-FP, FJ-MP, FJ-FP) 중 후속 조치를 위해 쌍별 Mann-Whitney 테스트를 수행했습니다. 남성 또는 여성 언론인이 남성 정치인 계정을 언급하는 경우 통계적으로 유의미한 차이가 없습니다. 마찬가지로, 남성 언론인이나 여성 언론인이 여성 정치인 계정을 언급하는 경우 통계적으로 유의미한 차이가 없습니다. 그러나 남성/여성 언론인이 남성 정치인을 언급하는 빈도와 여성 정치인을 언급하는 빈도에는 통계적으로 유의미한 차이가 있습니다(모두 p << 0.05). 다음으로 남성 정치인과 여성 정치인을 향한 트윗당 인기를 비교합니다.
블리). 우리의 관찰은 인도의 트위터 사용자들이 여성 정치인에 대한 여성 언론인의 견해보다 여성 정치인에 대한 남성 언론인의 견해에 더 큰 신뢰를 두는 것 같다는 것을 의미합니다. 이러한 관찰은 "리트윗"에도 적용됩니다. 전반적으로, 이 네 가지 범주의 트윗에 대한 우리의 인기 분석은 언론인이 정치인과의 상호 작용에서 명시적인 편견을 겪지는 않지만 이러한 상호 작용이 활성 트위터 사용자로부터 창출하는 관심의 양에 있어서 성별 편견이 존재한다는 것을 뒷받침하는 증거가 있음을 보여줍니다.
마지막 섹션에서 우리의 분석은 남성과 여성 저널리스트 모두에서 남성 정치인에 대한 상당한 편견을 보여주었습니다. 즉, 남성 정치인을 언급하는 트윗이 더 빈번하고 인기가 높습니다. 그러나 이를 위해 우리는 이러한 트윗의 내용이 이러한 편견에 책임이 있는지 확인했습니다. 구체적으로 남성/여성 언론인이 남성/여성 정치인을 대상으로 작성한 트윗의 감성과 주제를 확인했습니다.
5.2.1. 감정 분석. : 각 카테고리에 대한 트윗의 감정을 탐지하기 위해 TweetNLP 도구를 사용했습니다[6]. TweetNLP는 특히 다국어 트윗에서 감정을 감지하기 위한 통시적 대형 언어 모델(TimeLM) 기반 접근 방식을 제공합니다. 이 분석의 목표는 트윗의 감정 점수에 유의미한 차이가 있는지 확인하는 것입니다. 즉, 보낸 사람과 받는 사람의 성별에 따라 트윗에 본질적으로 성별 편견이 있음을 나타낼 수 있는 경우입니다. 우리는 분노, 기쁨, 낙천주의, 슬픔이라는 네 가지 주요 감정을 고려했으며, 네 가지 범주 각각의 각 트윗에 이러한 차원에 따른 감정 점수가 할당되었습니다. 그런 다음 Kruskal-Wallis 테스트를 수행하여 네 가지 범주(MJ-MP, MJ-FP, FJ-MP, FJ-FP)에 걸쳐 감정이 다른지 확인했습니다. 우리는 네 가지 테스트 각각(각 감정에 대해 하나씩)에 대한 p 값의 범위가 0.16에서 0.99라는 것을 발견했는데, 이는 트윗의 감정에 통계적으로 유의미한 차이가 없음을 암시합니다.
5.2.2. 주제 분석. : 더 자세히 알아보기 위해 4개 카테고리에 걸쳐 수집된 트윗(LDA(Latent Dirichlet Allocation) 사용)에 대한 주제 분석을 수행했습니다. 목표는 보낸 사람이나 받는 사람의 성별에 따라 트윗의 주제가 바뀌는지 확인하는 것이었습니다. 섹션 4에 설명된 대로 우리는 각 범주에 대한 최적의 주제 수(기본적으로 단어 클러스터)를 식별하고 LDA 알고리즘을 사용하여 각 주제에 대해 가장 중요한 5개의 단어를 식별했습니다. 네 가지 범주 각각에 대해 최적의 주제 수는 13개였습니다. 다음으로, 각 트윗 카테고리에 대해 LDA 알고리즘을 사용하여 13개의 주제를 식별하고 탐지된 주제에 대해 중요한 단어 분석을 수행했습니다. 구체적으로, 트윗의 각 카테고리에 대해 주제(예: MJ-MP의 주제)를 선택하고 각 주제를 대표하는 중요한 단어를 선택했습니다. 그런 다음 각 주제에 대해 해당 단어가 다른 트윗 카테고리에서 감지된 주제에도 나타나는지 확인했습니다(발견된 경우 주제를 나타내는 단어가 다른 트윗 카테고리에서 감지된 주제에도 존재함을 나타냅니다). 네 가지 트윗 카테고리 각각에 대해 평균 81.5% ~ 93.8%의 중요한 단어(주제를 나타냄)가 다른 카테고리의 트윗에서 감지된 주제에서 발생합니다.
이 분석은 감정 분석을 통한 우리의 관찰을 뒷받침합니다. 즉, 이 네 가지 범주의 트윗 내용이 동일합니다. 그러나 여전히 남성 정치인을 향한 트윗은 여성 정치인을 향한 트윗에 비해 더 많은 상호 작용을 유도합니다. 다음으로 우리는 이러한 성별 편견의 잠재적인 이유를 탐구합니다.
5.3.1. 인도 트위터의 내재된 성별 편견 : 우리는 최고 정치인에 관한 간단한 통계를 확인했습니다. 즉, 가장 인기 있는 정치인 중 남성과 여성의 비율(트위터 팔로어 수 기준)이 몇 명인지 알아보았습니다. 이를 위해 우리는 최고 정치인의 데이터 세트를 활용하고 상위 85명의 정치인(트위터 계정도 이 연구의 일부임)의 성별을 확인했습니다. 이 분석은 최고 정치인들 사이에 불안한 성별 불균형이 있음을 밝혀냈습니다. 최고 정치인 85명 중 58명이 남성이고 26명이 여성입니다. 따라서 인기 있는 남성 정치인의 수가 인기 있는 여성 정치인에 비해 거의 두 배에 달합니다. 우리는 이러한 불평등이 남성 정치인이 일반 대중과 언론인으로부터 훨씬 더 많은 상호 작용을 끌어들이는 현상의 주요 이유 중 하나라고 가정합니다.
실제로 이러한 불평등은 사회에 깊이 뿌리박힌 체계적 편견을 반영합니다. 이러한 성별 격차는 남성 정치인이 여성 정치인보다 더 많은 팔로워를 확보하는 경향이 있는 트위터 영역까지 영향력을 확장합니다. 이 현상은 고립된 것이 아닙니다. 산업 전반에 걸쳐 최고 위치에 있는 남성의 지배력에서 알 수 있듯이 이는 다양한 부문에 스며들어 있습니다. 기업 이사회, 기술 회사, 엔터테인먼트 부문에서 리더십 역할은 주로 남성이 차지합니다. 사회적 규범에 뿌리를 둔 이러한 체계적인 편견은 사회적 자본과 권력 지위 획득 사이의 강한 상관관계에 의해 더욱 강화됩니다. 결과적으로 트위터에서의 인기는 이러한 본질적인 편견을 극명하게 반영합니다. 이러한 불균형을 해결하는 것은 성평등을 촉진하고 사회에 깊이 뿌리내린 편견을 해체하는 데 가장 중요합니다.