यह पेपर arxiv पर CC BY-NC-ND 4.0 DEED लाइसेंस के अंतर्गत उपलब्ध है।
लेखक:
(1) बृषा जैन, स्वतंत्र शोधकर्ता भारत और [email protected];
(2) मैनाक मोंडल, आईआईटी खड़गपुर भारत और [email protected].
पहले शोध प्रश्न का उत्तर जानने के लिए, हमने सबसे पहले यह जांच की कि क्या ट्विटर पर राजनेताओं और पत्रकारों के बीच बातचीत की आवृत्ति (अर्थात उल्लेख की आवृत्ति) में लैंगिक पूर्वाग्रह है।
पत्रकार पुरुष राजनेताओं का अधिक बार उल्लेख करते हैं: चित्र 1a, पुरुष और महिला राजनेताओं का उल्लेख करने वाले पत्रकारों द्वारा पोस्ट किए गए ट्वीट्स की संख्या के CDF की तुलना करता है। हम इस आंकड़े से एक दिलचस्प अवलोकन करते हैं। जब प्राप्तकर्ता राजनेता पुरुष होता है (यानी, MJ-MP और FJ-MP श्रेणियों में), तो उल्लेखित ट्वीट्स की संख्या (और इसलिए पत्रकार-राजनेता बातचीत की आवृत्ति) अधिक होती है जब महिला राजनेता प्राप्तकर्ता होती हैं। उस अंत तक, चार श्रेणियों के भीतर प्रति पत्रकार ट्वीट्स की संख्या के बीच एक क्रुस्कल-वालिस परीक्षण ने श्रेणियों में काफी सांख्यिकीय रूप से महत्वपूर्ण अंतर प्रकट किया ( p << 0.05)। फिर हमने चार श्रेणियों (MJ-MP, MJ-FP, FJ-MP, FJ-FP) के बीच अनुवर्ती कार्रवाई के लिए जोड़ीदार मान-व्हिटनी परीक्षण किए। हालांकि, पुरुष/महिला पत्रकारों द्वारा पुरुष राजनेताओं का उल्लेख कितनी बार किया जाता है, और महिला राजनेताओं का उल्लेख कितनी बार किया जाता है, इसमें सांख्यिकीय रूप से महत्वपूर्ण अंतर हैं (सभी p << 0.05)। इसके बाद हम पुरुष बनाम महिला राजनेताओं के प्रति निर्देशित प्रति ट्वीट लोकप्रियता की तुलना करते हैं।
हमारे अवलोकन का तात्पर्य है कि भारत में ट्विटर उपयोगकर्ता महिला राजनेताओं पर पुरुष पत्रकारों के विचारों को महिला राजनेताओं पर महिला पत्रकारों के विचारों की तुलना में अधिक विश्वसनीयता देते हैं। ये अवलोकन "रीट्वीट" के लिए भी सही हैं। कुल मिलाकर, ट्वीट्स की इन चार श्रेणियों के हमारे लोकप्रियता विश्लेषण से पता चलता है कि पत्रकारों को राजनेताओं के साथ अपनी बातचीत में स्पष्ट पूर्वाग्रह का सामना नहीं करना पड़ता है, लेकिन सक्रिय ट्विटर उपयोगकर्ताओं से इन बातचीत में उत्पन्न होने वाली रुचि की मात्रा में लैंगिक पूर्वाग्रह के अस्तित्व का समर्थन करने के लिए सबूत हैं।
पिछले भाग में, हमारे विश्लेषण से पुरुष और महिला पत्रकारों दोनों में पुरुष राजनेताओं के प्रति एक महत्वपूर्ण पूर्वाग्रह दिखा - पुरुष राजनेताओं का उल्लेख करने वाले ट्वीट अधिक बार होते हैं और साथ ही अधिक लोकप्रिय भी होते हैं। हालाँकि, उस उद्देश्य के लिए, हमने जाँच की कि क्या इन ट्वीट की सामग्री इस पूर्वाग्रह के लिए ज़िम्मेदार हो सकती है। विशेष रूप से, हमने पुरुष / महिला पत्रकारों द्वारा लिखे गए और पुरुष / महिला राजनेताओं के लिए निर्देशित ट्वीट की भावना और विषय की जाँच की।
5.2.1. भावना विश्लेषण : हमने प्रत्येक श्रेणी के ट्वीट्स की भावनाओं का पता लगाने के लिए TweetNLP उपकरण का उपयोग किया [6]। TweetNLP भावनाओं का पता लगाने के लिए एक डायक्रोनिक लार्ज-लैंग्वेज मॉडल (TimeLMs) आधारित दृष्टिकोण प्रदान करता है, विशेष रूप से बहुभाषी ट्वीट्स से। इस विश्लेषण का लक्ष्य यह निर्धारित करना है कि क्या ट्वीट्स के भावनात्मक स्कोर में महत्वपूर्ण अंतर हैं - यदि ऐसा है तो यह प्रेषक और प्राप्तकर्ता के लिंग के आधार पर ट्वीट्स में निहित लिंग पूर्वाग्रह का संकेत हो सकता है। हमने चार मुख्य भावनाओं पर विचार किया: क्रोध, खुशी, आशावाद और उदासी और चार श्रेणियों में से प्रत्येक में प्रत्येक ट्वीट को इन आयामों के साथ भावना स्कोर के लिए सौंपा गया था। फिर हमने यह पता लगाने के लिए क्रुस्कल-वालिस परीक्षण किया कि क्या चार श्रेणियों (एमजे-एमपी, एमजे-एफपी, एफजे-एमपी, एफजे-एफपी) में से कोई भी भावना अलग थी। हमने पाया कि चार परीक्षणों में से प्रत्येक के लिए पी -मान (प्रत्येक भावना के लिए एक) 0.16 से 0.99 तक था, जो ट्वीट्स की भावनाओं के भीतर कोई सांख्यिकीय रूप से महत्वपूर्ण अंतर नहीं दर्शाता है।
5.2.2. विषय विश्लेषण: आगे की खोज के लिए, हमने चार श्रेणियों में एकत्रित ट्वीट्स (लेटेंट डिरिचलेट आवंटन या LDA का उपयोग करके) का विषय विश्लेषण किया। लक्ष्य यह जांचना था कि क्या ट्वीट्स के विषय प्रेषक या प्राप्तकर्ता के लिंग के आधार पर बदलते हैं। जैसा कि अनुभाग 4 में वर्णित है, हमने प्रत्येक श्रेणी के लिए विषयों की इष्टतम संख्या (जो अनिवार्य रूप से शब्दों के समूह हैं) की पहचान की और LDA एल्गोरिथ्म का उपयोग करके प्रत्येक विषय के लिए सबसे महत्वपूर्ण पाँच शब्दों की पहचान की। चार श्रेणियों में से प्रत्येक के लिए, विषयों की इष्टतम संख्या तेरह थी। इसके बाद, हमने ट्वीट्स की प्रत्येक श्रेणी के लिए LDA एल्गोरिथ्म का उपयोग करके तेरह विषयों की पहचान की और पता लगाए गए विषयों के लिए एक महत्वपूर्ण शब्द विश्लेषण किया। विशेष रूप से, ट्वीट्स की प्रत्येक श्रेणी के लिए हमने विषयों (जैसे, MJ-MP से विषय) का चयन किया और प्रत्येक विषय का प्रतिनिधित्व करने वाले महत्वपूर्ण शब्दों को चुना। फिर प्रत्येक विषय के लिए हमने जाँच की कि क्या वे शब्द ट्वीट्स की अन्य श्रेणियों से पता लगाए गए विषयों में भी पाए गए हैं (यदि पाए गए तो यह संकेत देगा कि विषयों का प्रतिनिधित्व करने वाले शब्द ट्वीट्स की अन्य श्रेणियों से पता लगाए गए विषयों में भी मौजूद हैं)। ट्वीट्स की चारों श्रेणियों में से प्रत्येक के लिए औसतन 81.5% से 93.8% महत्वपूर्ण शब्द (विषयों का प्रतिनिधित्व करते हैं) अन्य श्रेणियों के ट्वीट्स से पहचाने गए विषयों में पाए जाते हैं।
यह विश्लेषण भावना विश्लेषण से हमारे अवलोकन का समर्थन करता है - उन चार श्रेणियों में ट्वीट की सामग्री समान है। हालाँकि, फिर भी पुरुष राजनेताओं को निर्देशित ट्वीट महिला राजनेताओं को निर्देशित ट्वीट की तुलना में अधिक बातचीत को आकर्षित करते हैं। आगे हम इस लिंग पूर्वाग्रह के संभावित कारण का पता लगाते हैं।
5.3.1. भारतीय ट्विटर में अंतर्निहित लैंगिक पूर्वाग्रह : हमने शीर्ष राजनेताओं के बारे में एक सरल सांख्यिकी की जाँच की - सबसे लोकप्रिय राजनेताओं (ट्विटर फ़ॉलोअर्स की संख्या के आधार पर) में से कितने पुरुष बनाम महिला हैं। इस उद्देश्य के लिए, हमने शीर्ष राजनेताओं के अपने डेटासेट का लाभ उठाया और शीर्ष 85 राजनेताओं (जिनके ट्विटर अकाउंट भी इस अध्ययन का हिस्सा हैं) के लिंग की जाँच की। इस विश्लेषण से शीर्ष राजनेताओं के बीच एक परेशान करने वाला लैंगिक असंतुलन सामने आया - 85 शीर्ष राजनेताओं में से 58 पुरुष और 26 महिलाएँ हैं। इस प्रकार, लोकप्रिय पुरुष राजनेताओं की संख्या लोकप्रिय महिला राजनेताओं की तुलना में लगभग दोगुनी है। हम मानते हैं कि यह असमानता पुरुष राजनेताओं द्वारा आम जनता के साथ-साथ पत्रकारों से भी काफी अधिक बातचीत आकर्षित करने की हमारी देखी गई घटना के पीछे एक प्रमुख कारण है।
वास्तव में, यह असमानता समाज में गहराई से समाए एक प्रणालीगत पूर्वाग्रह को दर्शाती है। यह लैंगिक असमानता ट्विटर के क्षेत्र तक भी अपना प्रभाव बढ़ाती है, जहाँ पुरुष राजनेता अपनी महिला समकक्षों की तुलना में अधिक संख्या में फ़ॉलोअर्स प्राप्त करते हैं। यह घटना अलग-थलग नहीं है; यह विभिन्न क्षेत्रों में व्याप्त है, जैसा कि उद्योगों में शीर्ष पदों पर पुरुषों के प्रभुत्व से स्पष्ट होता है। कॉर्पोरेट बोर्डरूम, प्रौद्योगिकी फर्मों और मनोरंजन क्षेत्र में, नेतृत्व की भूमिकाएँ मुख्य रूप से पुरुषों द्वारा निभाई जाती हैं। सामाजिक मानदंडों में निहित यह व्यवस्थित पूर्वाग्रह, सामाजिक पूंजी और सत्ता के पदों की प्राप्ति के बीच मजबूत सहसंबंध द्वारा और भी मजबूत होता है। नतीजतन, ट्विटर पर लोकप्रियता इस अंतर्निहित पूर्वाग्रह का एक स्पष्ट प्रतिबिंब के रूप में कार्य करती है। इन असमानताओं को संबोधित करना लैंगिक समानता को बढ़ावा देने और समाज में गहराई से जड़ जमाए हुए पूर्वाग्रहों को खत्म करने के लिए सर्वोपरि है।