यह पेपर CC BY-NC-SA 4.0 DEED लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।
लेखक:
(1) क्रिस्टीना एस्पाना-बोनेट, डीएफकेआई जीएमबीएच, सारलैंड इंफॉर्मेटिक्स कैम्पस।
मीडिया स्रोतों में संपादकीय लाइन और उससे जुड़ा पूर्वाग्रह होता है। राजनीतिक पूर्वाग्रहों से छुटकारा पाना इंसानों के लिए मुश्किल है, लेकिन उनके बारे में जागरूक होने से हमें खबरों का वैश्विक दृष्टिकोण प्राप्त करने में मदद मिलती है। पूर्वाग्रह कभी-कभी स्पष्ट होते हैं और/या हानिकारक पाठ के रूप में दिखाई देते हैं, लेकिन कभी-कभी सूक्ष्म और पता लगाना मुश्किल होते हैं। ये सूक्ष्म छिपे हुए पूर्वाग्रह संभावित रूप से खतरनाक होते हैं और जब भी हम उनके बारे में नहीं जानते हैं तो हेरफेर की ओर ले जाते हैं। इस काम में, हमने ChatGPT और Bard के पीछे सूक्ष्म राजनीतिक पूर्वाग्रहों का व्यवस्थित रूप से अध्ययन किया, जो बिना किसी व्यक्तित्व भूमिका के दिखाई देते हैं (देशपांडे एट अल., 2023)। हमने दिखाया कि ChatGPT का अभिविन्यास समय के साथ बदलता है और यह भाषाओं के बीच अलग-अलग होता है। फरवरी और अगस्त 2023 के बीच, ChatGPT ने वामपंथी से तटस्थ राजनीतिक अभिविन्यास में संक्रमण किया, जिसमें अंग्रेजी और स्पेनिश के लिए बीच में एक दक्षिणपंथी झुकाव अवधि थी। Bard के विकास का अभी तक अध्ययन नहीं किया जा सकता है। अगस्त 2023 तक इसका वर्तमान संस्करण लगातार अध्ययन के तहत 4 भाषाओं के लिए वामपंथी झुकाव दिखाता है। यह पूर्वाग्रह मॉडल द्वारा उत्पन्न तथ्यात्मक गलतियों पर स्वतंत्र है, और इसके उपयोगकर्ताओं द्वारा भी इस पर विचार किया जाना चाहिए। हम शून्य-शॉट दृष्टिकोण का उपयोग करते हुए संयुक्त राज्य अमेरिका, जर्मनी और स्पेन के साथ-साथ निकट से संबंधित राजनीतिक संदर्भों और भाषाओं में पाठ निर्माण में पूर्वाग्रह की नियमित जांच करने के लिए मॉडल प्रदान करते हैं।
हमारे विश्लेषण के उप-उत्पाद के रूप में, हमने राजनीतिक रुख और विषय के मोटे एनोटेशन के साथ 1.2 मिलियन समाचार पत्र लेखों का एक बहुभाषी कॉर्पस बनाया। हम दिखाते हैं कि दूरस्थ पर्यवेक्षण हमें मोटे राजनीतिक रुख वर्गीकरण के लिए सार्थक मॉडल बनाने की अनुमति देता है जब तक कि कॉर्पस विविधतापूर्ण हो। हम इस डेटा को एलएम पीढ़ियों और ज़ेनोडो (एस्पाना-बोनेट, 2023) और गिटहब के माध्यम से हमारे कोड के साथ उपलब्ध कराते हैं।[12]
[12] https://github.com/cristinae/docट्रांसफॉर्मर