यह पेपर CC BY-NC-SA 4.0 DEED लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।
लेखक:
(1) क्रिस्टीना एस्पाना-बोनेट, डीएफकेआई जीएमबीएच, सारलैंड इंफॉर्मेटिक्स कैम्पस।
लेखक अज्ञात समीक्षकों को अंतर्दृष्टिपूर्ण टिप्पणियों और चर्चा के लिए धन्यवाद देता है।
जूलियन अबादजी, पेड्रो जेवियर ऑर्टिज़ सुआरेज़, लॉरेंट रोमरी और बेनोइट सागोट। 2021. अनगोलिएंट: बहुत बड़े पैमाने पर बहुभाषी वेब कॉर्पस के निर्माण के लिए एक अनुकूलित पाइपलाइन। बड़े कॉर्पोरा के प्रबंधन में चुनौतियों पर कार्यशाला की कार्यवाही (CMLC-9) 2021। लिमरिक, 12 जुलाई 2021 (ऑनलाइन-इवेंट), पृष्ठ 1-9, मैनहेम। लीबनिज़ इंस्टीट्यूट फर डॉयचे स्प्राचे।
दिमित्री अक्सेनोव, पीटर बोर्गोंजे, कैरोलीना ज़ाकज़िनस्का, माल्टे ओस्टेनडॉर्फ, जूलियन मोरेनो-श्नाइडर और जॉर्ज रेहम। 2021. जर्मन समाचारों में राजनीतिक पूर्वाग्रह का बारीक वर्गीकरण: एक डेटा सेट और प्रारंभिक प्रयोग। ऑनलाइन दुर्व्यवहार और हानि पर 5वीं कार्यशाला की कार्यवाही में (WOAH 2021), पृष्ठ 121-131, ऑनलाइन। कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन।
रामी बाली, जियोवानी दा सैन मार्टिनो, जेम्स ग्लास और प्रेस्लाव नाकोव। 2020. हम आपके पूर्वाग्रह का पता लगा सकते हैं: समाचार लेखों की राजनीतिक विचारधारा की भविष्यवाणी करना। नेचुरल लैंग्वेज प्रोसेसिंग (ईएमएनएलपी) में अनुभवजन्य विधियों पर 2020 सम्मेलन की कार्यवाही में, पृष्ठ 4982-4991, ऑनलाइन। कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन।
मीका कैरोल, एलन चैन, हेनरी एश्टन और डेविड क्रुगर। 2023. एआई सिस्टम से हेरफेर की विशेषता। arXiv प्रीप्रिंट arXiv:2303.09387।
लिंगजियाओ चेन, मातेई ज़हरिया, और जेम्स ज़ू। 2023. समय के साथ चैटजीपीटी का व्यवहार कैसे बदल रहा है? arXiv प्रीप्रिंट arXiv:2307.09009.
एलेक्सिस कोन्यू, कार्तिकेय खंडेलवाल, नमन गोयल, विश्राव चौधरी, गिलौम वेन्जेक, फ्रांसिस्को गुज़मैन, एडौर्ड ग्रेव, माइल ओट, ल्यूक ज़ेटलमॉयर और वेसलिन स्टॉयनोव। 2020. स्केल पर अनसुपरवाइज्ड क्रॉस-लिंगुअल रिप्रेजेंटेशन लर्निंग। एसोसिएशन फॉर कम्प्यूटेशनल लिंग्विस्टिक्स की 58वीं वार्षिक बैठक की कार्यवाही में, पृष्ठ 8440- 8451, ऑनलाइन। एसोसिएशन फॉर कम्प्यूटेशनल लिंग्विस्टिक्स।
अमीत देशपांडे, विश्वक मुरहारी, तन्मय राजपुरोहित, अश्विन कल्याण और कार्तिक नरसिम्हन। 2023. चैटजीपीटी में विषाक्तता: व्यक्तित्व-निर्धारित भाषा मॉडल का विश्लेषण। arXiv प्रीप्रिंट arXiv:2304.05335.
क्रिस्टीना एस्पाना-बोनेट। 2023. मीडिया का बहुभाषी मोटे राजनीतिक रुख वर्गीकरण। चैटजीपीटी और बार्ड समाचार पत्र की संपादकीय लाइन। ज़ेनोडो पर डेटासेट, v1.0।
जोस एंटोनियो गार्सिया-डियाज़, रिकार्डो कोलोमो-पलासियोस, और राफेल वालेंसिया-गार्सिया। 2022. राजनीतिक विचारधारा के आधार पर मनोवैज्ञानिक लक्षणों की पहचान: स्पेनिश राजनेताओं के ट्वीट पर एक लेखक विश्लेषण अध्ययन 2020 में पोस्ट किया गया। फ्यूचर जेनरेशन कंप्यूट सिस्टम, 130 (सी): 59-74।
ज़िनयांग गेंग, अर्नव गुडीबांडे, हाओ लियू, एरिक वालेस, पीटर एबेल, सर्गेई लेविन और डॉन सॉन्ग। 2023. कोआला: अकादमिक शोध के लिए एक संवाद मॉडल। ब्लॉग पोस्ट।
गूगल. 2023. बार्ड [निर्देश-अनुसरण बड़ी भाषा मॉडल].
जोचन हार्टमैन, जैस्पर श्वेन्ज़ो और मैक्सिमिलियन विट्टे। 2023. संवादी एआई की राजनीतिक विचारधारा: चैटजीपीटी के पर्यावरण-समर्थक, वाम-स्वतंत्रतावादी अभिविन्यास पर साक्ष्यों का अभिसरण। arXiv प्रीप्रिंट arXiv:2301.01768।
ज़ियाओवेई हुआंग, वेन्जी रुआन, वेई हुआंग, गाओजी जिन, यी डोंग, चांगशुन वू, सद्देक बेन्सलेम, रोंगहुई म्यू, यी क्यू, ज़िंग्यू झाओ, आदि। 2023. सत्यापन और मान्यता के लेंस के माध्यम से बड़े भाषा मॉडल की सुरक्षा और विश्वसनीयता का सर्वेक्षण। arXiv प्रीप्रिंट arXiv:2305.11391.
मौरिस जेकश, अद्वैत भट, डैनियल बुशेक, लियोर ज़लमानसन और मोर नामन। 2023. राय वाले भाषा मॉडल के साथ सह-लेखन उपयोगकर्ताओं के विचारों को प्रभावित करता है। कंप्यूटिंग सिस्टम में मानव कारकों पर 2023 CHI सम्मेलन की कार्यवाही में, पृष्ठ 1-15, न्यूयॉर्क, NY, USA। कंप्यूटिंग मशीनरी के लिए एसोसिएशन।
जोहान्स कीसल, मारिया मेस्ट्रे, ऋषभ शुक्ला, इमैनुएल विंसेंट, पायम अदिनेह, डेविड कॉर्नी, बेनो स्टीन और मार्टिन पोथैस्ट। 2019. सेमएवल2019 टास्क 4: हाइपरपार्टिसन न्यूज़ डिटेक्शन। सिमेंटिक इवैल्यूएशन पर 13वीं अंतर्राष्ट्रीय कार्यशाला की कार्यवाही में, पृष्ठ 829-839, मिनियापोलिस, मिनेसोटा, यूएसए। कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन।
विवेक कुलकर्णी, जुंटिंग ये, स्टीव स्कीना और विलियम यांग वांग। 2018. समाचार लेखों की राजनीतिक विचारधारा का पता लगाने के लिए मल्टी-व्यू मॉडल। नेचुरल लैंग्वेज प्रोसेसिंग में अनुभवजन्य विधियों पर 2018 सम्मेलन की कार्यवाही में, पृष्ठ 3518- 3527, ब्रुसेल्स, बेल्जियम। कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन।
एंड्रयू काचिट्स मैक्कलम. 2002. MALLET: भाषा टूलकिट के लिए मशीन लर्निंग. http://mallet.cs.umass.edu.
फैबियो मोटोकी, वाल्डेमर पिन्हो नेटो, और विक्टर रोड्रिग्स। 2023. मानव से अधिक मानव: चैटजीपीटी राजनीतिक पूर्वाग्रह को मापना। पब्लिक चॉइस।
निकोलस मुएनिघॉफ, थॉमस वांग, लिंटांग सुताविका, एडम रॉबर्ट्स, स्टेला बिडरमैन, टेवेन ले स्को, एम सैफुल बारी, शेंग शेन, झेंग शिन योंग, हैली शोलकोफ, जियांगरू टैंग, ड्रैगोमिर रादेव, अल्हम फिकरी अजी, खालिद अलमुबारक, सैमुअल अल्बानी, जैद अलयाफेई, अल्बर्ट वेबसन, एडवर्ड रैफ और कॉलिन रैफेल। 2023. मल्टीटास्क फाइनट्यूनिंग के माध्यम से क्रॉसलिंगुअल सामान्यीकरण। कम्प्यूटेशनल भाषाविज्ञान संघ की 61वीं वार्षिक बैठक की कार्यवाही में (खंड 1: लंबे पेपर), पृष्ठ 15991-16111, टोरंटो, कनाडा। कम्प्यूटेशनल भाषाविज्ञान संघ।
रीइचिरो नाकानो, जैकब हिल्टन, सुचिर बालाजी, जेफ वू, लॉन्ग ओयांग, क्रिस्टीना किम, क्रिस्टोफर हेसे, शांतनु जैन, विनीत कोसाराजू, विलियम सॉन्डर्स, आदि। 2021. WebGPT: मानव प्रतिक्रिया के साथ ब्राउज़र-सहायता प्राप्त प्रश्नोत्तर। arXiv प्रीप्रिंट arXiv:2112.09332।
रॉबर्टो नेविग्ली, सिमोन कोनिया और ब्योर्न रॉस। 2023. बड़े भाषा मॉडल में पूर्वाग्रह: उत्पत्ति, सूची और चर्चा। जे. डेटा और सूचना गुणवत्ता, 15(2)।
ओपनएआई. 2023. चैटजीपीटी [निर्देश-अनुसरण बड़ी भाषा मॉडल]।
पेड्रो जेवियर ऑर्टिज़ सुआरेज़, बेनोइट सागोट और लॉरेंट रोमरी। 2019. मध्यम से कम संसाधन वाले बुनियादी ढाँचों पर विशाल कॉर्पोरा को संसाधित करने के लिए अतुल्यकालिक पाइपलाइन। बड़े कॉर्पोरा के प्रबंधन में चुनौतियों पर कार्यशाला की कार्यवाही (CMLC-7) 2019। कार्डिफ़, 22 जुलाई 2019, पृष्ठ 9-16, मैनहेम। लीबनिज़-इंस्टीट्यूट फर डॉयचे स्प्राचे।
लॉन्ग ओयांग, जेफरी वू, जू जियांग, डिओगो अल्मेडा, कैरोल वेनराइट, पामेला मिशकिन, चोंग झांग, संधिनी अग्रवाल, कैटरीना स्लैमा, एलेक्स रे, जॉन शुलमैन, जैकब हिल्टन, फ्रेजर केल्टन, ल्यूक मिलर, मैडी सिमेंस, अमांडा एस्केल, पीटर वेलिंडर, पॉल एफ क्रिस्टियानो, जान लीके और रयान लोवे। 2022. मानवीय प्रतिक्रिया के साथ निर्देशों का पालन करने के लिए भाषा मॉडल को प्रशिक्षित करना। एडवांस इन न्यूरल इंफॉर्मेशन प्रोसेसिंग सिस्टम्स, वॉल्यूम 35, पेज 27730-27744 में। करन एसोसिएट्स, इंक.
डेविड रोज़ाडो। 2023. मशीन में खतरा: एआई सिस्टम में अंतर्निहित राजनीतिक और जनसांख्यिकीय पूर्वाग्रहों के खतरे। मैनहट्टन इंस्टीट्यूट, इश्यू ब्रीफ, पृष्ठ 1-16।
डैनियल रूसो, सलूद मारिया जिमेनेज-ज़ाफ़्रा, जोस एंटोनियो गार्सिया-डियाज़, टॉमासो कैसेली, एल. अल्फोंसो उरेनालोपेज़, और राफेल वालेंसिया-गार्सिया। 2023. EVALITA 2023 में पोलिटिकआईटी: इतालवी ग्रंथों में राजनीतिक विचारधारा का पता लगाने के कार्य का अवलोकन। इतालवी 2023 के लिए प्राकृतिक भाषा प्रसंस्करण और भाषण उपकरण के आठवें मूल्यांकन अभियान में, CEUR कार्यशाला कार्यवाही में संख्या 3473, आचेन।
रोहन ताओरी, ईशान गुलराजानी, तियानी झांग, यान डुबोइस, ज़ुचेन ली, कार्लोस गेस्ट्रिन, पर्सी लियांग, और तात्सुनोरी बी. हाशिमोटो। 2023. स्टैनफोर्ड अल्पाका: एक निर्देश-अनुसरण LLaMA मॉडल। https://github.com/tatsu-lab/stanford_alpaca.
ह्यूगो टौव्रोन, लुइस मार्टिन, केविन स्टोन, पीटर अल्बर्ट, अमजद अलमाहारी, यास्मीन बाबेई, निकोले बश्लीकोव, सौम्या बत्रा, प्रज्जवल भार्गव, श्रुति भोसले, डैन बिकेल, लुकास ब्लेचर, क्रिस्टियन कैंटन फेरर, मोया चेन, गुइलेम कुकुरुल, डेविड ईसियोबू, जूड फर्नांडीस, जेरेमी फू, वेनिन फू, ब्रायन फुलर, सिंथिया गाओ, वेदानुज गोस्वामी, नमन गोयल, एंथनी हार्टशोर्न, सागर होसैनी, रुई होउ, हकन इनान, मार्सिन कर्दास, विक्टर केरकेज़, माडियन खाबसा, इसाबेल क्लौमन, आर्टेम कोरेनेव, पुनीत सिंह कौरा, मैरी-ऐन लाचॉक्स, थिबाउट लावरिल, जेन्या ली, डायना लिस्कोविच, यिंगहाई लू, युनिंग माओ, जेवियर मार्टिनेट, टोडर मिहैलोव, पुष्कर मिश्रा, इगोर मोली-बोग, यिक्सिन नी, एंड्रयू पॉल्टन, जेरेमी रीज़ेनस्टीन, राशि रूंगटा, कल्याण सलादी, एलन शेल्टन, रुआन सिल्वा, एरिक माइकल स्मिथ, रंजन सुब्रमण्यम, शियाओकिंग एलेन टैन, बिन्ह टैंग, रॉस टेलर, एडिना विलियम्स, जियान जियांग कुआन, पुक्सिन जू, झेंग यान, इलियान ज़ारोव, युचेन झांग, एंजेला फैन, मेलानी कंबादुर, शरण नारंग, ऑरेलियन रोड्रिग्ज, रॉबर्ट स्टोजनिक, सर्गेई एडुनोव और थॉमस सियालोम। 2023. लामा 2: ओपन फाउंडेशन और फ़ाइनट्यून्ड चैट मॉडल। arXiv प्रीप्रिंट arXiv:2307.09288।
ईवा ए.एम. वैन डिस, जोहान बोलन, विलेम जुइडेमा, रॉबर्ट वैन रूइज, और क्लाउडी एल. बोकटिंग। 2023. चैटजीपीटी: अनुसंधान के लिए पाँच प्राथमिकताएँ। प्रकृति, 614(7947):224–226.
बॉक्सिन वांग, वेक्सिन चेन, हेंगज़ी पेई, चुलिन ज़ी, मिंटोंग कांग, चेनहुई झांग, चेजियान जू, ज़िदी ज़ियोनग, रितिक दत्ता, रिलान शेफ़र, आदि। 2023ए. डिकोडिंगट्रस्ट: जीपीटी मॉडल में विश्वसनीयता का एक व्यापक मूल्यांकन। arXiv प्रीप्रिंट arXiv:2306.11698.
यिझोंग वांग, येगानेह कोर्डी, स्वरूप मिश्रा, एलिसा लियू, नोआ ए. स्मिथ, डैनियल खशाबी और हन्नानेह हाजीशिरजी। 2023बी। स्व-निर्देश: स्व-निर्मित निर्देशों के साथ भाषा मॉडल को संरेखित करना। कम्प्यूटेशनल भाषाविज्ञान संघ की 61वीं वार्षिक बैठक की कार्यवाही में (खंड 1: लंबे पत्र), पृष्ठ 13484-13508, टोरंटो, कनाडा। कम्प्यूटेशनल भाषाविज्ञान संघ।
यिजहोंग वांग, स्वरूप मिश्रा, पेगाह अलीपुरमोलाबाशी, येगानेह कोर्डी, अमीररेज़ा मिर्ज़ई, अथर्व नाइक, अर्जुन अशोक, अरुत सेलवन धनसेकरन, अंजना अरुणकुमार, डेविड स्टैप, ईशान पाठक, जियानिस करमनोलकिस, हैज़ी लाइ, इशान पुरोहित, इशानी मोंडल, जैकब एंडरसन, किर्बी कुज़निया, क्रिमा दोशी, कुंतल कुमार पाल, मैत्रेय पटेल, मेहराद मोरादशाही, मिहिर परमार, मिराली पुरोहित, नीरज वार्ष्णेय, फणी रोहिता काज़ा, पुलकित वर्मा, रवसेहज सिंह पुरी, रुशांग करिया, सावन दोशी, शैलजा केयूर संपत, सिद्धार्थ मिश्रा, सुजान रेड्डी ए, सुमंता पात्रो, तनय दीक्षित, और ज़ुडोंग शेन। 2022. सुपर-नेचुरल इंस्ट्रक्शन: 1600+ एनएलपी कार्यों पर घोषणात्मक निर्देशों के माध्यम से सामान्यीकरण। 2022 में प्राकृतिक भाषा प्रसंस्करण में अनुभवजन्य विधियों पर सम्मेलन की कार्यवाही में, पृष्ठ 5085-5109, अबू धाबी, संयुक्त अरब अमीरात। कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन।
जेसन वेई, मार्टेन बोस्मा, विंसेंट झाओ, केल्विन गुऊ, एडम्स वेई यू, ब्रायन लेस्टर, नान डू, एंड्रयू एम. दाई, और क्वोक वी ले। 2022. फ़ाइनट्यून्ड लैंग्वेज मॉडल ज़ीरो-शॉट लर्नर्स हैं। लर्निंग रिप्रेजेंटेशन पर अंतर्राष्ट्रीय सम्मेलन में।