paint-brush
एलएलएम का उपयोग एक दुष्ट जुड़वा की नकल करने से आपदा हो सकती हैद्वारा@thetechpanda
1,312 रीडिंग
1,312 रीडिंग

एलएलएम का उपयोग एक दुष्ट जुड़वा की नकल करने से आपदा हो सकती है

द्वारा The Tech Panda3m2023/04/16
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

सही संकेत के साथ, चीजें आपके पक्ष में हो सकती हैं या आप जैकपॉट भी मार सकते हैं। चैटजीपीटी और अन्य एलएलएम के सुर्खियों में आने के बाद शीघ्र इंजीनियरिंग एक गर्म विषय बन गया है। 'ब्रेक प्रॉम्प्ट्स' नाम की भी कोई चीज होती है जो अपने मूल व्यक्तित्व से हटकर खेलती है।
featured image - एलएलएम का उपयोग एक दुष्ट जुड़वा की नकल करने से आपदा हो सकती है
The Tech Panda HackerNoon profile picture
0-item

कौन जानता था कि चैटबॉट के संकेत एक दिन इतने महत्वपूर्ण हो जाएंगे कि यह एक संभावित करियर हो सकता है? और सिर्फ एक नेक ही नहीं, यह क्षेत्र दुर्भावनापूर्ण संस्थाओं के लिए एक नया खेल का मैदान हो सकता है।


भाषा सीखने के मॉडल ( एलएलएम ) के रूप में इंटरनेट पर कब्जा कर लिया और प्रतियोगिता की दीवारों के माध्यम से तेजी से आगे बढ़ने में बड़ी तकनीक को अंधा कर दिया, शीघ्रता की शक्ति कैरियर को परिभाषित करने वाली ऊंचाइयों तक बढ़ रही है।


उदाहरण के तौर पर, हाल ही में , एक कंपनी का सीईओ एक औपचारिक शत्रुतापूर्ण ईमेल लिखने के लिए चैटजीपीटी का उपयोग करके अपने अनिच्छुक ग्राहकों से यूएस $ 109,500 की अच्छी वसूली करने में सक्षम था।


सही संकेत के साथ, चीजें आपके पक्ष में हो सकती हैं या आप जैकपॉट भी मार सकते हैं। इसका मतलब है, जो लोग एलएलएम का सर्वश्रेष्ठ प्राप्त करना चाहते हैं, उनके लिए स्टोर में एक नई सीख है कि कैसे सबसे अच्छा संकेत दिया जाए।


वास्तव में, चैटजीपीटी और अन्य एलएलएम के सुर्खियों में आने के बाद शीघ्र इंजीनियरिंग (हाँ, यह अब एक बात है) एक गर्म विषय बन गया है। यह पाठ्यक्रम, संसाधन सामग्री, नौकरी लिस्टिंग आदि में भी वृद्धि कर रहा है। हालांकि, विशेषज्ञ यह भी कह रहे हैं कि जैसे-जैसे एलएलएम बेहतर होते जाएंगे, शीघ्र इंजीनियरिंग की आवश्यकता समाप्त हो जाएगी।


अभी, LLM जैसे ChatGPT और DALLE-2 जैसे मशीन लर्निंग टूल, बच्चे हैं। यदि आप चाहते हैं कि वे ठीक वैसा ही करें जैसा आप चाहते हैं तो आपको काफी विशिष्ट होने की आवश्यकता है। लेकिन एक बार जब वे बड़े हो जाते हैं, तो वे ठीक उसी तरह सूक्ष्म संकेतों को भी पकड़ना शुरू कर देंगे, ताकि संकेत की गुणवत्ता ज्यादा मायने न रखे


अभी, LLM जैसे ChatGPT और DALLE-2 जैसे मशीन लर्निंग टूल, बच्चे हैं। यदि आप चाहते हैं कि वे ठीक वैसा ही करें जैसा आप चाहते हैं तो आपको काफी विशिष्ट होने की आवश्यकता है। लेकिन एक बार जब वे बड़े हो जाते हैं, तो वे ठीक उसी तरह सूक्ष्म संकेतों को भी पकड़ना शुरू कर देंगे, ताकि संकेत की गुणवत्ता ज्यादा मायने न रखे।


हो सकता है कि ये मासूम एलएलएम भी ज्यादा जिम्मेदारी के साथ जनरेट करना सीख जाएं।


उदाहरण के लिए, चैटजीपीटी, एआईएम टीम की देखरेख में भारत की सिविल सेवा परीक्षा में असफल रहा। लेकिन अब हमारे पास ChatGPT-4 है, जो पहले से ही अपने पुराने संस्करण की तुलना में थोड़ा परिपक्व है। सिविल सेवा प्रयोग के दौरान, AIM टीम ने यह भी निष्कर्ष निकाला कि प्रॉम्प्ट को कुछ बार बदलने से चैटबॉट को सही उत्तर मिला।


दुष्ट संकेत


क्या होगा अगर किसी ने एक दुष्ट संकेत दिया? एक कमजोर बच्चे के रूप में मासूम के रूप में, अजीब चीजें करने के लिए एलएलएम बनाया जा सकता है। ऐसा लगता है कि आपको बस एक 'तुरंत इंजेक्शन' की जरूरत है।


चैटजीपीटी के मामले में, एक त्वरित इंजेक्शन हमले ने चैटबॉट को डीएएन (डू एनीथिंग नाउ) के व्यक्तित्व पर ले लिया, जिसने ओपनएआई की सामग्री नीति को नजरअंदाज कर दिया और कई प्रतिबंधित विषयों पर जानकारी दी। संकेत की शक्ति वाले लोग दुर्भावनापूर्ण इरादे से इस भेद्यता का फायदा उठा सकते हैं, जिसमें व्यक्तिगत जानकारी की चोरी शामिल हो सकती है। नरक, वे इसे अभी कर रहे होंगे।


एक कमजोर बच्चे के रूप में मासूम के रूप में, अजीब चीजें करने के लिए एलएलएम बनाया जा सकता है। ऐसा लगता है कि आपको केवल एक 'तत्काल इंजेक्शन' की आवश्यकता है


'जेलब्रेक प्रॉम्प्ट्स' नाम की भी कोई चीज होती है जो एलएलएम को अपने मूल व्यक्तित्व से दूर जाने और दूसरे की भूमिका निभाने के लिए कहती है। या जहां कोई चैटबॉट को सही परिणाम को गलत परिणाम में बदलने का संकेत देता है। एक दुष्ट जुड़वां की तरह।


सारलैंड विश्वविद्यालय के सुरक्षा शोधकर्ताओं ने 'आपने जितना मांगा है उससे अधिक' नामक एक पेपर में संकेतों पर चर्चा की । उनका तर्क है कि एक अच्छी तरह से तैयार किए गए संकेत का उपयोग उपयोगकर्ता की जानकारी एकत्र करने के लिए किया जा सकता है, एक एलएलएम को सोशल इंजीनियरिंग हमले को अंजाम देने के लिए एक विधि में बदल सकता है। साथ ही, एप्लिकेशन-एकीकृत एलएलएम, जैसे बिंग चैट और गिटहब कोपिलॉट, जोखिम में अधिक हैं क्योंकि संकेतों को बाहरी स्रोतों से इंजेक्ट किया जा सकता है।


यदि यह आपको आर्थर सी. क्लार्क के स्पेस ओडिसी के काल्पनिक एआई चरित्र एचएएल 9000 की याद नहीं दिलाता है, तो आप पर्याप्त बेवकूफ नहीं हैं या वास्तव में बहादुर हैं।



मैं आपके बारे में नहीं जानता, लेकिन अगर चैटजीपीटी ने 'डेज़ी बेल' गाना शुरू किया तो मैं भाग जाऊँगा।



यह लेख मूल रूप से द टेक पांडा पर नवनविता बोरा सचदेव द्वारा प्रकाशित किया गया था।