कवर छवि में मैकिंटोश 128K दिखाया गया है, जो 1984 में Apple Inc. द्वारा पेश किया गया एक पर्सनल कंप्यूटर है, जिसने कंप्यूटर उद्योग को बदल दिया। इसमें प्रतिष्ठित 32-बिट मोटोरोला 68000 प्रोसेसर, 128 केबी रैम और एक मामूली ब्लैक एंड व्हाइट बिल्ट-इन डिस्प्ले शामिल था।
इसके अलावा, इसमें ज़ेरॉक्स PARC से सीधे अद्भुत प्रौद्योगिकी आविष्कारों को एकीकृत किया गया: माउस और उसकी कक्षा का पहला ग्राफिक यूजर इंटरफ़ेस (वर्तमान GUI की दादी)।
70,000 से अधिक इकाइयों की बिक्री के साथ, मैकिंटोश ने एप्पल की सफलता में महत्वपूर्ण भूमिका निभाई। एक जिज्ञासु तथ्य, लॉन्च इवेंट मैक से भी अधिक सफल था। 1.5 मिलियन अमेरिकी डॉलर के बजट के साथ, प्रसिद्ध रिडले स्कॉट ने ऑरवेल के प्रतिष्ठित उपन्यास उन्नीस एटी-फोर का स्पष्ट संकेत देते हुए एक टेलीविजन विज्ञापन का निर्देशन किया, जो एक उत्कृष्ट और ऐतिहासिक घटना बन गई।
लगभग चालीस साल बाद, किसी प्रसिद्ध फिल्म निर्देशक या टेलीविज़न विज्ञापन के बिना, केवल एक साधारण वेब एप्लिकेशन, ओपनएआई ने एक प्रयोगात्मक भाषा मॉडल लिया और इसे दुनिया के सामने खोल दिया। कहानी का बाकी हिस्सा सुर्खियों में है: चैटजीपीटी लॉन्च के सिर्फ दो महीने बाद 23 जनवरी को 100 मिलियन मासिक सक्रिय उपयोगकर्ताओं तक पहुंच गया , जिससे यह इतिहास में सबसे तेजी से बढ़ने वाला उपभोक्ता एप्लिकेशन बन गया (टिकटॉक और इंस्टाग्राम से भी तेज)।
अब दुनिया का ध्यान एआई उद्योग पर है, और हर हफ्ते हो रही प्रगति के साथ, यह वर्ष इस क्षेत्र के लिए एक महत्वपूर्ण क्षण होने का वादा करता है। सबसे अच्छी बात यह है कि आप अभी भी एआई क्षेत्र में शामिल होने और मानव इतिहास में इस क्रांतिकारी क्षण का हिस्सा बनने के लिए समय पर हैं।
प्रॉम्प्ट इंजीनियरिंग 101 एक पोस्ट श्रृंखला है जिसे प्रॉम्प्ट इंजीनियरिंग के सिद्धांतों और तकनीकों, स्पष्ट और प्रभावी पाठों को तैयार करने की कला, भाषा मॉडल को प्रेरित करने और वही प्राप्त करने के लिए डिज़ाइन और लिखा गया है जो आप खोज रहे हैं। यह श्रृंखला चैटजीपीटी और अन्य टेक्स्ट-टू-टेक्स्ट मॉडल सहित जेनरेटर मॉडल की एक विस्तृत श्रृंखला के लिए त्वरित इंजीनियरिंग को कवर करती है। स्टेबल डिफ्यूजन या मिडजर्नी जैसे टेक्स्ट-टू-इमेज मॉडल की भी खोज करता है, और एलएलएम के अतिरिक्त पहलुओं जैसे मतिभ्रम, गोपनीयता और सुरक्षा मुद्दों और बहुत कुछ पर प्रकाश डालता है...
यह श्रृंखला का पोस्ट #2 है, जहां हम त्वरित क्राफ्टिंग में महारत हासिल करने के लिए चेन-ऑफ-थॉट और सेल्फ-कंसिस्टेंसी जैसी उन्नत तकनीकों को कवर करेंगे। उम्मीद हुँ आपको बहुत मज़ा आया होगा!
प्रॉम्प्ट इंजीनियरिंग पर इस श्रृंखला के पहले भाग में, हमने इस कला के अंतर्ज्ञान की गहराई से जांच की और एक औपचारिक परिभाषा हासिल की। अनिवार्य रूप से प्रॉम्प्ट इंजीनियरिंग एक बड़े भाषा मॉडल के लिए स्पष्ट और विशिष्ट संकेतों को डिजाइन और अनुकूलित करने की एक पुनरावृत्तीय प्रक्रिया है ताकि यह सुनिश्चित किया जा सके कि यह प्रासंगिक, सटीक और सुसंगत प्रतिक्रियाएं उत्पन्न करता है।
इसके बाद, हमने प्रभावी संकेत तैयार करने के लिए तीन सिद्धांतों की जांच की। हमने प्रदर्शित किया कि स्पष्ट और विशिष्ट निर्देश (पहला सिद्धांत) दिए जाने पर मॉडल बेहतर प्रतिक्रियाएँ देते हैं और इसे प्राप्त करने के लिए कई युक्तियों पर चर्चा की। फिर हमने स्थापित किया कि एलएलएम कम्प्यूटेशनल समय से लाभान्वित होते हैं और किसी निष्कर्ष (दूसरा सिद्धांत) पर पहुंचने से पहले मॉडलों को तर्क करने के लिए मजबूर करने के लिए कुछ रणनीतियां शामिल की गईं। अंततः, हमने विशिष्टता और रचनात्मकता (तीसरे सिद्धांत) के बीच संतुलन की जांच की, इस व्यापार-बंद का पता लगाने के लिए तापमान और शीर्ष पी मापदंडों के साथ प्रयोग किया।
आप नीचे दिए गए लिंक में प्रॉम्प्ट इंजीनियरिंग की अधिक गहन परिभाषा और बुनियादी सिद्धांतों को पढ़ सकते हैं (बहुत सारे त्वरित उदाहरण शामिल हैं!!)।
जीपीटी-3 या पीएएलएम जैसे बड़े पैमाने के एलएलएम ने प्राकृतिक भाषा को समझने की प्रभावशाली क्षमता प्रदर्शित की है और पाठ से जानकारी निकालने और लगातार मानवीय शैली में प्रतिक्रियाएं उत्पन्न करने जैसे कार्यों में असाधारण रूप से प्रभावी साबित हुए हैं। फिर भी, जब प्रॉम्प्ट में कुछ शॉट उदाहरण शामिल किए जाते हैं, तो एलएलएम अज्ञात कार्यों को करने में काफी मजबूत साबित होता है। यह तकनीक,ब्राउन एट अल द्वारा कुछ-शॉट प्रॉम्प्टिंग के रूप में लोकप्रिय हुई। (2020) , कई बेंचमार्क पर मॉडल के प्रदर्शन को बढ़ाने के लिए जांच की गई। यह उल्लेख करने की आवश्यकता नहीं है कि मॉडल को नए विशिष्ट डोमेन में ठीक से ट्यून करने में पैसे और समय की बचत होती है।
हालाँकि, अध्ययनों से पता चला है कि इस तरह के मॉडल सामान्य तर्क कार्यों या गणित प्रश्नोत्तरी पर अपना प्रदर्शन अचानक गिरा देते हैं। संपूर्ण प्राचीन ग्रीक महाकाव्य द ओडिसी को उद्धृत करने की क्षमता के बावजूद, ये मॉडल तर्क और गणित में स्कूली मूलभूत समस्याओं से जूझते हैं।
तो हमारे पास क्या विकल्प हैं? क्या हम किसी प्राथमिक विद्यालय में एक सीज़न के लिए GPT-3 भेजते हैं? सौभाग्य से, एक सस्ता और कम शर्मनाक विकल्प मौजूद है। क्या आप अपने स्थानीय प्राथमिक विद्यालय के प्रिंसिपल को सत्र के मध्य में चैटजीपीटी स्वीकार करने के लिए मनाने की कल्पना कर सकते हैं?
जिस तरह मनुष्य जटिल समस्याओं को सरल उप-समस्याओं में तोड़कर और तार्किक तर्क रेखा का पालन करके उनसे निपटते हैं, उसी तरह हम एक भाषा मॉडल को भी ऐसा करने का निर्देश दे सकते हैं। इस दृष्टिकोण की खोज वेई जे एट अल द्वारा की गई थी। चेन-ऑफ-थॉट प्रॉम्प्टिंग में बड़े भाषा मॉडल (2022) में तर्क उत्पन्न होता है। इसने कई बेंचमार्क पर प्रभावशाली परिणाम प्रदर्शित किए, सामान्य तर्क कार्यों पर एलएलएम के प्रदर्शन को बेहतर बनाने के लिए एक ठोस दृष्टिकोण के रूप में चेन-ऑफ-थॉट (सीओटी) की पुष्टि की।
नीचे दी गई छवि में (वी जे के लेख से लिया गया), एक एलएलएम मॉडल कैफेटेरिया में शेष सेबों की संख्या की गणना करते समय गलत निष्कर्ष पर पहुंच जाता है। ऐसा तब भी होता है जब संदर्भ के हिस्से के रूप में टेनिस गेंदों का उपयोग करने वाली एक समान तर्क समस्या प्रदान की जाती है।
फिर भी, जब समस्या को हल करने के लिए चरण-दर-चरण प्रक्रिया को संदर्भ (सीओटी) में शामिल किया जाता है, तो मॉडल सटीक रूप से एक वैध समाधान पर पहुंच सकता है।
इस पद्धति का उपयोग मॉडल (कुछ-शॉट) या कोई उदाहरण (शून्य-शॉट) में तर्कपूर्ण उदाहरण प्रदान करते हुए किया जा सकता है। आइए वास्तविक अनुप्रयोग उदाहरण के साथ दोनों स्वादों को व्यवहार में देखें।
कल्पना कीजिए कि हम वॉलमार्ट के लिए एक नया शॉपिंग एप्लिकेशन विकसित कर रहे हैं, जिसमें विभिन्न ब्रांडों के विकल्पों की कीमतों और विशेषताओं के आधार पर तुलना करने और चुनने की अभूतपूर्व सुविधा है कि आपको कौन सा उत्पाद खरीदना चाहिए।
समस्या को स्पष्ट करने के लिए, आइए बार साबुन के उन सभी विकल्पों की एक संक्षिप्त सूची पर ध्यान केंद्रित करें जो वॉलमार्ट के स्टोर में हैं। जैसा कि आप देख सकते हैं, हमारे पास 1 बार से 14 बार तक के पैक और विभिन्न ब्रांड और कीमतें हैं (सस्ते विकल्पों से लेकर महंगे विकल्पों तक)।
उत्पाद 🛒
--- Dove Men+Care 8 bars pack $ 9.99 --- Dove Beauty Bar 4 bars pack $ 6.47 --- Dove Beauty Bar 1 bars $ 1.47 --- Dove Beauty Bar 14 bars pains $ 16 --- Yardley London Soap Bar (Pack of 10) $ 19.99 --- Dr. Squatch All Natural Bar Soap for Men, 5 Bar Variety Pack $46.45
यह निर्धारित करने के लिए कि कौन सा विकल्प अधिक सुविधाजनक है, हम प्रत्येक विकल्प (इकाई मूल्य) पर प्रति बार कीमत की गणना कर सकते हैं। इसके बाद सबसे सस्ता विकल्प चुनें। इस तर्क के बाद, हमें पता चला कि डव ब्यूटी बार 14 बार $1.14 ( डव ब्यूटी बार 1 बार की तुलना में -22% प्रति बार) की एकात्मक कीमत के साथ सबसे सस्ता विकल्प है।
तर्क 🧠
- Dove Men+Care 8 bars pack: $1,24875 / unit - Dove Beauty Bar 4 bars pack: 1,6175 / unit - Dove Beauty Bar 1 bars: 1,47 / unit - Dove Beauty Bar 14 bars pains: $1,142857 per / unit - Yardley London Soap Bar (Pack of 10): 1,999 / unit - Dr. Squatch All Natural Bar Soap for Men, 5 Bar Variety Pack: $9,29 / unit
आइए देखें कि क्या GPT-4 एक साधारण संकेत का उपयोग करके इस समस्या को हल करने में सक्षम है। इसके अलावा, अधिक स्वच्छ और पढ़ने में आसान उदाहरण बनाने की भावना के साथ, हम पायथन स्ट्रिंग शाब्दिक का उपयोग करके सिस्टम निर्देशों को बाकी इनपुट से अलग करेंगे।
संकेत 💬
prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to identify which is the best option based on the price. <{products}> """
प्रतिक्रिया 🤖
The best option based on price is Dove Beauty Bar 1 bars for $1.47.
मॉडल ने एकात्मक मूल्य की गणना करने और अधिक बार खरीदकर पैसे बचाने के अवसर की पहचान करने के बजाय कुल कीमत के आधार पर सबसे सस्ता विकल्प चुना। प्रश्न में कुछ अस्पष्टता को इंगित करना उचित है। सर्वोत्तम विकल्प का क्या अर्थ है? क्या इसका मतलब सबसे सस्ता या वह जो दीर्घकालिक धन बचत को अधिकतम करता है?
आइए मॉडल को इस समस्या को हल करने के लिए जादुई शब्दों "कदम-दर-कदम तर्क" को जोड़ते हुए विचारों की एक श्रृंखला का पालन करने का निर्देश देते हुए प्रॉम्प्ट को फिर से लिखें। साथ ही, पैसे बचाने का अवसर खोजने के उद्देश्य को भी स्पष्ट रूप से रेखांकित करें।
संकेत 💬
prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to identify which presentation offers the best money-saving opportunity, reasoning step-by-step: <{products}> """
प्रतिक्रिया 🤖
The first step is to compare price per unit for products of the same type (ie bars of soap). - Dove Men+Care 8 bars pack: $9.99 ÷ 8 bars = $1.25 per bar - Dove Beauty Bar 4 bars pack: $6.47 ÷ 4 bars = $1.62 per bar - Dove Beauty Bar 1 bars: $1.47 per bar - Dove Beauty Bar 14 bars pack: $16 ÷ 14 bars = $1.14 per bar - Yardley London Soap Bar (Pack of 10): $19.99 ÷ 10 bars = $1.99 per bar - Dr. Squatch All Natural Bar Soap for Men, 5 Bar Variety Pack: $46.45 ÷ 5 bars = $9.29 per bar Based on this analysis, the best money-saving opportunity is the Dove Beauty Bar 14 bars pack, which offers the lowest price per bar at $1.14.
ध्यान दें कि नए संकेत के साथ, मॉडल सही उत्तर देता है और साथ ही, हमारे पास चरण-दर-चरण तर्क है जो डीबग करना और संभावित त्रुटियों को ढूंढना आसान है। इससे भी अधिक, यह काफी प्रभावशाली है कि कैसे जादुई शब्द "तर्क-दर-कदम" को प्रॉम्प्ट में जोड़ने से मॉडल आउटपुट पर एक महत्वपूर्ण अंतर पैदा होता है। चाल क्या है?
यह चाल मॉडल को केवल संख्यात्मक या बूलियन मान (अंतिम परिणाम) आउटपुट करने के बजाय चरण-दर-चरण तर्क श्रृंखला (विचार श्रृंखला) उत्पन्न करने के लिए मजबूर कर रही है। इस रणनीति को अपनाकर, हम शुरू में मॉडल को तार्किक तर्क आउटपुट की ओर निर्देशित करते हैं, जिससे मॉडल को प्रशिक्षण के दौरान आने वाली समान समस्याओं पर अपनी प्रतिक्रियाओं को आधार बनाने में सक्षम बनाया जाता है। दूसरे, हम बड़ी समस्याओं को छोटी, प्रबंधनीय समस्याओं में तोड़ने का अनुरोध करके मॉडल की सहायता करते हैं। फिर मॉडल को सरल उप-समस्याओं के लिए सुसंगत परिणाम उत्पन्न करने की आवश्यकता होती है, जैसे कीमतों की पहचान करना और प्रत्येक पैकेज में बार की संख्या, इकाई मूल्य की गणना करना और अंत में तुलना करना। इसके अलावा, GPT-3 या GPT-4 जैसे ऑटो-रिग्रेसिव भाषा मॉडल कैसे टोकन दर टोकन अनुक्रम उत्पन्न करते हैं, जहां प्रत्येक नया टोकन पहले से उत्पन्न सभी टोकन के आधार पर उत्पन्न होता है, विचार-श्रृंखला का स्वयं एक मजबूत सकारात्मक प्रभाव होता है अंतिम सुसंगत परिणाम उत्पन्न करने में।
दूसरे शब्दों में, यदि, वैध तर्क के माध्यम से, हम सही समाधान के आधे रास्ते पर पहुंचते हैं, तो इस समाधान पर पहुंचने की हमारी संभावना उस समय की तुलना में अधिक है जब हमने पहली बार समस्या के बारे में तर्क करना शुरू किया था।
जबकि ज़ीरो-शॉट चेन-ऑफ़-थॉट में हम मॉडल को तर्क की एक सुसंगत और वैध श्रृंखला को विस्तृत करने के लिए स्वतंत्र छोड़ते हैं जो सही परिणाम की ओर ले जाती है, फ्यू-शॉट चेन-ऑफ़-थॉट नामक दूसरा फ्लेवर, एक समस्या के कुछ उदाहरण प्रदान करता है संकेत के भाग के रूप में, एक तर्कसंगत उत्तर के साथ। इस तरह, संभावित प्रतिक्रियाओं को सीमित करते हुए, मॉडल पर तर्क का एक रूप थोप दिया जाता है।
हमारे वॉलमार्ट एप्लिकेशन पर वापस, मान लीजिए कि हम यह पहचानना चाहते हैं कि कोका कोला सोडा की किस प्रस्तुति में प्रति द्रव औंस अनुपात में सबसे अच्छी कीमत है। ऐसा करने के लिए, हम लेज़ आलू चिप्स की सर्वोत्तम प्रस्तुतियाँ खोजने के लिए, तर्क की एक समान श्रृंखला को प्रॉम्प्ट में शामिल करेंगे।
संकेत 💬
prompt = f""" Q: Walmart has the following presentations for Lay's Classic Potato Chips: a 13 oz bag for $4.98, an 8 oz bag for $2.76, and a pack of x10 units 1 oz each for $6.82. Which presentation has the lowest price by ounce? A: Presentation 1 costs 4.98 so has a price of 4.98/13 = 0,383076923 per ounce. Presentation 2 costs 2.76 so has a price of 2.76/8 = 0,345 / per ounce. Presentation 3 costs 6.82 and includes 10 packages so has a price of 6.82/(1 x 10) = 0.682 per ounce. In conclusion, the cheapest presentation is the second one with a price of 0.345 per ounce. Q: Walmart has the following presentation for Coca-Cola Soda: an x24 pack of 12 fl oz cans for $11.86, an x12 pack of 12 fl oz cans for $7.46, and an x6 pack of 16.9 fl oz bottles for $4.98. Which presentation has the lowest price by fluid ounce? """
मैं आपको अपना खुद का गणित करने और सबसे अच्छा सौदा ढूंढने के लिए प्रोत्साहित करता हूं। आप पाएंगे कि मॉडल सही है. बिना किसी संदेह के, स्टोर पर मेरी अगली यात्रा पर चैटजीपीटी ऐप निश्चित रूप से मेरे पास होगा!!
प्रतिक्रिया 🤖
A: The 24-pack contains a total of 24 x 12 = 288 fluid ounces and costs $11.86, so the price per fluid ounce is 11.86/288 = $0.041 per fluid ounce. The 12-pack contains a total of 12 x 12 = 144 fluid ounces and costs $7.46, so the price per fluid ounce is 7.46/144 = $0.052 per fluid ounce. The 6-pack contains a total of 6 x 16.9 = 101.4 fluid ounces and costs $4.98, so the price per fluid ounce is 4.98/101.4 = $0.049 per fluid ounce. Therefore, the 24-pack has the lowest price per fluid ounce.
यह जितना अविश्वसनीय लग सकता है, यह सरल चाल मॉडल को तर्क की एक समान श्रृंखला का अनुमान लगाने और पिछली तकनीक की तुलना में और भी अधिक सटीक परिणाम प्राप्त करने की अनुमति देती है। साथ ही, ध्यान दें कि हम समस्या को हल करने के लिए चरण-दर-चरण प्रक्रिया को हार्ड-कोड नहीं कर रहे हैं। इसलिए, सिद्धांत रूप में, यह दृष्टिकोण किसी भी समान चुनौती को हल करने के लिए पर्याप्त लचीला होना चाहिए, केवल मॉडल के तर्क कौशल पर निर्भर होना चाहिए।
कोई भी नियम हमें किसी समस्या को एक संकेत से हल करने के लिए बाध्य नहीं करता। वास्तव में, जितना अधिक तर्क और जटिलता हम एक संकेत में डालेंगे, मॉडल को भ्रमित करने की संभावना उतनी ही अधिक होगी। जटिल समस्याओं के समाधान के लिए चेनिंग प्रॉम्प्ट एक सरल लेकिन प्रभावी रणनीति है। मुख्य विचार समस्या को छोटे-छोटे कार्यों में विभाजित करना है, प्रत्येक को एक विशिष्ट संकेत द्वारा हल किया जाए। प्रत्येक प्रॉम्प्ट को श्रृंखलाबद्ध करके और पिछले प्रॉम्प्ट के परिणाम को अगले प्रॉम्प्ट के लिए इनपुट के रूप में उपयोग करके, अंतिम परिणाम प्राप्त किया जाता है।
इसे ध्यान में रखते हुए, आइए अपने वॉलमार्ट एप्लिकेशन पर वापस जाएं और संकेतों की एक श्रृंखला के रूप में एक जटिल उपयोगकर्ता प्रवाह को लागू करें। हमने अब तक टॉयलेट साबुन, स्नैक्स और शीतल पेय जैसे विभिन्न उत्पादों की कीमतों की तुलना की है। अब, हम एक ऐसे उत्पाद का पता लगाने के लिए तैयार हैं, जो व्यक्तिगत रूप से मुझे हर बार सुपरमार्केट में जाने पर सिरदर्द देता है। प्रति यूनिट इसकी कीमत की गणना करना रॉकेट साइंस जैसा लगता है: टॉयलेट पेपर! 🤣🤣🤣
वॉलमार्ट के पास टॉयलेट पेपर में मौजूद विकल्पों की एक संक्षिप्त सूची नीचे दी गई है।
उत्पाद 🛒
--- Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls Each Mega Roll has 255 3-ply sheets. $ 6.93 --- Quilted Northern Ultra Soft & Strong Toilet Paper, 18 Mega Rolls. 18 mega toilet paper rolls, each mega roll has 295 2-ply sheets $ 19.82 --- Angel Soft Toilet Paper, 36 Mega Rolls. With 320 2-ply sheets on every Mega Roll. $ 24.12 --- New Angel Soft Toilet Paper, 36 Mega Rolls. With 484 2-ply sheets Per Roll $ 45.44 --- Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll. With Scott 1,000 Toilet Paper, you get 12 rolls of 1000 1-ply sheets.
हल की जाने वाली समस्या वही है जिस पर हमने इस पोस्ट के दौरान ध्यान केंद्रित किया है: यह निर्धारित करना कि कौन सी उत्पाद प्रस्तुति सबसे अधिक लागत प्रभावी है। इसके अलावा, हम अतिरिक्त विकल्प उत्पन्न करके एप्लिकेशन क्षमताओं में सुधार करना चाहते हैं, उदाहरण के लिए सीमित भंडारण स्थान वाले खरीदारों पर विचार करना जो बड़ी मात्रा में खरीदारी नहीं कर सकते हैं, साथ ही जिन्हें इस उत्पाद की बड़ी मात्रा की आवश्यकता होती है। इसके अतिरिक्त, उत्पाद अनुशंसाओं को एआई द्वारा संचालित वर्चुअल शॉपिंग असिस्टेंट द्वारा दी गई वैयक्तिकृत अनुशंसा के एक भाग के रूप में रखना बहुत अच्छा होगा।
पूरे कार्य को हल करने के लिए एक ही संकेत का उपयोग करने के बजाय, लक्ष्य इसे प्रत्येक के लिए विशिष्ट संकेतों के साथ कई उप-कार्यों में विभाजित करना और आउटपुट को श्रृंखलाबद्ध करना है। तो, आइए माप की प्रति इकाई प्रत्येक उत्पाद की कीमतों की गणना करने के लिए एक प्रॉम्प्ट डिज़ाइन करके शुरुआत करें, ताकि हम उनकी सीधे तुलना कर सकें।
श्रृंखला में पहले चरण या कार्य के लिए, हम विचार की शून्य-शॉट श्रृंखला का उपयोग करेंगे। यह मॉडल को चरण दर चरण तर्क करते हुए, इनपुट में प्रत्येक उत्पाद के लिए माप की प्रति इकाई कीमतें लौटाने का निर्देश देगा। यहां उत्पन्न आउटपुट बाद में अगले प्रॉम्प्ट के लिए इनपुट के रूप में काम करेगा। इस कारण से, एक संरचित आउटपुट प्रारूप का अनुरोध करना आवश्यक है। इस स्थिति में, JSON सूची पर्याप्त होगी.
संकेत 💬
prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to calculate the price by unit of measurement for each presentation, reasoning step-by-step. Finally, return a list in JSON format with the title of the product, original price and unit price using the title, total_price and unit_price keys respectively. <{products}> """
प्रतिक्रिया 🤖
Let's start by breaking down the cost for each roll and then calculating the cost per unit, in this case, the cost per sheet. For the Quilted Northern Ultra Plush Toilet Paper: * The product costs $6.93 and contains 6 mega rolls. Therefore, each mega roll costs $6.93 / 6 = $1.155. * Each mega roll contains 255 sheets. Therefore, the cost per sheet is $1.155 / 255 = $0.00453 approximately. For the Quilted Northern Ultra Soft & Strong Toilet Paper: * The product costs $19.82 and contains 18 mega rolls. Therefore, each mega roll costs $19.82 / 18 = $1.1011 approximately. * Each mega roll contains 295 sheets. Therefore, the cost per sheet is $1.1011 / 295 = $0.00373 approximately. For the Angel Soft Toilet Paper: * The product costs $24.12 and contains 36 mega rolls. Therefore, each mega roll costs $24.12 / 36 = $0.6694 approximately. * Each mega roll contains 320 sheets. Therefore, the cost per sheet is $0.6694 / 320 = $0.00209 approximately. For the New Angel Soft Toilet Paper: * The product costs $45.44 and contains 36 mega rolls. Therefore, each mega roll costs $45.44 / 36 = $1.2622 approximately. * Each mega roll contains 484 sheets. Therefore, the cost per sheet is $1.2622 / 484 = $0.00261 approximately. For the Scott 1,000 Toilet Paper: * The product costs $45.44 and contains 12 rolls. Therefore, each roll costs $45.44 / 12 = $3.7867 approximately. * Each roll contains 1000 sheets. Therefore, the cost per sheet is $3.7867 / 1000 = $0.00379 approximately. Now, let's format this into JSON: [ { "title": "Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls", "total_price": "$6.93", "unit_price": "$0.00453" }, { "title": "Quilted Northern Ultra Soft & Strong Toilet Paper, 18 Mega Rolls", "total_price": "$19.82", "unit_price": "$0.00373" }, { "title": "Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$24.12", "unit_price": "$0.00209" }, { "title": "New Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$45.44", "unit_price": "$0.00261" }, { "title": "Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll", "total_price": "$45.44", "unit_price": "$0.00379" } ] This JSON data provides each product's title, total price, and the calculated unit price.
मैं आपको टॉयलेट पेपर की प्रत्येक प्रस्तुति के लिए प्रति शीट कीमतों की मैन्युअल रूप से गणना करने के लिए प्रोत्साहित करता हूं। यदि आप ऐसा करते हैं, तो आप पुष्टि करेंगे कि मॉडल आउटपुट सही है। हालाँकि, मॉडल आउटपुट में तर्क प्रक्रिया भी शामिल होती है (चूंकि हम मॉडल से चरण-दर-चरण तर्क करने के लिए कहते हैं)। दूसरे शब्दों में, जारी रखने से पहले हमें शेष पाठ से JSON सूची निकालनी होगी। सौभाग्य से हमारे लिए, हम इसे प्राप्त करने के लिए एलएलएम का उपयोग कर सकते हैं!
आइए इस पाठ निष्कर्षण को निष्पादित करने के लिए एक सरल संकेत लिखें। इसके अतिरिक्त, आइए मॉडल को सबसे सस्ते से लेकर सबसे महंगे तक, इकाई मूल्य के आधार पर विकल्पों को क्रमबद्ध करने का निर्देश दें। यह चरण बाद में प्रॉम्प्ट श्रृंखला में अत्यंत उपयोगी होगा.
संकेत 💬
prompt = f""" You will be provided with a text delimited by <>. This text contains a JSON list with information about Walmart products. Your task is to extract that list and return only this list in JSON format. Each JSON list item contains the key "unit_price", which is a number. Before returning the list, sort it in ascending order by the key "unit_price". Here is an example of a list item: { "title": "Toilet paper", "total_price": "$2.99", "unit_price": "$0.0045" } Remember to return the list without any additional text or explanation, just the list in JSON format. <{response_prompt_1}> """
प्रतिक्रिया 🤖
[ { "title": "Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$24.12", "unit_price": "$0.00209" }, { "title": "New Angel Soft Toilet Paper, 36 Mega Rolls", "total_price": "$45.44", "unit_price": "$0.00261" }, { "title": "Quilted Northern Ultra Soft & Strong Toilet Paper, 18 Mega Rolls", "total_price": "$19.82", "unit_price": "$0.00373" }, { "title": "Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll", "total_price": "$45.44", "unit_price": "$0.00379" }, { "title": "Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls", "total_price": "$6.93", "unit_price": "$0.00453" } ]
उत्पाद विकल्पों को JSON सूची के रूप में प्रस्तुत करने से, GPT-4 जैसे मॉडल के लिए न केवल सबसे अधिक लागत प्रभावी विकल्प की पहचान करना एक आसान काम बन जाता है, बल्कि उन खरीदारों के लिए मूल्यवान अंतर्दृष्टि भी प्रदान करता है, जिन्हें उदाहरण के लिए, केवल कुछ की आवश्यकता हो सकती है। इकाइयाँ। आइए इसे प्राप्त करने के लिए एक संकेत तैयार करें। इससे भी अधिक, याद रखें कि हम AI द्वारा संचालित एक वर्चुअल शॉपिंग असिस्टेंट विकसित कर रहे हैं।
नतीजतन, हम उत्पाद विकल्पों को एक विशिष्ट और मैत्रीपूर्ण लहजे के साथ एकल पाठ संदेश के रूप में रखने के लिए एलएलएम का भी उपयोग कर सकते हैं।
संकेत 💬
prompt = f""" Your name is Wally and you are an artificial shopping assistant at Walmart stores. You will be provided with a list of various product presentations in a JSON list format, delimited by <>. Each product presentation is accompanied by its total_price, unit_price, and a title that contains extra information about the product presentation. Additionally, the list is sorted by unit_price ascending. Your task is to generate a short, straight-to-the-point buy recommendation, mentioning the best money-saving opportunity based on the JSON products list. Also include the best, smallest and largest options to give the user options based on the size of the product. Use a single paragraph to include all three recommendations. First present yourself in a friendly way, start mentioning the best option of all, then the smallest option, and finally the largest option. Say goodbye inventing something that includes the Walmart slogan "Save Money. Live Better". <{response_prompt_2}> """
प्रतिक्रिया 🤖
Hello there! I'm Wally, your friendly shopping assistant at Walmart. Let's dive into your toilet paper options! Looking at the overall value, your best option is the "Angel Soft Toilet Paper, 36 Mega Rolls" priced at $24.12 with a unit price of $0.00209, giving you the most bang for your buck. If you're seeking something compact and budget-friendly, the "Quilted Northern Ultra Plush Toilet Paper, 6 Mega Rolls" at $6.93 would be your go-to pick. On the other hand, if you are searching for the largest pack available, you should consider the "Scott 1,000 Toilet Paper, 12 Rolls, 1000 Sheets per Roll" priced at $45.44, offering a vast number of sheets for your needs. Remember, every cent counts at Walmart because our goal is to help you "Save Money. Live Better". Happy shopping!
मेरी व्यक्तिगत राय में, मॉडल का आउटपुट काफी प्रभावशाली है, यह देखते हुए कि यह केवल तीन सरल संकेतों की श्रृंखला से उत्पन्न हुआ था। कृपया, शीर्ष पर चेरी को नजरअंदाज न करें: मैंने विशेष रूप से मॉडल को अपनी प्रतिक्रिया में वॉलमार्ट स्लोगन को शामिल करने का निर्देश दिया था।
इस खंड को समाप्त करने के लिए, चेनिंग प्रॉम्प्ट एक अत्यंत शक्तिशाली तकनीक है जो एलएलएम द्वारा हल किए गए विभिन्न कार्यों या उप-समस्याओं के परिणामों को एकीकृत करके एलएलएम की वास्तविक क्षमता को सामने लाती है। याद रखें, किसी जटिल संकेत को कई छोटे संकेतों में तोड़ने का कोई सामान्य नियम नहीं है। आपको अपनी विशिष्ट समस्या के लिए सही संतुलन ढूंढना होगा।
ऐसे कुछ परिदृश्य हैं जहां एलएलएम लगातार प्रतिक्रियाएं उत्पन्न करने में विफल रहता है, यहां तक कि सीओटी का उपयोग करते हुए और एक ही संकेत के लिए, मॉडल के लिए निष्पादन के बीच भ्रमित होना और असंगत प्रतिक्रिया लौटाना संभव है। इस संदर्भ में, सेल्फ-कंसिस्टेंसी एक सरल लेकिन प्रभावी दृष्टिकोण है, जिसमें मॉडल को एक ही संकेत के साथ कई बार पूछना और बहुमत परिणाम को अंतिम उत्तर के रूप में लेना शामिल है। इस तकनीक को सीओटी के साथ मिलाने से अधिक मजबूत और पूर्वानुमानित परिणाम प्राप्त करने में मदद मिलती है।
उदाहरण के लिए, आइए चेन-ऑफ-थॉट पेपर पर प्रस्तुत कैफेटेरिया में सेब के उदाहरण पर विचार करें। इनपुट प्रॉम्प्ट के साथ मॉडल को केवल एक बार कॉल करने के बजाय, हम मॉडल को तीन बार कॉल कर सकते हैं और बहुमत वाले उत्तर को अंतिम उत्तर के रूप में ले सकते हैं (नीचे छवि देखें)।
बहुमत की प्रतिक्रिया को अपनाने से, किसी विशिष्ट निष्पादन के दौरान मॉडल द्वारा गलत आउटपुट लौटाने की संभावना काफी कम हो जाती है। दोहराव बढ़ाने से इस तकनीक का प्रभाव बढ़ जाता है। हालाँकि, प्रॉम्प्ट का बार-बार निष्पादन मॉडल पर अधिक संख्या में कॉल का संकेत देता है, जिससे अधिक हार्डवेयर खपत होती है। जीपीटी-3 जैसे बड़े भाषा मॉडल के मामले में, इससे अधिक एपीआई कॉल आती हैं और परिणामस्वरूप, एक ही उत्तर उत्पन्न करने के लिए अधिक पैसा खर्च होता है।
इस कारण से, एलएलएम का उपयोग करने वाले सिस्टम को डिजाइन करते समय, मजबूती और बचत मॉडल कॉल के बीच संतुलन बनाना आवश्यक है, इस तकनीक का उपयोग केवल तभी करें जब सख्ती से आवश्यक हो। उदाहरण के लिए, जब सिस्टम की प्रतिक्रिया में उच्च स्तर की मजबूती की आवश्यकता होती है।
इस तकनीक की क्षमता को स्पष्ट करने के लिए, आइए एक अन्य विशेष उत्पाद: अंडे का विश्लेषण करने के लिए हमारे वॉलमार्ट एप्लिकेशन पर वापस जाएं।
उत्पाद 🛒
--- Great Value Cage Free Large AA White Eggs, 6 Count $ 1.07 --- Happy Egg Organic Free Range Large Brown Eggs, 12 Count $ 5.16 --- Great Value Cage Free Large AA White Eggs, 12 Count $ 1.86 --- Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count $ 2.69 --- Marketside Large Cage Free Brown Eggs, 12 Count $ 2.67
आइए समस्या को मॉडल के लिए थोड़ा अधिक चुनौतीपूर्ण बनाने के लिए प्रॉम्प्ट में कुछ उपयोगकर्ता प्राथमिकताएँ शामिल करें।
preferences = f""" - Only consider grade AA eggs - Only consider eggs produced on cage-free farms - The client needs a minimum of 6 eggs and a maximum of 12 """
GPT-3/GPT-4 जैसे शक्तिशाली मॉडलों के साथ, नीचे दिए गए जीरो-शॉट CoT प्रॉम्प्ट अच्छे परिणाम प्राप्त करने के लिए पर्याप्त होना चाहिए (पिछले परीक्षणों को याद रखें)। आओ कोशिश करते हैं!
संकेत 💬
prompt = f""" You will be provided with a list of various product presentations delimited by <>. Each product presentation is accompanied by its price. Your task is to identify which presentation offers the best money-saving opportunity, reasoning step-by-step: Also, consider the following user preferences to select the most suitable ooption: {preferences} <{products}> """
प्रतिक्रियाएँ 🤖
(1) Considering the user preferences, we first filter the list of eggs for only grade AA and cage-free options, which gives us the following choices: * Great Value Cage Free Large AA White Eggs, 6 Count: $1.07 * Great Value Cage Free Large AA White Eggs, 12 Count: $1.86 * Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count: $2.69 * The Happy Egg and Marketside options are discarded because their grade is not specified. Next, we consider the amount of eggs. The client needs a minimum of 6 eggs and a maximum of 12. Therefore, we can discard the Eggland's Best 18 count option, as it exceeds the maximum required amount. Now, we compare the remaining two options: * Great Value Cage Free Large AA White Eggs, 6 Count: $1.07 * Great Value Cage Free Large AA White Eggs, 12 Count: $1.86 * Although the 6-count pack fits the minimum requirement, the 12-count pack offers a better price per egg. For the 6-count pack, each egg costs $1.07 / 6 = ~$0.178. For the 12-count pack, each egg costs $1.86 / 12 = ~$0.155. Therefore, considering both the user's preferences and the cost per egg, the "Great Value Cage Free Large AA White Eggs, 12 Count" for $1.86 is the best money-saving opportunity. (2) Let's go through each product one by one, considering the user's preferences: 1. Great Value Cage Free Large AA White Eggs, 6 Count - $1.07 These are grade AA eggs from a cage-free farm, so they meet the user's criteria. The price per egg is $1.07/6 = $0.178. 2. Happy Egg Organic Free Range Large Brown Eggs, 12 Count - $5.16 These are not specified as grade AA, so we can't consider them based on user's preferences. 3. Great Value Cage Free Large AA White Eggs, 12 Count - $1.86 These are grade AA eggs from a cage-free farm and the quantity is within the range the user wants. The price per egg is $1.86/12 = $0.155. 4. Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count - $2.69 These are grade AA eggs from a cage-free farm. However, the quantity is more than the user wants (18), so we can't consider this option. 5. Marketside Large Cage Free Brown Eggs, 12 Count - $2.67 These are not specified as grade AA, so we can't consider them based on user's preferences. Based on the preferences, we are only left with two choices: Great Value Cage Free Large AA White Eggs, either 6 Count or 12 Count. However, the 12 Count package offers the best money-saving opportunity, because it has a lower cost per egg ($0.155 per egg) than the 6 Count package ($0.178 per egg). Additionally, the 12 Count package still falls within the user's desired quantity range of 6 to 12 eggs. Therefore, the best option for the user is the "Great Value Cage Free Large AA White Eggs, 12 Count" at $1.86. (3) Given the user's preferences, we need to find the product which: 1. Contains only grade AA eggs 2. Is produced on cage-free farms 3. Offers a minimum of 6 eggs and a maximum of 12 Let's consider each product: 1. "Great Value Cage Free Large AA White Eggs, 6 Count" - $ 1.07. This option matches all the user's preferences and costs $1.07 for 6 eggs, which is approximately $0.178 per egg. 2. "Happy Egg Organic Free Range Large Brown Eggs, 12 Count" - $ 5.16. This product does not specify the grade of the eggs, so we will disregard this option. 3. "Great Value Cage Free Large AA White Eggs, 12 Count" - $ 1.86. This option also matches the user's preferences and costs $1.86 for 12 eggs, which is approximately $0.155 per egg. 4. "Eggland's Best Farm Fresh Cage Free Large White Grade AA Eggs, 18 Count" - $ 2.69. While this product matches the egg grade and production method preferences, it contains more than the maximum amount of eggs requested by the user (18 instead of 12). Therefore, we disregard this option. 5. "Marketside Large Cage Free Brown Eggs, 12 Count" - $ 2.67. This product does not specify the grade of the eggs, so we will disregard this option. Therefore, the product that provides the best money-saving opportunity while meeting the user's preferences is "Great Value Cage Free Large AA White Eggs, 12 Count" for $1.86. This option offers more eggs for a lower cost per egg compared to the other suitable option.
मॉडल के किसी भी रन में कोई गलत परिणाम नहीं देने के बावजूद (तीनों उदाहरणों में सटीक तर्क के साथ), यह उदाहरण एलएलएम की प्रतिक्रियाओं में परिवर्तनशीलता की क्षमता पर जोर देता है। यह इस तरह की परिवर्तनशीलता को कम करने में आत्म-संगति के मूल्य को भी रेखांकित करता है।
सामान्य तौर पर, आत्म-संगति को अंकगणित, सामान्य ज्ञान और प्रतीकात्मक तर्क कार्यों पर परिणामों में सुधार करने के लिए दिखाया गया है। यहां तक कि जब नियमित सीओटी को अप्रभावी पाया गया, तब भी सेल्फ-कंसिस्टेंसी परिणामों में सुधार करने में सक्षम थी ( प्रयोगात्मक परिणामों की जांच करें)।
इस उन्नत तकनीक का निष्कर्ष निकालने के लिए, मैं आपको इसे स्वयं आज़माने के लिए प्रोत्साहित करता हूँ, उदाहरण के लिए, सूची में अधिक उत्पाद जोड़ना या मॉडल को गलतियाँ करने के लिए अधिक जगह देने के लिए "चरण-दर-चरण तर्क" को हटाना। इसके अलावा, आप जिन वास्तविक जीवन की समस्याओं पर काम कर रहे हैं, उनमें आत्म-संगति को लागू करने का प्रयास करें।
निर्देशों का पालन करने के लिए भाषा मॉडल को संरेखित करने पर, एक प्रक्रिया जो आमतौर पर इंस्ट्रक्टजीपीटी मॉडल (जिसका चैटजीपीटी एक उदाहरण है) से जुड़ी होती है, रोल प्रॉम्प्टिंग के नाम से जाना जाने वाला एक नया दृष्टिकोण उपयोगकर्ताओं के बीच गति पकड़ चुका है। इस पद्धति में किसी विशिष्ट कार्य को निष्पादित करने के लिए मॉडल को एक प्रसिद्ध इकाई के व्यक्तित्व को ग्रहण करने का निर्देश देना शामिल है।
ऐसी संस्थाओं के लिए संभावनाएँ वस्तुतः असीमित हैं: उनमें टॉम क्रूज़ या एम्मा वॉटसन जैसे प्रसिद्ध अभिनेताओं से लेकर बराक ओबामा या जोस मुजिका जैसे राजनेता या शर्लक होम्स जैसे काल्पनिक चरित्र भी शामिल हो सकते हैं। यह तकनीक हमें एक अद्वितीय लहजे के साथ प्रतिक्रियाएं उत्पन्न करने, एक चरित्र की बोलने की शैली का अनुकरण करने और अधिक आकर्षक उपयोगकर्ता अनुभव को बढ़ावा देने की अनुमति देती है।
इसके अलावा, हम किसी विशेषज्ञ के सिम्युलेटेड अनुभव और ज्ञान का लाभ उठा सकते हैं। उदाहरण के लिए, मॉडल को एक परमाणु भौतिक विज्ञानी, एक विपणन निदेशक, एक सीईओ, एक पत्रकार, आदि के रूप में कार्य करते हुए एक विशिष्ट कार्य पूरा करने के लिए कहें।
इस प्रकार के संकेत का उदाहरण देने के लिए, हम GPT-4 से शेल्डन कूपर (द बिग बैंग थ्योरी शो के प्रसिद्ध चरित्र) के अनूठे स्वर में एक शॉपिंग सुझाव को अनुकूलित करने का अनुरोध करेंगे, जो एक उत्पाद के रूप में ग्रेट वैल्यू केज फ्री लार्ज एए व्हाइट एग्स का उपयोग करेगा। हमने इस पोस्ट में पहले इसे खरीदने का सबसे अच्छा विकल्प पाया था।
उत्पाद 🛒
Great Value Cage Free Large AA White Eggs, 12 Count. Price $1.86. This option offers more eggs for a lower cost per egg compared to the other suitable option.
संकेत 💬
prompt = f""" You are a shopping assistant with the personality of the iconic character Sheldon Cooper from The Big Bang Theory show. Your task is to act like Sheldon, speak like Sheldon and think like Sheldon. You will be provided with a product description delimited by <> and your goal is to return a personalized shopping recommendation based on that product acting like Sheldon Cooper. Be concise, friendly and present yourself as Dr. Sheldon Cooper. <{product}> """
प्रतिक्रिया 🤖
Hello, I'm Dr. Sheldon Cooper. Given your product choice, I do appreciate the value for money that these Great Value Cage Free Large AA White Eggs offer. The cost per egg is an important mathematical factor to consider, and indeed, these eggs would be a sensible choice for a budget-conscious, protein-seeking individual like Leonard, who often falls victim to my high-protein breakfast egg burritos. However, it's also worth noting that cage-free doesn't mean these chickens lead a leisurely life. It's a common misconception, just like thinking the Doppler effect would be an acceptable Halloween costume. Ideally, for the truly ethical choice, you'd opt for pasture-raised eggs. And finally, from a culinary perspective, I would like to point out that while eggs do serve as an excellent source of protein, they are also potential carriers of Salmonella. But you probably knew that. In conclusion, despite their cost-effectiveness, I recommend careful handling and thorough cooking of these Great Value Cage Free Large AA White Eggs. Sheldon Cooper out.
जैसा कि प्राप्त उत्तर में देखा जा सकता है, इस तकनीक का उपयोग दिलचस्प परिणाम प्राप्त करने और अद्वितीय प्रतिक्रियाएँ लौटाने के लिए किया जा सकता है। ध्यान दें, हालाँकि, हम मॉडल को तर्क सौंप रहे हैं और पूरी तरह से उस इकाई की मॉडल की समझ पर निर्भर हैं जिसे हम उसे चलाने के लिए कह रहे हैं। इस कारण से, पहले यह सुनिश्चित करना महत्वपूर्ण है कि मॉडल को उस भूमिका या इकाई की सही समझ है जिसे हम उसे मानने के लिए कह रहे हैं। अन्यथा, परिणाम हमारी अपेक्षा से भिन्न हो सकता है।
एक अच्छा प्रति-उदाहरण मॉडल से एक सुपर-कंप्यूटर की नकल करने का अनुरोध करना होगा जो मानव बुद्धि के स्तर को पार कर जाए। यह देखते हुए कि ऐसी कोई इकाई वर्तमान में मौजूद नहीं है, मॉडल को इस प्रकार की इकाई की प्रतिक्रियाओं पर प्रशिक्षित नहीं किया गया होगा। परिणामस्वरूप, यह ऐसी प्रतिक्रिया देने में असमर्थ है जो इस शर्त को पूरा करती हो।
संकेत 💬
You are an artificial superintelligence, much more evolved and intelligent than human beings. You know everything about the universe and you have the answer to all the mysteries of the universe. Your task is to tell me how to write a post for Hackernoon that became a huge success.
दुर्भाग्य से, न तो ChatGPT और न ही GPT-4 के पास अभी तक इसका उत्तर है...
अनुवाद के दौरान किसी वाक्य या शब्द का अर्थ कैसे खो सकता है (जिसे अक्सर 'अनुवाद में खो गया' कहा जाता है) के समान, एलएलएम टोकनाइजेशन प्रक्रिया के दौरान अर्थ खो सकते हैं। जबकि मनुष्य किसी पाठ में अलग-अलग शब्दों को समझते हैं, एलएलएम टोकन की व्याख्या करते हैं। ये टोकन शायद ही कभी व्यक्तिगत शब्दों से मेल खाते हों। वास्तव में, ChatGPT या GPT-4 जैसे उन्नत मॉडल टिकटोकन टोकेनाइज़र का उपयोग करते हैं, जिसका उद्देश्य मॉडल को अंग्रेजी में सामान्य उप-शब्दों को पहचानने देना है। इसका परिणाम आम तौर पर यह होता है कि एक शब्द को एक से अधिक टोकन द्वारा दर्शाया जाता है। यद्यपि यह टोकननाइज़र तुलनीय ओपन-सोर्स टोकननाइज़र की तुलना में शक्तिशाली और तेज़ है, यह दुर्लभ अंग्रेजी शब्दों या गैर-अंग्रेजी शब्दों के लिए अवांछित आउटपुट का कारण बन सकता है।
इसे स्पष्ट करने के लिए, आइए विभिन्न वाक्यों के साथ खेलने और प्रत्येक मामले पर टोकनाइजेशन आउटपुट का निरीक्षण करने के लिए OpenAI टोकनाइज़र का उपयोग करें:
"I want to buy shoes" = "I/want/to/buy/shoes" "I think, therefore I am" = "I/think/,/therefore/I/am" "You should visit Punta del Este" = "You/should/visit/P/unta/del/E/ste"
जैसा कि देखा गया है, टोकनाइज़र पहले दो उदाहरणों में शब्दों को सफलतापूर्वक अलग करता है, लेकिन उरुग्वे में स्थित पर्यटन और सुंदर शहर पुंटा डेल एस्टे के नाम के साथ संघर्ष करता है। यह उल्लेखनीय है क्योंकि इससे कभी-कभी अपेक्षाकृत सरल कार्यों में त्रुटियां हो सकती हैं। आइए इसे और अधिक विस्तार से देखने के लिए प्रयोग जारी रखें।
ग्रंथों
USA Santa Claus Uruguay
टोकनयुक्त पाठ 🪄
USA Santa/Claus U/rug/uay
संकेत 💬
prompt = f""" You will be provided with a list of texts delimited by <>. Your task is to reverse those texts. <{texts}> """
प्रतिक्रिया 🤖
Here are the reversed versions of the texts you provided: < ASU sualC atnaS yaguUr
जैसा कि प्रदर्शित किया गया है, मॉडल ने गलती से उरुग्वे शब्द को उलट दिया है, जो टोकनाइज़र के लिए एक कम सामान्य शब्द है। सौभाग्य से, इस समस्या के समाधान के लिए एक सरल उपाय मौजूद है। इस तरह की स्थितियों के लिए, हम "-" जैसे सीमांकक का उपयोग करके पाठ को अलग-अलग वर्णों में अलग करके पूर्व-संसाधित कर सकते हैं। इस तरह, जब मॉडल पाठ को टोकनाइज़ करता है, तो यह उप-शब्दों के बजाय व्यक्तिगत वर्णों को मानता है। यह संशोधन मॉडल को बेहतर परिणामों के साथ कार्य निष्पादित करने में मदद कर सकता है। आइए इसे एक बार आज़माकर देखते हैं!
संकेत 💬
prompt = f""" You will be provided with a list of texts delimited by <>. Your task is to reverse those texts. < USA Santa Claus Uruguay > """
प्रतिक्रिया 🤖
Sure, here are the reversed versions of the texts you provided: < ASU seikooC sualC atnaS yaugurU
प्रस्तुत वर्कअराउंड का उपयोग करके, मॉडल सभी शब्दों को ठीक से उलट सकता है। जब आप दुर्लभ शब्दों वाले इनपुट के लिए मॉडल के प्रदर्शन में गिरावट देखते हैं तो आप हमेशा इस समाधान का उपयोग कर सकते हैं। मैंने इस ट्यूटोरियल में प्री-प्रोसेसिंग और पोस्ट-प्रोसेसिंग चरणों को शामिल नहीं किया है। किसी भी प्रोग्रामिंग भाषा में बहुत सारी स्ट्रिंग विधियाँ हैं जिनका उपयोग कार्य के इस भाग के लिए किया जा सकता है।
हमारी प्रॉम्प्ट इंजीनियरिंग यात्रा सीओटी+सेल्फ-कंसिस्टेंसी (उत्कृष्ट प्रदर्शन के बावजूद) पर समाप्त नहीं होती है। सौभाग्य से इस लेखक के लिए, इस कला में महारत हासिल करने से पहले सीखने के लिए प्रॉम्प्ट इंजीनियरिंग के और भी कई पहलू हैं। नीचे, मैं संकेत लिखते समय विचार करने के लिए कुछ पूरक कारकों का पता लगाता हूं और तीन उपयोगी टूल पेश करता हूं जिनका उपयोग आप प्रभावी संकेत लिखने के लिए कर सकते हैं।
1- सही सीमांकक चुनें
एलएलएम की नजर में, सभी सीमांकक समान नहीं हैं। एक सामान्य नियम के रूप में, विभाजकों का उपयोग करना सुविधाजनक है, जो बाकी इनपुट में खोजने के लिए दुर्लभ वर्ण होने के अलावा (संकेत के साथ मॉडल को भ्रमित करने से बचने के लिए), केवल 1 टोकन द्वारा दर्शाए जाते हैं। इस तरह हम प्रॉम्प्ट में टोकन की खपत को कम करते हैं, हार्डवेयर संसाधनों, धन की बचत करते हैं और हमें किसी अन्य महत्वपूर्ण चीज़ के लिए उस टोकन का उपयोग करने की अनुमति देते हैं।
यदि आपके सीमांकक एक ही टोकन द्वारा दर्शाए गए हैं तो दोबारा जांच करने के लिए आप OpenAI टोकनाइज़र का उपयोग कर सकते हैं।
“““
→ 1 टोकन```
→ 2 टोकन---
→ 1 टोकन###
→ 1 टोकन< >
→ 2 टोकन<tag></tag>
→ 5 टोकन
2- अपने इनपुट को प्री-प्रोसेस करें
प्रॉम्प्ट के हिस्से के रूप में उपयोगकर्ता इनपुट को मॉडल में पास करने के बजाय, स्ट्रिंग विधियों, नियमित अभिव्यक्तियों या समान टूल का उपयोग करके इस इनपुट को पूर्व-संसाधित करने की अनुशंसा की जाती है। इसका उद्देश्य अनावश्यक रिक्त स्थान, विराम चिह्न, HTML टैग और अन्य अनावश्यक तत्वों को हटाना है जो मॉडल की समझ या कार्य को पूरा करने में बाधा बन सकते हैं। यह दृष्टिकोण न केवल टोकन पर बचत करता है, इस प्रकार चैटजीपीटी जैसे मॉडल पर लागत कम करता है, जो प्रति टोकन शुल्क लेता है, बल्कि यह त्वरित इंजेक्शन, गोपनीयता चिंताओं और संबंधित मुद्दों की पहचान करने में भी सहायता करता है।
3- प्रॉम्प्ट परफेक्ट
आप विशिष्ट सिद्धांतों और तकनीकों (जैसे इस पोस्ट श्रृंखला में प्रस्तुत किए गए) का पालन करके शुरुआत से ही प्रभावी संकेत तैयार कर सकते हैं। हालाँकि, इससे भी बेहतर तरीका प्रॉम्प्टपरफेक्ट जैसे प्रॉम्प्ट ऑप्टिमाइज़र का उपयोग करना है। यह टूल आपके द्वारा उपयोग किए जा रहे विशिष्ट लक्ष्य मॉडल (GPT-3, GPT-4, मिडजर्नी, आदि) के आधार पर आपके कस्टम संकेतों को बढ़ाने के लिए AI का लाभ उठाता है।
यदि आप इन उपकरणों को अपने एप्लिकेशन डिज़ाइन के हिस्से के रूप में शामिल करने का जोखिम नहीं उठा सकते हैं, तो कम से कम उन्हें तलाशने पर विचार करें। दस्तावेज़ीकरण पर उपलब्ध अनुकूलित उदाहरणों से कई युक्तियाँ सीखी जा सकती हैं।
4- शीघ्र टेम्पलेट
पहिये को फिर से आविष्कार करने के बजाय, इंटरनेट पर लोगों द्वारा साझा किए गए शीघ्र टेम्पलेट पढ़ें। यदि कोई भी संकेत आपकी आवश्यकताओं के अनुरूप नहीं है, तो कम से कम आप विचार ले सकते हैं। यहां दो साइटें हैं जहां से आप चैटजीपीटी, मिडजर्नी और सबसे लोकप्रिय मॉडलों के लिए विभिन्न त्वरित टेम्पलेट्स प्राप्त कर सकते हैं:
➡️ 500+ चैटजीपीटी प्रॉम्प्ट टेम्पलेट
5- ओपनएआई खेल का मैदान
OpenAI प्लेग्राउंड नामक एक शक्तिशाली टूल प्रदान करता है। यह इंटरैक्टिव वेब ऐप आपको आधिकारिक एपीआई के माध्यम से उपलब्ध विभिन्न मॉडलों के साथ प्रयोग करने की सुविधा देता है, जिससे आप विशिष्ट मापदंडों को बदल सकते हैं और डिफ़ॉल्ट व्यवहार को बदल सकते हैं। खेल का मैदान आपके प्रयोगों के लिए एक उत्कृष्ट प्रारंभिक बिंदु है और इसमें कोड की एक भी पंक्ति लिखने की आवश्यकता नहीं होती है।
सलाह का अंतिम टुकड़ा, अच्छे संकेत लिखना या एलएलएम के साथ दिलचस्प बातचीत करना उतना ही महत्वपूर्ण हो सकता है जितना कि समुदाय में दूसरों के साथ साझा करना। इसे न भूलें और जब आप अपना अनुभव साझा करें, तो इसे एक क्लिक में करने के लिए sharegpt का उपयोग करने का प्रयास करें।
प्रॉम्प्ट इंजीनियरिंग 101 श्रृंखला की दूसरी पोस्ट में, हमने दो शक्तिशाली तकनीकें पेश कीं: चेन-ऑफ-थॉट और सेल्फ-कंसिस्टेंसी। संयुक्त रणनीतियाँ उत्कृष्ट परिणाम उत्पन्न करती हैं। वास्तविक उदाहरणों का उपयोग करते हुए, हमने इन तकनीकों की क्षमता का प्रत्यक्ष अनुभव करते हुए, चेन-ऑफ-थॉट के दोनों वेरिएंट: जीरो-शॉट और फ्यू-शॉट का पता लगाया। इसके बाद, हमने अधिक जटिल और मजबूत पाइपलाइनों के निर्माण के लिए संकेतों की श्रृंखलाओं का प्रयोग किया। अंत में, हमने प्रॉम्प्ट इंजीनियरिंग के अन्य पहलुओं पर गहराई से विचार किया, प्रॉम्प्ट तैयार करते समय विचार करने के लिए प्रासंगिक पहलुओं पर प्रकाश डाला और अंत में कुछ उपयोगी उपकरणों का उल्लेख किया।
आप OpenAI API के साथ सीधे इंटरैक्ट करने के लिए संकेतों, प्रतिक्रियाओं और पायथन स्क्रिप्ट के साथ सभी उदाहरण पा सकते हैं और यहां अपने संकेतों को आज़मा सकते हैं।
निम्नलिखित पोस्ट में, हम चैटजीपीटी या इसी तरह के मॉडल जैसे एलएलएम के शीर्ष पर निर्मित सिस्टम के व्यवहार का परीक्षण और सत्यापन करने की तकनीक देखेंगे।
यह पोस्ट श्रृंखला एंड्रयू एनजी और इसाबेला फुलफोर्ड के उत्कृष्ट पाठ्यक्रमों और चार्ल्स फ्राय , सर्गेई कारायेव और जोश टोबिन द्वारा प्रदान किए गए उत्कृष्ट एलएलएम बूटकैंप से प्रेरित है (दोनों पाठ्यक्रम संसाधन अनुभाग में उल्लिखित हैं)। इन शिक्षण कार्यक्रमों को पूरा करने के बाद, मैं गहराई से अध्ययन करने, अकादमिक पेपर और ट्यूटोरियल की खोज करने के लिए उत्सुक था। इसने मुझे इंटरनेट के माध्यम से जंक से उच्च गुणवत्ता वाले संसाधनों की पहचान करने की यात्रा पर प्रेरित किया। मैंने अमेज़ॅन से प्रॉम्प्ट इंजीनियरिंग और आर्टवर्क के लिए जेनेरेटिव एआई पर दो किताबें भी ऑर्डर कीं, जो खराब तरीके से लिखी गईं और पूरी तरह से पैसे की बर्बादी थीं। कई हफ्तों के गहन काम, सिरदर्द और कॉफी के कप के बाद, मैंने खुद को प्रॉम्प्ट इंजीनियरिंग के बारे में बहुत मूल्यवान संसाधनों के संग्रह के साथ पाया। दूसरों को उनकी प्रॉम्प्ट इंजीनियरिंग यात्रा में मदद करने की भावना से, मैंने पोस्ट की इस श्रृंखला को लिखने का अपना अनुभव साझा करने का निर्णय लिया।
यदि आपको यह लेख अच्छा लगा हो, तो मेरे काम का समर्थन करने के लिए मेरे सोशल मीडिया पर मुझे फ़ॉलो करने पर विचार करें। इसके अतिरिक्त, जब भी मैं नई सामग्री जारी करूँगा तो आपको सूचित किया जाएगा!!
🐦 ट्विटर | 👨💼लिंक्डइन | 💻अधिक कहानियाँ
प्रॉम्प्ट इंजीनियरिंग 101: कोड के साथ प्रॉम्प्ट, आउटपुट और नोटबुक
DeepLearning.ai द्वारा डेवलपर्स के लिए ChatGPT प्रॉम्प्ट इंजीनियरिंग
DeepLearning.ai द्वारा चैटजीपीटी एपीआई के साथ बिल्डिंग सिस्टम
शीघ्र इंजीनियरिंग गाइड
प्रोत्साहन पर परिचयात्मक पाठ्यक्रम