6,250 रीडिंग

OpenAI मॉडल फेस-ऑफ: GPT-4 बनाम GPT-3

द्वारा Claudia Słowik10m2023/03/20

बहुत लंबा; पढ़ने के लिए

लेख GPT-4 की तुलना अपने पूर्ववर्तियों, GPT-3 और GPT-3.5 के साथ 6 प्रमुख क्षेत्रों में करता है: मॉडल की क्षमताएं, टोकन सीमाएं, इनपुट प्रकार, संचालन क्षमता, फाइन-ट्यूनिंग और मूल्य निर्धारण।

featured image - OpenAI मॉडल फेस-ऑफ: GPT-4 बनाम GPT-3

GPT मॉडल के नए संस्करण, GPT-4 की रिलीज़ ने - पहले से ही प्रसिद्ध - OpenAI भाषा मॉडल पर कुछ अतिरिक्त ध्यान दिया है। कोई आश्चर्य नहीं!

GPT-4 को OpenAI की सबसे उन्नत प्रणाली के रूप में पेश किया गया था जो जटिल समस्याओं को अधिक सटीकता के साथ हल कर सकता है, इसके व्यापक सामान्य ज्ञान और समस्या को सुलझाने की क्षमताओं के लिए धन्यवाद।

इस लेख में, मैं GPT-3 बनाम GPT-4 और GPT-3.5 की तुलना करता हूं, जो मॉडल के दो समूहों के बीच आया था।

तैयार?

OpenAI GPT-3 क्या है?

GPT-3 OpenAI द्वारा विकसित एक भाषा मॉडल है। यह जून 2020 में जारी किया गया था और इसकी उल्लेखनीय भाषा निर्माण क्षमताओं के लिए जल्दी से ध्यान आकर्षित किया।

GPT-3 कई आधार मॉडल में आता है जिसमें अलग-अलग संख्या में पैरामीटर और आवश्यक कम्प्यूटेशनल संसाधन होते हैं। सबसे अधिक पहचाने जाने वाले एडा, बैबेज, क्यूरी और डेविंसी हैं।

15 मार्च, 2022 को, OpenAI ने GPT-3 का नया संस्करण "टेक्स्ट-डेविंसी-003" जारी किया। इस मॉडल को GPT के पिछले संस्करणों की तुलना में अधिक सक्षम बताया गया था। इसके अलावा, इसे जून 2021 तक के डेटा पर प्रशिक्षित किया गया था, जिससे यह मॉडल के पिछले संस्करणों (अक्टूबर 2019 तक के डेटा पर प्रशिक्षित) की तुलना में अधिक अप-टू-डेट हो गया। आठ महीने बाद, नवंबर 2022 में, OpenAI ने इस मॉडल को "GPT-3.5" श्रृंखला से संबंधित के रूप में संदर्भित करना शुरू किया। लेकिन चलिए टाइमलाइन को छोड़ दें।

GPT-3.5 क्या है?

आज तक, हमारे पास 5 अलग-अलग मॉडल वैरिएंट हैं जो GPT-3.5 श्रृंखला से संबंधित हैं। उनमें से चार को पाठ-पूर्ण कार्यों के लिए अनुकूलित किया गया है, और एक को कोड-पूर्ण कार्यों के लिए अनुकूलित किया गया है।

GPT-3.5 मॉडल का नवीनतम संस्करण, gpt-3.5-turbo , 1 मार्च, 2023 को जारी किया गया था - और इसने तुरंत GPT-3.5 में रुचि को बढ़ा दिया है। बस GPT-4 के रिलीज़ होने से पहले दर्शकों को उत्साहित करने के लिए।

OpenAI GPT-4 क्या है?

GPT-4 OpenAI भाषा मॉडल का सबसे नया - और सबसे उन्नत - संस्करण है। 14 मार्च, 2023 को पेश किया गया, इसे गहन शिक्षण विकास में नया मील का पत्थर कहा जाता है।

GPT-4 को GPT-3 और GPT-3.5 की तुलना में अधिक तथ्यात्मक रूप से सटीक कथन उत्पन्न करने में सक्षम कहा जाता है, जिससे अधिक विश्वसनीयता और विश्वसनीयता सुनिश्चित होती है। यह मल्टीमॉडल भी है, जिसका अर्थ है कि यह छवियों को इनपुट के रूप में स्वीकार कर सकता है और कैप्शन, वर्गीकरण और विश्लेषण उत्पन्न कर सकता है।

अंतिम लेकिन कम से कम, इसने कुछ रचनात्मकता हासिल की है। जैसा कि हम आधिकारिक उत्पाद अद्यतन में पढ़ सकते हैं, "यह रचनात्मक और तकनीकी लेखन कार्यों पर उपयोगकर्ताओं के साथ उत्पन्न, संपादित और पुनरावृति कर सकता है, जैसे गीत रचना, पटकथा लिखना, या उपयोगकर्ता की लेखन शैली सीखना।"

अभी के लिए, मार्च 2023 में, GPT-4 दो मॉडल वेरिएंट में आता है:

gpt-4-8K
gpt-4-32K

जो संदर्भ विंडो के उनके आकार के आकार से भिन्न होते हैं। भले ही GPT-4 पहले से ही व्यावसायिक रूप से उपयोग किया जा रहा है, अधिकांश उपयोगकर्ताओं को GPT-4 API तक पहुंच प्राप्त करने और अपने स्वयं के GPT-4-संचालित एप्लिकेशन और सेवाओं का निर्माण करने के लिए कुछ समय इंतजार करना होगा।

क्या यह इंतज़ार करने लायक है? आइए देखते हैं!

GPT-4 बनाम GPT-3 और GPT-3.5 – प्रमुख अंतर

जब GPT-4 की तुलना GPT-3 से करने के लिए कहा गया , तो OpenAI के सह-संस्थापकों में से एक और इसके अध्यक्ष ग्रेग ब्रॉकमैन के पास एक शब्द था: अलग । जैसा कि उन्होंने टेकक्रंच को बताया है:

अभी भी बहुत सारी समस्याएं और गलतियाँ हैं जो [मॉडल] करता है ... लेकिन आप वास्तव में कैलकुलस या कानून जैसी चीजों में कौशल में उछाल देख सकते हैं, जहाँ यह कुछ डोमेन में वास्तव में खराब होने से वास्तव में मनुष्यों के सापेक्ष काफी अच्छा हो गया।

आइए इसे थोड़ा और विस्तृत करने का प्रयास करें। खासकर जब से OpenAI द्वारा प्रकाशित GPT-4 शोध नए मॉडलों के बारे में आश्चर्यजनक रूप से कई विवरण प्रकट करता है।

GPT-4 बनाम GPT-3 मॉडल की क्षमताएं

GPT-3 और GPT-4 के बीच सबसे बड़ा अंतर उनकी क्षमताओं में से एक है। GPT-3.5 की तुलना में GPT-4 को अधिक विश्वसनीय, रचनात्मक, सहयोगी और अधिक सूक्ष्म निर्देशों को संभालने में सक्षम कहा जाता है।

दो मॉडलों के बीच के अंतर को समझने के लिए, OpenAI डेवलपर्स ने उन्हें अलग-अलग बेंचमार्क पर परीक्षण किया है, जिसमें अनुकरण परीक्षाएं शामिल हैं जो मूल रूप से मनुष्यों के लिए डिज़ाइन की गई थीं।

हम सबसे हालिया सार्वजनिक रूप से उपलब्ध परीक्षणों (ओलंपियाड और एपी मुक्त प्रतिक्रिया प्रश्नों के मामले में) का उपयोग करके या अभ्यास परीक्षा के 2022-2023 संस्करणों को खरीदकर आगे बढ़े। हमने इन परीक्षाओं के लिए कोई विशेष प्रशिक्षण नहीं लिया। प्रशिक्षण के दौरान मॉडल द्वारा परीक्षा में कुछ समस्याएं देखी गईं, लेकिन हम मानते हैं कि परिणाम प्रतिनिधि हैं।
(स्रोत: ओपनएआई )

परिणाम आश्चर्यजनक हैं!

जबकि GPT-3 ने AP कैलकुलस BC परीक्षा में 5 में से केवल 1 स्कोर किया, GPT-4 ने 4 स्कोर किया। सिम्युलेटेड बार परीक्षा में, GPT-4 शीर्ष 10% परीक्षार्थियों के स्कोर के साथ उत्तीर्ण हुआ, जबकि GPT-3.5 - GPT-3 श्रृंखला का सबसे उन्नत संस्करण - सबसे नीचे 10% था।

इसके अलावा, GPT-4 एक सच्चा बहुभाषाविद है। जबकि GPT-3 और GPT-3.5 संस्करणों (70.1% पर शॉट सटीकता के साथ) में GPT की अंग्रेजी दक्षता पहले से ही उच्च थी, नवीनतम संस्करण में इसकी सटीकता 85% से अधिक हो गई। वास्तव में, यह अपने पूर्वजों की तुलना में 25 बेहतर भाषाएं बोलता है - जिसमें मंदारिन, पोलिश और स्वाहिली शामिल हैं। यह देखते हुए कि अधिकांश मौजूदा एमएल बेंचमार्क अंग्रेजी में लिखे गए हैं, यह काफी प्रभावशाली है।

यदि वह पर्याप्त नहीं था, तो GPT-4 एक ही अनुरोध पर बहुत लंबे पाठ को संसाधित कर सकता है - सभी उच्च संदर्भ लंबाई के लिए धन्यवाद।

GPT-3 बनाम GPT-4 में टोकन सीमा

संदर्भ लंबाई एक पैरामीटर है जिसका उपयोग यह बताने के लिए किया जाता है कि एक एपीआई अनुरोध में कितने टोकन का उपयोग किया जा सकता है। 2020 में जारी मूल GPT-3 मॉडल ने अधिकतम अनुरोध मान 2,049 टोकन पर सेट किया। GPT-3.5 में, इस सीमा को बढ़ाकर 4,096 टोकन कर दिया गया था (जो ~ 3 पृष्ठों का एकल-पंक्ति वाला अंग्रेजी पाठ है)। GPT-4 दो वेरिएंट में आता है। उनमें से एक (GPT-4-8K) की संदर्भ लंबाई 8,192 टोकन है, और दूसरा (GPT-4-32K) 32,768 टोकन तक संसाधित कर सकता है, जो लगभग 50 पृष्ठों का पाठ है।

कहा जा रहा है, हम GPT-4 के सभी नए उपयोग के मामलों के बारे में सोच सकते हैं। पाठ के 50 पृष्ठों को संसाधित करने की उनकी क्षमता के साथ, नए OpenAI मॉडल का उपयोग पाठ के लंबे टुकड़े बनाने, बड़े दस्तावेज़ों या रिपोर्ट का विश्लेषण और सारांश करने या संदर्भ खोए बिना बातचीत को संभालने के लिए संभव होगा। टेकक्रंच के लिए साक्षात्कार में ग्रेग ब्रॉकमैन द्वारा प्रस्तुत किया गया:

पहले, मॉडल को इस बात का कोई ज्ञान नहीं था कि आप कौन हैं, आपकी रुचि किसमें है, इत्यादि। उस तरह का इतिहास होने से [बड़ी संदर्भ खिड़की के साथ] निश्चित रूप से इसे और अधिक सक्षम बनाने जा रहा है ... यह टर्बोचार्ज करेगा कि लोग क्या कर सकते हैं।

लेकिन यह अंत नहीं है क्योंकि टेक्स्ट इनपुट को संसाधित करने के अलावा, GPT-4 अन्य इनपुट प्रकारों की भी व्याख्या कर सकता है।

GPT-4 और GPT-3 में इनपुट प्रकार

जबकि GPT-3 और GPT-3.5 मॉडल एक प्रकार के इनपुट (पाठ; या कोड - सटीक होने के लिए) तक सीमित थे, GPT-4 एक अतिरिक्त इनपुट प्रकार को स्वीकार करता है: चित्र। विशेष रूप से, यह टेक्स्ट और छवियों से युक्त इनपुट से टेक्स्ट आउटपुट उत्पन्न करता है।

आप GPT-4 मॉडल से क्या करने के लिए कहते हैं, इसके आधार पर यह कैप्शन उत्पन्न कर सकता है, दृश्य तत्वों को वर्गीकृत कर सकता है, या छवि का विश्लेषण कर सकता है। GPT-4 अनुसंधान प्रलेखन में प्रस्तुत उदाहरणों में, हम ग्राफ़ का विश्लेषण करने वाले मॉडल देख सकते हैं, मीम्स की व्याख्या कर सकते हैं, और यहां तक कि पाठ और छवियों वाले पेपर का सारांश भी देख सकते हैं। हमें यह स्वीकार करना चाहिए कि GPT-4 की छवि को समझने की क्षमता प्रभावशाली है।

बस केवल एक नजर डाले!

छवियों को संसाधित करने की क्षमता, उच्च टोकन सीमाओं के साथ मिलकर, GPT-4 का उपयोग करने के लिए नई संभावनाओं को खोलती है - शैक्षणिक अनुसंधान से लेकर व्यक्तिगत प्रशिक्षण या खरीदारी सहायकों तक। हालाँकि, बहुत उत्साहित न हों, क्योंकि इसमें कुछ समय लग सकता है जब तक कि आप GPT-4 के इस नए कौशल का उपयोग नहीं कर पाते।

जैसा कि हम OpenAI साइट पर पढ़ सकते हैं, छवि इनपुट अभी भी एक शोध पूर्वावलोकन हैं और सार्वजनिक रूप से उपलब्ध नहीं हैं।

GPT-4 बनाम GPT-3 वार्तालाप के संदर्भ को परिभाषित करना

GPT-3 और GPT-4 के बीच एक और बड़ा अंतर यह है कि हम मॉडल के स्वर, शैली और व्यवहार को कैसे निर्धारित कर सकते हैं।

जीपीटी के नवीनतम संस्करण में, तथाकथित "सिस्टम" संदेशों ( ओपनएआई की उपयोग नीति में विस्तार से वर्णित सीमा के भीतर) को शामिल करके एपीआई स्तर पर निर्देशों के साथ मॉडल प्रदान करना संभव है। ये निर्देश संदेशों का स्वर निर्धारित करते हैं और वर्णन करते हैं कि मॉडल को कैसे व्यवहार करना चाहिए (उदाहरण के लिए, "आप कभी भी छात्र को उत्तर नहीं देते हैं लेकिन हमेशा सही प्रश्न पूछने का प्रयास करते हैं ताकि उन्हें अपने लिए सोचने में मदद मिल सके")।

इसके अतिरिक्त, वे GPT-4 के इंटरैक्शन के लिए सीमाएं स्थापित करते हैं, GPT-4 को उपयोगकर्ता के अनुरोध पर अपने व्यवहार को बदलने से रोकने के लिए "गार्डराइल्स" के रूप में कार्य करने में सक्षम होते हैं - ठीक निम्न उदाहरण की तरह:

जैसा कि आप देख सकते हैं, उपयोगकर्ता के अनुरोधों के बावजूद GPT-4 अपनी भूमिका के भीतर रहता है - सिस्टम संदेश में परिभाषित।

कुछ हद तक, हम हाल ही में जारी GPT-3.5-Turbo में समान मॉडल की क्षमता का अनुभव कर सकते हैं। सिस्टम प्रॉम्प्ट में मॉडल की भूमिका को परिभाषित करके, हम एक अलग प्रतिक्रिया प्राप्त कर सकते हैं। देखें कि GPT मॉडल कौन होने का नाटक कर रहा है, इसके आधार पर संदेश कैसे भिन्न होता है:

मार्च 2023 तक, जब GPT-3.5-टर्बो जारी किया गया था, तब मॉडल को सिस्टम संदेश प्रदान करना संभव नहीं था। आवश्यक संदर्भ जानकारी संकेत के भीतर दी जानी चाहिए और पूरी बातचीत के दौरान आसानी से बदली जा सकती है।

नई GPT-4 की क्षमता इसे अपने व्यवहार में अधिक सुसंगत और बाहरी विशिष्टताओं (जैसे, आपके ब्रांड संचार दिशानिर्देश) के लिए अधिक समायोज्य बनाने की अनुमति देती है।

GPT-4 बनाम GPT-3 का उपयोग करने की लागत

बेशक, यह सब एक कीमत पर आता है। जबकि GPT-3 मॉडल की कीमत $0.0004 से $0.02 प्रति 1K टोकन है, और नवीनतम GPT-3.5-टर्बो सबसे शक्तिशाली GPT davinci मॉडल की तुलना में 10 गुना सस्ता ($0.002 प्रति 1K टोकन) आया है, GPT-4 का उपयोग करने की लागत कोई नहीं छोड़ती है भ्रम: यदि आप सबसे उन्नत मॉडल का उपयोग करना चाहते हैं, तो आपको अतिरिक्त भुगतान करना होगा।

8K कॉन्टेक्स्ट विंडो के साथ GPT-4 की कीमत $0.03 प्रति 1K प्रांप्ट टोकन और $0.06 प्रति 1K पूर्णता टोकन होगी। दूसरी ओर, 32K कॉन्टेक्स्ट विंडो के साथ GPT-4 की कीमत $0.06 प्रति 1K प्रांप्ट टोकन और $0.12 प्रति 1K पूर्णता टोकन होगी।

यदि 1500 प्रांप्ट टोकन की औसत लंबाई और 500 पूर्णता टोकन के साथ 100k अनुरोधों को संसाधित करने की लागत text-davinci-003 के साथ $4,000 और GPT-4 के साथ gpt-3.5-turbo के साथ $400 है, तो 8K संदर्भ विंडो के साथ इसकी लागत $7,500 और इसके साथ $15,000 होगी 32K संदर्भ विंडो।

यह न केवल महंगा है, बल्कि गणना करने के लिए भी अधिक जटिल है । ऐसा इसलिए है क्योंकि शीघ्र (इनपुट) टोकन की लागत पूर्णता (आउटपुट) टोकन की लागत से भिन्न होती है। यदि आप हमारेGPT-3 मूल्य निर्धारण प्रयोग को याद करते हैं, तो आप पहले से ही जानते हैं कि टोकन के उपयोग का अनुमान लगाना कठिन है क्योंकि इनपुट और आउटपुट लंबाई के बीच बहुत कम संबंध है। आउटपुट (पूर्णता) टोकन की उच्च लागत के साथ, GPT-4 मॉडल का उपयोग करने की लागत और भी कम अनुमानित होगी।

OpenAI मॉडल की फाइन-ट्यूनिंग

याद रखें कि हमने GPT-4 और GPT-3.5-टर्बो के लिए सिस्टम संदेश में संदर्भ को कैसे परिभाषित किया? फाइन-ट्यूनिंग मूल रूप से मॉडल के स्वर, शैली और व्यवहार को परिभाषित करने और जीपीटी मॉडल को एक विशिष्ट अनुप्रयोग में अनुकूलित करने के लिए एक समाधान विधि है।

मॉडल को फ़ाइन-ट्यून करने के लिए, आप इसे कई और उदाहरणों पर प्रशिक्षित कर सकते हैं, जो प्रॉम्प्ट फिट कर सकता है। एक बार एक मॉडल ठीक-ठीक हो जाने के बाद, आपको प्रॉम्प्ट में उदाहरण प्रदान करने की आवश्यकता नहीं है। यह लागत बचाता है (प्रत्येक 1K टोकन मायने रखता है!) और कम-विलंबता अनुरोधों को सक्षम करता है। बहुत अच्छा लगता है, है ना? हालाँकि, यह अफ़सोस की बात है कि केवल OpenAI मॉडल जो वर्तमान में फ़ाइन-ट्यून के लिए उपलब्ध हैं, वे मूल GPT-3 बेस मॉडल (डेविन्सी, क्यूरी, एडा और कैबेज) हैं।

त्रुटियाँ और सीमाएँ

जब GPT-4 के बारे में अलग-अलग अफवाहें सामने आईं (उदाहरण के लिए, इसके द्वारा उपयोग किए जाने वाले मापदंडों की संख्या के बारे में), तो OpenAI के CEO ने टिप्पणी की कि:

GPT-4 अफवाह मिल एक हास्यास्पद बात है। मुझे नहीं पता कि यह सब कहां से आता है। लोग निराश होने की भीख मांग रहे हैं, और वे होंगे। (...) हमारे पास वास्तविक AGI नहीं है, और यह हमसे अपेक्षित है।

हालांकि GPT-4 को निराशाजनक कहना कठिन है, इसकी रचनात्मकता और अद्भुत क्षमताओं को देखते हुए, इसकी सीमाओं के बारे में पता होना महत्वपूर्ण है। और जैसा कि हम उत्पाद अनुसंधान प्रलेखन में पढ़ सकते हैं: वे मॉडल के पिछले संस्करणों की तुलना में बहुत अधिक नहीं बदले।

अपने पूर्ववर्तियों की तरह, GPT-4 में सितंबर 2021 के बाद होने वाली घटनाओं का ज्ञान नहीं है। इसके अलावा, ChatGPT कितना भी स्मार्ट क्यों न लगे, यह अभी भी पूरी तरह से विश्वसनीय नहीं है - GPT-4 के साथ संचालित होने पर भी। भले ही यह दावा किया जाता है कि यह पिछले मॉडलों के सापेक्ष मतिभ्रम को काफी कम कर देता है (उनके आंतरिक मूल्यांकन में GPT-3.5 की तुलना में 40% अधिक अंक), यह अभी भी तथ्यों को "भ्रम" करता है और तर्क संबंधी त्रुटियां करता है। यह अभी भी हानिकारक सलाह उत्पन्न कर सकता है (हालांकि इसके उत्तर देने से इंकार करने की अधिक संभावना है), बग्गी कोड, या गलत जानकारी, और इसके कारण, इसे उच्च त्रुटि लागत वाले क्षेत्रों में उपयोग नहीं किया जाना चाहिए।

GPT-3 बनाम GPT-4 - मुख्य टेकअवे

OpenAI की सबसे उन्नत प्रणाली के रूप में, GPT-4 तुलना के लगभग हर क्षेत्र में मॉडल के पुराने संस्करणों से आगे निकल जाता है। यह GPT-3 की तुलना में अधिक रचनात्मक और अधिक सुसंगत है। यह पाठ के लंबे टुकड़ों या छवियों को भी संसाधित कर सकता है। यह अधिक सटीक है और "तथ्यों" को बनाने की संभावना कम है। इसकी क्षमताओं के लिए धन्यवाद, यह जेनेरेटिव एआई के लिए कई नए संभावित उपयोग के मामले बनाता है।

क्या इसका मतलब यह है कि GPT-4 GPT-3 और GPT-3.5 की जगह लेगा? शायद नहीं। भले ही GPT OpenAI मॉडल के पिछले संस्करणों की तुलना में अधिक शक्तिशाली है, यह उपयोग करने के लिए अधिक महंगा भी है। कई उपयोग मामलों में जहां आपको बहु-पृष्ठ दस्तावेज़ों को संसाधित करने या लंबी बातचीत को "याद" करने के लिए मॉडल की आवश्यकता नहीं होती है, GPT-3 और GPT-3.5 की क्षमताएं पर्याप्त होंगी।

यहाँ भी प्रकाशित हुआ।