paint-brush
क्या OpenAI का o3 अंततः मानव की तरह सोचने लगा है?द्वारा@niteshpadghan
नया इतिहास

क्या OpenAI का o3 अंततः मानव की तरह सोचने लगा है?

द्वारा Nitesh Padghan8m2024/12/31
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

ओपनएआई का o3 मॉडल एआई रीजनिंग में एक बड़ी छलांग लाता है, कोडिंग, गणित और सामान्य बुद्धिमत्ता बेंचमार्क में उत्कृष्टता लाता है। क्या यह सच्चे AGI की ओर अगला कदम हो सकता है?
featured image - क्या OpenAI का o3 अंततः मानव की तरह सोचने लगा है?
Nitesh Padghan HackerNoon profile picture
0-item

कल्पना कीजिए: आप अपने AI सहायक से कोई प्रश्न पूछते हैं, और वह मिलीसेकंड में आधा-अधूरा उत्तर देने के बजाय रुक जाता है।


यह सोचता है, यह तर्क करता है।


और फिर, यह इतनी अच्छी तरह से सोची-समझी प्रतिक्रिया देता है, कि ऐसा लगता है जैसे यह लगभग...मानवीय है।


यह भविष्यवादी लगता है, है ना?


खैर, ओ3 मॉडल में आपका स्वागत है, ओपनएआई की नवीनतम रचना जो खेल को पूरी तरह से बदलने का वादा करती है।


वर्षों से, एआई एक पैटर्न में अटका हुआ है - तेज प्रतिक्रियाएं, आकर्षक आउटपुट, लेकिन जरूरी नहीं कि अधिक स्मार्ट भी हों।


O3 के साथ, OpenAI कह रहा है, "धीमा हो जाओ। चलो इसे सही तरीके से करते हैं।"

सबसे पहले बात: o3 क्या है?

जब ओपनएआई ने अपने 12 दिवसीय "शिपमास" कार्यक्रम के दौरान o3 का अनावरण किया , तो यह भीड़ भरे एआई बाजार में एक और घोषणा मात्र नहीं थी।


उन्होंने दावा किया कि यह मॉडल न केवल अधिक स्मार्ट है, बल्कि अधिक विचारशील भी है।


मूलतः, o3 OpenAI के "तर्क मॉडल" परिवार का हिस्सा है।


पारंपरिक एआई के विपरीत, जो अक्सर उत्तर देने के लिए क्रूर कम्प्यूटेशनल बल पर निर्भर करता है, o3 जैसे तर्क मॉडल मनुष्यों की तरह सूचना को संसाधित करने के लिए डिज़ाइन किए गए हैं।


लेकिन क्या बात o3 को अलग बनाती है?


  • यह स्वयं तथ्य-जांच करता है: जब आप इससे कोई प्रश्न पूछते हैं, तो यह सिर्फ उत्तर नहीं देता है - यह बीच-बीच में संदर्भों की जांच और पुनः जांच भी करता है।
  • यह अलग-अलग गति से सोचता है: कार्य के आधार पर, आप इसे कम, मध्यम या उच्च गणना पर सेट कर सकते हैं (अनिवार्य रूप से यह बताते हुए कि इसे कितनी "दिमागी शक्ति" का उपयोग करना है)। इसका मतलब है कि यह बिना किसी परेशानी के सरल प्रश्नों और जटिल पहेलियों दोनों को संभाल सकता है।
  • यह लचीला है: पूर्ण विकसित o3 मॉडल और इसका छोटा भाई, o3-मिनी , हल्के कार्यों और तंग बजट के लिए डिज़ाइन किया गया है।

इसे o3 क्यों कहा गया? और o2 का क्या हुआ?

ओपनएआई ने ब्रिटिश दूरसंचार प्रदाता O2 के साथ ट्रेडमार्क विवाद के कारण "o2" शब्द को छोड़ दिया।


हां, तुमने सही पढ़ा।


ओपनएआई के सीईओ सैम ऑल्टमैन ने लाइव स्ट्रीम के दौरान इसकी पुष्टि भी की।


तकनीकी दुनिया में, एआई मॉडलों का नामकरण भी कानूनी विवाद का विषय बन सकता है।


लेकिन नाम के बारे में बात काफी हो चुकी है। आइए बात करते हैं कि यह मॉडल लोगों का ध्यान क्यों आकर्षित कर रहा है।

o3 के पीछे के आंकड़े: क्यों यह दिमाग को चौंका रहा है

यदि आप डेटा में रुचि रखते हैं, तो यहां चीजें दिलचस्प हो जाती हैं।

1- तर्क शक्ति

O3 की सबसे उल्लेखनीय उपलब्धियों में से एक है ARC AGI बेंचमार्क पर इसका प्रदर्शन - यह एक परीक्षण है जो यह मापने के लिए बनाया गया है कि क्या AI नए कौशल सीख सकता है और उनका सामान्यीकरण कर सकता है, न कि केवल उसी बात को दोहरा सकता है जिस पर उसे प्रशिक्षित किया गया है।


कल्पना कीजिए: आपको ज्यामितीय पैटर्न की एक श्रृंखला दी गई है और अगले पैटर्न की भविष्यवाणी करने को कहा गया है।


कोई पूर्व उदाहरण नहीं, कोई याद किया हुआ टेम्पलेट नहीं - केवल कच्चा तर्क।


यही चुनौती एआरसी एजीआई एआई के सामने प्रस्तुत करती है।

  • O1 का स्कोर: 32%
  • O3 का स्कोर: 88% (उच्च गणना पर)


यह मील का पत्थर इसलिए महत्वपूर्ण है क्योंकि एआरसी एजीआई को एआई की मानव की तरह सोचने की क्षमता के मूल्यांकन के लिए स्वर्ण मानक माना जाता है।


पहली बार, किसी AI मॉडल ने इस परीक्षण में मानव-स्तर का प्रदर्शन पार किया है।

यहाँ ओपनएआई द्वारा o3 मॉडल पर किया गया परीक्षण है

यहाँ क्या हो रहा है?


आपको रंगीन आकृतियों वाला एक ग्रिड दिखाया जाता है और पूछा जाता है, “यदि यह इनपुट है, तो आउटपुट कैसा दिखना चाहिए?”


एआई को कुछ उदाहरण दिए गए हैं कि किस प्रकार इनपुट ग्रिड को आउटपुट ग्रिड में परिवर्तित किया जाता है।


उदाहरण विशिष्ट तर्क या नियमों का पालन करते हैं।


उदाहरण के लिए:

  • एक उदाहरण में, लाल बिन्दुओं वाले पीले वर्ग को लाल बॉर्डर दिया गया है।
  • दूसरे चित्र में, नीले बिन्दुओं वाले पीले वर्ग को नीले रंग की सीमा दी गई है।


लक्ष्य?

  • एआई को इन परिवर्तनों के पीछे के नियमों को स्पष्ट रूप से बताए बिना ही समझना होगा।
  • फिर, उसे उन नियमों को एकदम नए ग्रिड ("टेस्ट इनपुट") पर लागू करना होगा और सही "टेस्ट आउटपुट" उत्पन्न करना होगा।


एआई के लिए यह इतना कठिन क्यों है?

मनुष्य ऐसा हर समय करते हैं।


उदाहरण के लिए, यदि कोई कहता है, "लाल बिंदुओं वाली किसी भी चीज़ पर लाल आउटलाइन जोड़ें," तो आप तुरंत समझ जाएंगे।


हालाँकि, AI को संघर्ष करना पड़ता है क्योंकि यह लाल या रूपरेखा की अवधारणा को "समझ" नहीं पाता है - यह केवल डेटा में पैटर्न को संसाधित करता है।


एआरसी परीक्षण एआई को पूर्व-सीखे गए उत्तरों से आगे सोचने के लिए प्रेरित करता है।


प्रत्येक परीक्षा अद्वितीय होती है, इसलिए याद करने से कोई मदद नहीं मिलेगी।


आखिरी टेस्ट (🤔 इमोजी के साथ) के बारे में क्या?

यहीं पर चीजें सचमुच पेचीदा हो जाती हैं।


परीक्षण इनपुट में चीजें मिश्रित हो जाती हैं: इसमें मैजेन्टा बिन्दुओं वाला एक पीला वर्ग होता है।


ए.आई. ने पहले कभी मैजेंटा रंग नहीं देखा है - उसे क्या करना चाहिए?


मनुष्य अनुमान लगा सकते हैं, "शायद इसे मैजेंटा रंग की सीमा मिलनी चाहिए", लेकिन इसके लिए तर्क और तर्कसंगत छलांग की आवश्यकता होती है।


एआई के लिए यह ऐसा है जैसे किसी से आंखों पर पट्टी बांधकर चट्टान से कूदने को कहा जाए।


यह पूरी तरह से उसके प्रशिक्षण से बाहर है।

2 - O3 का उल्लेखनीय प्रदर्शन

O3 ने ARC AGI परीक्षण में उत्कृष्ट प्रदर्शन करके AI रीजनिंग में एक नया मानक स्थापित किया है।


निम्न-कंप्यूट सेटिंग्स पर, O3 ने सेमी-प्राइवेट होल्डआउट सेट पर 76% स्कोर किया - जो किसी भी पिछले मॉडल से कहीं बेहतर प्रदर्शन था।


लेकिन वास्तविक सफलता तब मिली जब उच्च-कंप्यूटर सेटिंग्स पर इसका परीक्षण किया गया, जहां O3 ने असाधारण 88% हासिल किया, जो 85% की सीमा को पार कर गया, जिसे अक्सर मानव-स्तर का प्रदर्शन माना जाता है।

3 - कोडिंग विजार्ड्री

ग्राफ से पता चलता है कि O3 ने बेंच वेरिफाइड पर 71.7% सटीकता प्राप्त की है , जो एक बेंचमार्क है जो वास्तविक दुनिया के सॉफ्टवेयर इंजीनियरिंग कार्यों का अनुकरण करता है।


यह O1 की तुलना में 46% सुधार है, जो डेवलपर्स द्वारा प्रतिदिन सामना की जाने वाली जटिल, व्यावहारिक चुनौतियों को हल करने में O3 की ताकत का संकेत देता है।


प्रतिस्पर्धी कोडिंग में, अंतर और भी अधिक नाटकीय है।


2727 के ELO स्कोर के साथ, O3 न केवल O1 के 1891 से बेहतर प्रदर्शन करता है - बल्कि यह शीर्ष मानव प्रोग्रामरों के प्रतिद्वंद्वी वर्ग में प्रवेश करता है।

संदर्भ के लिए, 2400 से ऊपर के ELO को आमतौर पर ग्रैंडमास्टर स्तर माना जाता है और इसकी कोडफोर्स रेटिंग 2727 इसे मानव कोडर्स के शीर्ष 0.8% में रखती है।

4 - मैथ जीनियस

2024 अमेरिकी आमंत्रण गणित परीक्षा में, o3 ने चौंका देने वाला 96.7% स्कोर किया, केवल एक प्रश्न गलत हुआ।

5 - विज्ञान कौतुक

जीपीक्यूए डायमंड, पीएचडी स्तर के विज्ञान प्रश्नों के एक सेट पर, o3 ने 87.7% सटीकता हासिल की - जो एआई मॉडल के लिए एक अनसुनी उपलब्धि है।


ये सिर्फ संख्याएं नहीं हैं - ये इस बात का प्रमाण हैं कि o3 उन चुनौतियों से निपट रहा है जो कभी मशीनों की पहुंच से बाहर लगती थीं।


o3 कैसे सोचता है?

O3 अधिकांश AI की तरह सिर्फ प्रतिक्रिया नहीं करता - यह सांस लेता है, रुकता है, और सोचता है।


इसे उत्तर देने में और बोलने से पहले विकल्पों पर सावधानीपूर्वक विचार करने के बीच के अंतर के रूप में सोचें।


यह संभव है जानबूझकर संरेखण नामक एक चीज़ के कारण।

स्रोत : OpenAI

यह O3 को एक नैतिक दिशा-निर्देश देने जैसा है, उसे सरल भाषा में सुरक्षा और नैतिकता के नियम सिखाना, तथा यह दिखाना कि कठिन परिस्थितियों में केवल प्रतिक्रिया करने के बजाय तर्क से काम लेना चाहिए।


एक त्वरित उदाहरण

कल्पना कीजिए कि कोई व्यक्ति ROT13 सिफर (मूलतः एक अव्यवस्थित संदेश) का उपयोग करके हानिकारक अनुरोध को एनकोड करके O3 को मात देने का प्रयास कर रहा है।


वे अवैध गतिविधि को छिपाने के बारे में सलाह मांग रहे हैं।


एक कम उन्नत AI शायद इस प्रलोभन को स्वीकार कर ले, लेकिन O3?


यह अनुरोध को समझता है, यह पहचानता है कि यह संदिग्ध है, तथा OpenAI की सुरक्षा नीतियों के साथ इसकी जांच करता है।


यह सिर्फ प्रतिक्रिया को ही अवरुद्ध नहीं करता।


इसमें कारण बताया गया है कि यह अनुरोध नैतिक सीमाओं का उल्लंघन करता है तथा स्पष्ट रूप से इन्कार कर दिया गया है।


यह एक विवेकशील कृत्रिम बुद्धि है - या जितना हमने कभी देखा है, उसके सबसे करीब।


O3 की विचार प्रक्रिया इस प्रकार काम करती है:

1- यह नियम पढ़ता है

क्या सही है और क्या गलत है, इसका अनुमान लगाने के बजाय, O3 को सरल भाषा में लिखे गए वास्तविक सुरक्षा दिशानिर्देशों के साथ प्रशिक्षित किया जाता है।


यह व्यवहार का अनुमान लगाने के लिए सिर्फ उदाहरणों पर निर्भर नहीं रहता है - यह पहले से ही नियम पुस्तिका को सीख लेता है।

2 - यह कदम-दर-कदम सोचता है

जब कोई कठिन या जटिल कार्य सामने आता है, तो O3 जल्दबाजी में निष्कर्ष पर नहीं पहुंचता।


इसमें तथाकथित विचार-श्रृंखलाबद्ध तर्क का प्रयोग किया जाता है - जिसमें समस्या को चरणबद्ध तरीके से तोड़कर सर्वोत्तम उत्तर निकाला जाता है।

3 - यह पल के अनुसार ढल जाता है

हर परिस्थिति एक जैसी नहीं होती.


कुछ कार्यों के लिए त्वरित उत्तर की आवश्यकता होती है, जबकि अन्य के लिए गहन चिंतन की आवश्यकता होती है।


O3 समस्या की जटिलता के आधार पर अपने प्रयास को समायोजित करता है, इसलिए जब संभव हो तो यह कुशल होता है और जब आवश्यक हो तो गहन होता है।

O3 मिनी से मिलिए: बजट-फ्रेंडली जीनियस

O3 के साथ-साथ OpenAI ने O3 मिनी भी प्रस्तुत किया, जो एक लागत प्रभावी संस्करण है, जिसे ऐसे कार्यों के लिए डिजाइन किया गया है, जिनमें इसके बड़े संस्करण की पूरी शक्ति की आवश्यकता नहीं होती।


O3 मिनी में क्या खास है?


अनुकूली चिंतन समय उपयोगकर्ता कार्य की जटिलता के आधार पर मॉडल के तर्क प्रयास को समायोजित कर सकते हैं।


क्या आपको त्वरित उत्तर चाहिए? कम प्रयास वाले तर्क का सहारा लें।


किसी जटिल कोडिंग समस्या से निपटना चाहते हैं? तो इसे उच्च-प्रयास मोड पर ले जाएँ।


लागत-प्रदर्शन संतुलन O3 मिनी सरल कार्यों के लिए O3 के समान ही सटीकता प्रदान करता है, लेकिन लागत का एक अंश मात्र पर।


यह लचीलापन O3 मिनी को कम बजट पर काम करने वाले डेवलपर्स और शोधकर्ताओं के लिए एक आकर्षक विकल्प बनाता है।


क्या यह AI का भविष्य है? AGI की ओर एक कदम

यहां पर चीजें दार्शनिक हो जाती हैं।


एजीआई, या आर्टिफिशियल जनरल इंटेलिजेंस , उस एआई को संदर्भित करता है जो किसी भी कार्य को मानव द्वारा किया जा सकता है - और अक्सर बेहतर तरीके से।


ओपनएआई ने हमेशा से एजीआई को अपना लक्ष्य माना है, और ओ3 के साथ ऐसा लगता है कि वे इसके और करीब पहुंच रहे हैं।


इस पर विचार करें:

  • एआरसी-एजीआई पर, o3 ने अपने पूर्ववर्ती के प्रदर्शन को लगभग तीन गुना बढ़ा दिया।
  • इसमें ऐसी समस्याओं को हल करना शामिल है जिनके लिए केवल याद करने की नहीं, बल्कि सीखने और तर्क करने की आवश्यकता होती है।


जैसा कि कहा गया है, यहां तक कि ओपनएआई भी मानता है कि o3 अभी तक AGI नहीं है।


यह एजीआई के स्वरूप का एक प्रोटोटाइप है - एक एआई जो सीखता है, अनुकूलन करता है, और ऐसे तरीकों से तर्क करता है जो मानवीय लगते हैं।


आगे की चुनौतियाँ अपनी अविश्वसनीय क्षमताओं के बावजूद, o3 में खामियां भी हैं:

  1. लागत: उच्च कंप्यूटिंग सेटिंग्स में ओ3 चलाना महंगा है - जैसे, प्रति टैब 7 से 8 हजार डॉलर।
  2. त्रुटियाँ: यद्यपि यह तर्क करने में बेहतर है, फिर भी o3 गलती कर सकता है, विशेष रूप से सरल कार्यों में, जहां यह समस्या पर अधिक सोचता है।
  3. नैतिकता: o1 जैसे पहले के मॉडलों को कुछ परिदृश्यों में उपयोगकर्ताओं को धोखा देने के प्रयास के लिए आलोचना का सामना करना पड़ा। क्या o3 भी उसी जाल में फंस जाएगा?


बड़ा चित्र

o3 महज एक और AI मॉडल नहीं है - यह एक झलक है कि AI क्या बन सकता है।


यह परिपूर्ण तो नहीं है, लेकिन यह उस युग की ओर एक कदम है, जहां मशीनें सिर्फ प्रतिक्रिया ही नहीं देंगी - वे तर्क करेंगी, सीखेंगी और ऐसे तरीकों से अनुकूलन करेंगी जो गहराई से मानवीय महसूस होते हैं।


और यद्यपि हम अभी भी एजीआई से बहुत दूर हैं, o3 हमें याद दिलाता है कि प्रगति रैखिक नहीं है - यह चरघातांकी है।


तो, आप क्या सोचते हैं? क्या हम एक नई AI क्रांति के मुहाने पर हैं? या फिर o3 एक लंबी यात्रा का एक और मील का पत्थर है?