कल्पना कीजिए: आप अपने AI सहायक से कोई प्रश्न पूछते हैं, और वह मिलीसेकंड में आधा-अधूरा उत्तर देने के बजाय रुक जाता है।
यह सोचता है, यह तर्क करता है।
और फिर, यह इतनी अच्छी तरह से सोची-समझी प्रतिक्रिया देता है, कि ऐसा लगता है जैसे यह लगभग...मानवीय है।
यह भविष्यवादी लगता है, है ना?
खैर, ओ3 मॉडल में आपका स्वागत है, ओपनएआई की नवीनतम रचना जो खेल को पूरी तरह से बदलने का वादा करती है।
वर्षों से, एआई एक पैटर्न में अटका हुआ है - तेज प्रतिक्रियाएं, आकर्षक आउटपुट, लेकिन जरूरी नहीं कि अधिक स्मार्ट भी हों।
O3 के साथ, OpenAI कह रहा है, "धीमा हो जाओ। चलो इसे सही तरीके से करते हैं।"
जब ओपनएआई ने अपने 12 दिवसीय "शिपमास" कार्यक्रम के दौरान o3 का अनावरण किया , तो यह भीड़ भरे एआई बाजार में एक और घोषणा मात्र नहीं थी।
उन्होंने दावा किया कि यह मॉडल न केवल अधिक स्मार्ट है, बल्कि अधिक विचारशील भी है।
मूलतः, o3 OpenAI के "तर्क मॉडल" परिवार का हिस्सा है।
पारंपरिक एआई के विपरीत, जो अक्सर उत्तर देने के लिए क्रूर कम्प्यूटेशनल बल पर निर्भर करता है, o3 जैसे तर्क मॉडल मनुष्यों की तरह सूचना को संसाधित करने के लिए डिज़ाइन किए गए हैं।
लेकिन क्या बात o3 को अलग बनाती है?
ओपनएआई ने ब्रिटिश दूरसंचार प्रदाता O2 के साथ ट्रेडमार्क विवाद के कारण "o2" शब्द को छोड़ दिया।
हां, तुमने सही पढ़ा।
ओपनएआई के सीईओ सैम ऑल्टमैन ने लाइव स्ट्रीम के दौरान इसकी पुष्टि भी की।
तकनीकी दुनिया में, एआई मॉडलों का नामकरण भी कानूनी विवाद का विषय बन सकता है।
लेकिन नाम के बारे में बात काफी हो चुकी है। आइए बात करते हैं कि यह मॉडल लोगों का ध्यान क्यों आकर्षित कर रहा है।
यदि आप डेटा में रुचि रखते हैं, तो यहां चीजें दिलचस्प हो जाती हैं।
O3 की सबसे उल्लेखनीय उपलब्धियों में से एक है ARC AGI बेंचमार्क पर इसका प्रदर्शन - यह एक परीक्षण है जो यह मापने के लिए बनाया गया है कि क्या AI नए कौशल सीख सकता है और उनका सामान्यीकरण कर सकता है, न कि केवल उसी बात को दोहरा सकता है जिस पर उसे प्रशिक्षित किया गया है।
कल्पना कीजिए: आपको ज्यामितीय पैटर्न की एक श्रृंखला दी गई है और अगले पैटर्न की भविष्यवाणी करने को कहा गया है।
कोई पूर्व उदाहरण नहीं, कोई याद किया हुआ टेम्पलेट नहीं - केवल कच्चा तर्क।
यही चुनौती एआरसी एजीआई एआई के सामने प्रस्तुत करती है।
यह मील का पत्थर इसलिए महत्वपूर्ण है क्योंकि एआरसी एजीआई को एआई की मानव की तरह सोचने की क्षमता के मूल्यांकन के लिए स्वर्ण मानक माना जाता है।
पहली बार, किसी AI मॉडल ने इस परीक्षण में मानव-स्तर का प्रदर्शन पार किया है।
यहाँ क्या हो रहा है?
आपको रंगीन आकृतियों वाला एक ग्रिड दिखाया जाता है और पूछा जाता है, “यदि यह इनपुट है, तो आउटपुट कैसा दिखना चाहिए?”
एआई को कुछ उदाहरण दिए गए हैं कि किस प्रकार इनपुट ग्रिड को आउटपुट ग्रिड में परिवर्तित किया जाता है।
उदाहरण विशिष्ट तर्क या नियमों का पालन करते हैं।
उदाहरण के लिए:
लक्ष्य?
एआई के लिए यह इतना कठिन क्यों है?
मनुष्य ऐसा हर समय करते हैं।
उदाहरण के लिए, यदि कोई कहता है, "लाल बिंदुओं वाली किसी भी चीज़ पर लाल आउटलाइन जोड़ें," तो आप तुरंत समझ जाएंगे।
हालाँकि, AI को संघर्ष करना पड़ता है क्योंकि यह लाल या रूपरेखा की अवधारणा को "समझ" नहीं पाता है - यह केवल डेटा में पैटर्न को संसाधित करता है।
एआरसी परीक्षण एआई को पूर्व-सीखे गए उत्तरों से आगे सोचने के लिए प्रेरित करता है।
प्रत्येक परीक्षा अद्वितीय होती है, इसलिए याद करने से कोई मदद नहीं मिलेगी।
आखिरी टेस्ट (🤔 इमोजी के साथ) के बारे में क्या?
यहीं पर चीजें सचमुच पेचीदा हो जाती हैं।
परीक्षण इनपुट में चीजें मिश्रित हो जाती हैं: इसमें मैजेन्टा बिन्दुओं वाला एक पीला वर्ग होता है।
ए.आई. ने पहले कभी मैजेंटा रंग नहीं देखा है - उसे क्या करना चाहिए?
मनुष्य अनुमान लगा सकते हैं, "शायद इसे मैजेंटा रंग की सीमा मिलनी चाहिए", लेकिन इसके लिए तर्क और तर्कसंगत छलांग की आवश्यकता होती है।
एआई के लिए यह ऐसा है जैसे किसी से आंखों पर पट्टी बांधकर चट्टान से कूदने को कहा जाए।
यह पूरी तरह से उसके प्रशिक्षण से बाहर है।
O3 ने ARC AGI परीक्षण में उत्कृष्ट प्रदर्शन करके AI रीजनिंग में एक नया मानक स्थापित किया है।
निम्न-कंप्यूट सेटिंग्स पर, O3 ने सेमी-प्राइवेट होल्डआउट सेट पर 76% स्कोर किया - जो किसी भी पिछले मॉडल से कहीं बेहतर प्रदर्शन था।
लेकिन वास्तविक सफलता तब मिली जब उच्च-कंप्यूटर सेटिंग्स पर इसका परीक्षण किया गया, जहां O3 ने असाधारण 88% हासिल किया, जो 85% की सीमा को पार कर गया, जिसे अक्सर मानव-स्तर का प्रदर्शन माना जाता है।
ग्राफ से पता चलता है कि O3 ने बेंच वेरिफाइड पर 71.7% सटीकता प्राप्त की है , जो एक बेंचमार्क है जो वास्तविक दुनिया के सॉफ्टवेयर इंजीनियरिंग कार्यों का अनुकरण करता है।
यह O1 की तुलना में 46% सुधार है, जो डेवलपर्स द्वारा प्रतिदिन सामना की जाने वाली जटिल, व्यावहारिक चुनौतियों को हल करने में O3 की ताकत का संकेत देता है।
प्रतिस्पर्धी कोडिंग में, अंतर और भी अधिक नाटकीय है।
2727 के ELO स्कोर के साथ, O3 न केवल O1 के 1891 से बेहतर प्रदर्शन करता है - बल्कि यह शीर्ष मानव प्रोग्रामरों के प्रतिद्वंद्वी वर्ग में प्रवेश करता है।
संदर्भ के लिए, 2400 से ऊपर के ELO को आमतौर पर ग्रैंडमास्टर स्तर माना जाता है और इसकी कोडफोर्स रेटिंग 2727 इसे मानव कोडर्स के शीर्ष 0.8% में रखती है।
2024 अमेरिकी आमंत्रण गणित परीक्षा में, o3 ने चौंका देने वाला 96.7% स्कोर किया, केवल एक प्रश्न गलत हुआ।
जीपीक्यूए डायमंड, पीएचडी स्तर के विज्ञान प्रश्नों के एक सेट पर, o3 ने 87.7% सटीकता हासिल की - जो एआई मॉडल के लिए एक अनसुनी उपलब्धि है।
ये सिर्फ संख्याएं नहीं हैं - ये इस बात का प्रमाण हैं कि o3 उन चुनौतियों से निपट रहा है जो कभी मशीनों की पहुंच से बाहर लगती थीं।
O3 अधिकांश AI की तरह सिर्फ प्रतिक्रिया नहीं करता - यह सांस लेता है, रुकता है, और सोचता है।
इसे उत्तर देने में और बोलने से पहले विकल्पों पर सावधानीपूर्वक विचार करने के बीच के अंतर के रूप में सोचें।
यह संभव है जानबूझकर संरेखण नामक एक चीज़ के कारण।
यह O3 को एक नैतिक दिशा-निर्देश देने जैसा है, उसे सरल भाषा में सुरक्षा और नैतिकता के नियम सिखाना, तथा यह दिखाना कि कठिन परिस्थितियों में केवल प्रतिक्रिया करने के बजाय तर्क से काम लेना चाहिए।
एक त्वरित उदाहरण
कल्पना कीजिए कि कोई व्यक्ति ROT13 सिफर (मूलतः एक अव्यवस्थित संदेश) का उपयोग करके हानिकारक अनुरोध को एनकोड करके O3 को मात देने का प्रयास कर रहा है।
वे अवैध गतिविधि को छिपाने के बारे में सलाह मांग रहे हैं।
एक कम उन्नत AI शायद इस प्रलोभन को स्वीकार कर ले, लेकिन O3?
यह अनुरोध को समझता है, यह पहचानता है कि यह संदिग्ध है, तथा OpenAI की सुरक्षा नीतियों के साथ इसकी जांच करता है।
यह सिर्फ प्रतिक्रिया को ही अवरुद्ध नहीं करता।
इसमें कारण बताया गया है कि यह अनुरोध नैतिक सीमाओं का उल्लंघन करता है तथा स्पष्ट रूप से इन्कार कर दिया गया है।
यह एक विवेकशील कृत्रिम बुद्धि है - या जितना हमने कभी देखा है, उसके सबसे करीब।
O3 की विचार प्रक्रिया इस प्रकार काम करती है:
1- यह नियम पढ़ता है
क्या सही है और क्या गलत है, इसका अनुमान लगाने के बजाय, O3 को सरल भाषा में लिखे गए वास्तविक सुरक्षा दिशानिर्देशों के साथ प्रशिक्षित किया जाता है।
यह व्यवहार का अनुमान लगाने के लिए सिर्फ उदाहरणों पर निर्भर नहीं रहता है - यह पहले से ही नियम पुस्तिका को सीख लेता है।
2 - यह कदम-दर-कदम सोचता है
जब कोई कठिन या जटिल कार्य सामने आता है, तो O3 जल्दबाजी में निष्कर्ष पर नहीं पहुंचता।
इसमें तथाकथित विचार-श्रृंखलाबद्ध तर्क का प्रयोग किया जाता है - जिसमें समस्या को चरणबद्ध तरीके से तोड़कर सर्वोत्तम उत्तर निकाला जाता है।
3 - यह पल के अनुसार ढल जाता है
हर परिस्थिति एक जैसी नहीं होती.
कुछ कार्यों के लिए त्वरित उत्तर की आवश्यकता होती है, जबकि अन्य के लिए गहन चिंतन की आवश्यकता होती है।
O3 समस्या की जटिलता के आधार पर अपने प्रयास को समायोजित करता है, इसलिए जब संभव हो तो यह कुशल होता है और जब आवश्यक हो तो गहन होता है।
O3 के साथ-साथ OpenAI ने O3 मिनी भी प्रस्तुत किया, जो एक लागत प्रभावी संस्करण है, जिसे ऐसे कार्यों के लिए डिजाइन किया गया है, जिनमें इसके बड़े संस्करण की पूरी शक्ति की आवश्यकता नहीं होती।
O3 मिनी में क्या खास है?
अनुकूली चिंतन समय उपयोगकर्ता कार्य की जटिलता के आधार पर मॉडल के तर्क प्रयास को समायोजित कर सकते हैं।
क्या आपको त्वरित उत्तर चाहिए? कम प्रयास वाले तर्क का सहारा लें।
किसी जटिल कोडिंग समस्या से निपटना चाहते हैं? तो इसे उच्च-प्रयास मोड पर ले जाएँ।
लागत-प्रदर्शन संतुलन O3 मिनी सरल कार्यों के लिए O3 के समान ही सटीकता प्रदान करता है, लेकिन लागत का एक अंश मात्र पर।
यह लचीलापन O3 मिनी को कम बजट पर काम करने वाले डेवलपर्स और शोधकर्ताओं के लिए एक आकर्षक विकल्प बनाता है।
यहां पर चीजें दार्शनिक हो जाती हैं।
एजीआई, या आर्टिफिशियल जनरल इंटेलिजेंस , उस एआई को संदर्भित करता है जो किसी भी कार्य को मानव द्वारा किया जा सकता है - और अक्सर बेहतर तरीके से।
ओपनएआई ने हमेशा से एजीआई को अपना लक्ष्य माना है, और ओ3 के साथ ऐसा लगता है कि वे इसके और करीब पहुंच रहे हैं।
इस पर विचार करें:
जैसा कि कहा गया है, यहां तक कि ओपनएआई भी मानता है कि o3 अभी तक AGI नहीं है।
यह एजीआई के स्वरूप का एक प्रोटोटाइप है - एक एआई जो सीखता है, अनुकूलन करता है, और ऐसे तरीकों से तर्क करता है जो मानवीय लगते हैं।
आगे की चुनौतियाँ अपनी अविश्वसनीय क्षमताओं के बावजूद, o3 में खामियां भी हैं:
o3 महज एक और AI मॉडल नहीं है - यह एक झलक है कि AI क्या बन सकता है।
यह परिपूर्ण तो नहीं है, लेकिन यह उस युग की ओर एक कदम है, जहां मशीनें सिर्फ प्रतिक्रिया ही नहीं देंगी - वे तर्क करेंगी, सीखेंगी और ऐसे तरीकों से अनुकूलन करेंगी जो गहराई से मानवीय महसूस होते हैं।
और यद्यपि हम अभी भी एजीआई से बहुत दूर हैं, o3 हमें याद दिलाता है कि प्रगति रैखिक नहीं है - यह चरघातांकी है।
तो, आप क्या सोचते हैं? क्या हम एक नई AI क्रांति के मुहाने पर हैं? या फिर o3 एक लंबी यात्रा का एक और मील का पत्थर है?