OpenAI द्वारा 30 नवंबर, 2022 को लॉन्च किया गया, ChatGPT ने पहले से ही 1 मिलियन उपयोगकर्ताओं को सबसे तेजी से बढ़ते तकनीकी प्लेटफॉर्म के रूप में एकत्रित कर लिया है, जो अगले स्तर के जनरेटिव AI के साथ इंटरनेट पर आग लगा रहा है जो इंजीनियरों, भाषाविदों, विपणक, छात्रों की कल्पनाओं को आकर्षित कर रहा है। , और अधिक।
इसके मूल में, ChatGPT दुनिया का सबसे उन्नत सामान्य-उद्देश्य वाला चैटबॉट है, जो बड़े भाषा मॉडल (LLM) GPT-3.5 से उत्पन्न हुआ है। यह InstructGPT के एक पुनरावृत्ति का प्रतिनिधित्व करता है, जो जनवरी 2022 में लाइव हुआ और संवादात्मक AI स्पेस में समान अभी तक छोटी तरंगें बनाईं। GPT-3.5, GPT-3 मॉडल का एक रूपांतर है, जिसे 2021 के अंत में 175 बिलियन मापदंडों के अनुसार चयनित अंशों और कोडों के विस्तृत मिश्रण पर प्रशिक्षित किया गया है। अब तक के परिणाम प्रभावशाली से परे रहे हैं।
चैटजीपीटी सॉनेट्स लिखने के लिए शेक्सपियर की शक्ति का उपयोग कर सकता है,
इसे लेखक के ब्लॉक में एआई मलबे की गेंद और नए खोज इंजन असाधारण के रूप में बताया गया है। इसमें कोई संदेह नहीं है कि सामग्री उत्पन्न करने के लिए चैटजीपीटी की आंख मारने की क्षमता, और संदर्भ प्रतिधारण जो बातचीत के दौरान सामने आती है, बेजोड़ है। लेकिन, जबकि उपभोक्ता-सामना करने वाले उपयोग के मामले स्पष्ट हैं, OpenAI के नवीनतम चमत्कार के साथ वांछित होने के लिए बहुत कुछ है क्योंकि यह उद्यमों और B2B, या B2B2C, वास्तविक दुनिया के कार्यान्वयन से संबंधित है।
चैटजीपीटी (और/या कोई अन्य एलएलएम-आधारित चैटबॉट) नुस्खा में एक प्रमुख घटक है, न कि पूरी डिश। जबकि प्राकृतिक भाषा समझ (एनएलयू) में बाधाओं को निश्चित रूप से तोड़ा गया है, चैटजीपीटी की संवादी शक्ति केवल इतनी दूर तक जा सकती है। सांख्यिकीय रूप से सटीक पर्याप्त नहीं है - स्वास्थ्य सेवा और सरकार जैसे संवेदनशील कार्यक्षेत्रों के लिए सही के करीब, उद्यम कार्यान्वयन के लिए एक गैर-स्टार्टर है।
व्यावसायिक उपयोग के मामलों के लिए नुस्खा का दूसरा आधा, गतिशील व्यावसायिक तर्क (उनकी हमेशा बदलती आंतरिक और बाहरी प्रक्रियाओं) के साथ विशेष संगठनात्मक ज्ञान (उनके मालिकाना डेटा) तक वास्तविक समय की पहुंच से मेल खाना होगा, ताकि उनके उपयोगकर्ताओं को नेविगेट करते समय सटीकता सुनिश्चित की जा सके। उनके लक्ष्यों को प्राप्त करने के लिए। मिश्रण में एक अतिरिक्त प्रमुख घटक के बिना, चैटजीपीटी या किसी अन्य एलएलएम-आधारित चैटबॉट का उपयोग करना एक विकल्प नहीं है - इसलिए इस बीच, संगठनों से अपेक्षा करें कि वे मेनू पर विभिन्न उद्यम समाधानों का आदेश दें।
दर्ज करें: मौजूदा संवादी एआई कंपनियां।
मिशेलिन स्टार शेफ अपने खुद के टमाटर नहीं उगाते हैं, लेकिन उन्हें यकीन है कि नर्क को पता है कि आसपास सबसे अच्छा कैसे खोजना है - इसी तरह अधिकांश संवादात्मक एआई समाधान एसटीटी (स्पीच-टू-टेक्स्ट) और टीटीएस (टेक्स्ट) के साथ पहिया को फिर से नहीं बनाते हैं। -टू-स्पीच), इसके बजाय Google या Microsoft से पहले से मौजूद सबसे मजबूत स्रोत का चयन करने के बजाय, संवादात्मक AI कंपनियां GPT-3.5 को एम्बेड करेंगी, जो अब दुनिया में शीर्ष बड़े भाषा मॉडल हैं, उनके संवादी स्टैक के भीतर।
जो लोग अपने ग्राहकों के लिए सुरक्षा और सटीकता को प्राथमिकता देते हुए इसे निर्बाध रूप से करेंगे- वे जनरेटिव और संवादात्मक एआई के नए युग में विजेता के रूप में उभरेंगे। यहीं पर उद्यमों के लिए असली जादू होता है।
आइए जानें कि वर्तमान संवादी AI समाधानों और ChatGPT के बीच सह-अस्तित्व कैसा दिखता है। सबसे पहले, हम एक सफल परिनियोजन के लिए व्यवसाय-श्रेणी के संवादात्मक AI की आवश्यकता को कवर करेंगे। उद्यमों और अन्य "सूचना-भारी" संगठनों के लिए व्यवहार्य होने के लिए, संवादात्मक एआई को 5 प्रमुख बॉक्सों की जाँच करने की आवश्यकता है:
रीयल-टाइम कस्टम नॉलेज - डॉक्टरों के साथ अपॉइंटमेंट शेड्यूल करने, या तकनीकी उत्पाद जानकारी खोजने सहित डेटा-संचालित निर्णय लेने के लिए, उपयोगकर्ता तुरंत अद्यतन और सटीक व्यवसाय और उत्पाद जानकारी की मांग करते हैं, जो आमतौर पर एपीआई के माध्यम से कैप्चर की जाती है। वे डेटासेट और व्यावसायिक नियम प्रत्येक व्यक्तिगत संगठन के लिए स्वाभाविक रूप से अद्वितीय हैं, और "सामान्य ज्ञान" ज्ञान को समझने से परे जैसे कि चैटजीपीटी इतना प्रभावी ढंग से करता है, उनके गतिशील ऑन्कोलॉजी को आदर्श रूप से एक ज्ञान ग्राफ द्वारा अवशोषित करने की आवश्यकता होगी। चैटजीपीटी के लिए, उस डोमेन-विशिष्ट और यहां तक कि संगठन-विशिष्ट जानकारी तक पहुंच न के बराबर है - और जो जानकारी यह दे सकती है, जैसा कि पहले उल्लेख किया गया है, एक बड़े भाषा मॉडल पर आधारित है जिसे 2021 से मापदंडों पर प्रशिक्षित किया गया था, जो अक्सर प्रदान करता है। डेटा सबसे अच्छा अप्रासंगिक है। डिजिटल सेवाओं के मिनट-टू-मिनट वितरण के लिए संगठन के ज्ञान आधार को ऑटो-अपडेट करना, केवल कुछ चुनिंदा उद्यम संवादी एआई कंपनियों में पाया जाने वाला कौशल है।
उन संगठनों के लिए जिन्होंने अपने परिनियोजन के दायरे में ग्राहक सेवा उपयोग मामलों और वैयक्तिकरण को प्राथमिकता दी है, जो लापता ज्ञान की एक और परत जोड़ता है - सामान्य डेटा को चल रहे संवादात्मक संदर्भ और व्यक्तिगत ग्राहक वरीयताओं दोनों के साथ आसानी से एकीकृत करने की आवश्यकता है, मान लीजिए कि एक सीआरएम जैसे सेल्सफोर्स। पूरी तरह से एलएलएम की सामान्य और पुरानी जानकारी का उपयोग करते समय, यह एक अच्छी तरह से प्रलेखित बाधा है, क्योंकि कार्रवाई में एआई सहायक सीखने में सक्षम नहीं होंगे या नए डेटा बिंदुओं और विकसित परिदृश्यों का सामना करने में सक्षम नहीं होंगे।
स्पष्टीकरण - 2021 में वापस, हमने GPT-3 को कवर किया, और अधिकांश तंत्रिका नेटवर्क के साथ, यह एक ब्लैक बॉक्स का प्रतिनिधित्व करता था जिसके साथ वास्तविक संवादी आउटपुट के पीछे के तर्क को समझना मुश्किल होगा। GPT-3.5—जिस पर ChatGPT आधारित है—दृश्यता की समान कमी को वहन करता है। निश्चित रूप से, चैटजीपीटी का निर्माण करने वाले मानव इनपुट (डेटा जो अंतर्ग्रहण किया जाता है) को नियंत्रित कर सकते हैं और उत्पादित आउटपुट को देख सकते हैं, लेकिन दुर्भाग्य से, हम यह नहीं समझ सकते हैं कि उन आउटपुट को बनाने के लिए विभिन्न चर और मापदंडों को कैसे जोड़ा जा रहा है।
ChatGPT, और जिस LLM पर यह आधारित है, वह कई जटिल प्रश्नों का सही उत्तर देने की अपनी क्षमता के कारण प्रभावशाली है, लेकिन यह पुराने डेटा और पक्षपाती उत्तर प्रदान करने की क्षमता के कारण एक टन गलत प्रतिक्रिया भी उत्पन्न करता है। जब सहायक विफल हो जाता है, तो कोई जवाबदेही नहीं होती है - समस्या को डीबग करने या गलत आउटपुट के स्रोत का पता लगाने/पता लगाने का कोई तरीका नहीं है। आम आदमी की शर्तों में, चैटजीपीटी नहीं जानता कि यह क्या नहीं जानता है, और इसके अतिरिक्त, उपयोगकर्ताओं द्वारा प्रस्तावित अनुमानों पर विवाद नहीं कर सकता है।
एक प्रमुख कारण व्यवसायों ने ज्ञान ग्राफ प्रौद्योगिकियों की खोज शुरू कर दी है, डेटा पारदर्शिता और व्याख्यात्मकता की कमी से बचने के लिए। कोई भी उपयोगकर्ता-सामना करने वाला इंटरफ़ेस जिसे पुनरावृत्त और संशोधित नहीं किया जा सकता है, व्यावसायिक वातावरण में अस्थिर या स्केलेबल है, खासकर जब उन उद्योगों को अत्यधिक संवेदनशील माना जाता है।
यह एक और पहलू है जिसमें मौजूदा संवादात्मक एआई समाधान एलएलएम से बेहतर हैं। यहां तक कि बॉटम-शेल्फ DIY चैटबॉट अपने उपयोगकर्ताओं को आवश्यकतानुसार अपने संवादी प्रवाह को बदलने और सुधारने की अनुमति देते हैं। अधिक परिष्कृत संवादी एआई इंटरफेस के मामले में, उपयोगकर्ताओं के पास न केवल त्रुटि का एक स्पष्ट स्नैपशॉट होता है बल्कि समस्या को तुरंत ट्रैक, निदान और उपाय कर सकता है।
सुरक्षा और पूर्वानुमेयता - विशेष रूप से डेटा-संवेदनशील उद्योगों में, जैसे कि स्वास्थ्य सेवा, सरकार और बैंकिंग, सामान्य और जनरेटिव प्रतिक्रियाएँ देनदारियों और जोखिमों को प्रस्तुत करती हैं जो वर्तमान में हमारे लिए अज्ञात हैं। स्वास्थ्य सेवा में EMRs (इलेक्ट्रॉनिक मेडिकल रिकॉर्ड्स) जैसे अत्यधिक संवेदनशील डेटा को अंतर्ग्रहण करने से ऐसे परिणाम उत्पन्न हो सकते हैं जो उद्यम में ग्राहकों के विश्वास को खतरे में डालते हैं, और संपूर्ण समाधान की वैधता को प्रश्न में डाल देते हैं।
नीचे सरल गणित का उदाहरण लें। 2 एक प्राकृतिक संख्या और पूर्णांक है, है ना? यदि आप अन्यथा सोचने के लिए ChatGPT को पक्षपाती नहीं करते हैं:
यह उदाहरण दर्शाता है कि:
अब अधिक जटिल और संवेदनशील उपयोग के मामलों को लें, जैसे कि लक्षण की जाँच करना या रोगी पोर्टल से पूछताछ करना, जिसे केवल संयोग पर नहीं छोड़ा जा सकता है। वर्तमान में, सुरक्षा आश्वासन और व्यक्तिगत पहचान योग्य जानकारी (PII) से जुड़े मामले जो HIPAA अनुपालन के अधीन हैं, ChatGPT के लिए एक स्टैंड-अलोन समाधान के रूप में वर्षों दूर हैं, जब तक कि यह मौजूदा संवादात्मक AI प्लेटफॉर्म में पूर्व-निर्मित प्रोटोकॉल द्वारा सुरक्षित नहीं है।
मूल रूप से वेबसाइट के माध्यम से चैट से कॉल सेंटर के माध्यम से आवाज तक विस्तार करते समय, हमें बड़े बदलावों से गुजरना पड़ा - लंबाई का अनुकूलन, संदर्भ जोड़ना, और यह सुनिश्चित करना कि हम उद्देश्य के लिए समय को अधिकतम रूप से कम कर दें, या समय को महत्व दें। यहां इसका एक उदाहरण दिया गया है कि जब आप एडजस्ट नहीं करते हैं तो क्या होता है:
हालांकि पाठ्य रूप से यह लंबा नहीं लग सकता है, ऊपर का स्निपेट वास्तव में 45-सेकंड का मोनोलॉग है जब इसे शुद्ध एआई वॉयस जेनरेशन में स्थानांतरित किया जाता है। कॉल सेंटरों के माध्यम से यह खराब UX है, और पिंग-पोंग-जैसी, मानव-केंद्रित संवादात्मक AI से बहुत दूर है, जिसका मतलब है कि उद्योग की ओर पलायन करना है।
उदाहरण के लिए, जब कोई मरीज डॉक्टर की नियुक्ति बुक करने के लिए कहता है, तो अगले चरण के बिना विशेष रूप से यह बताना होगा कि नियुक्ति मौजूद है। शीर्ष-प्रदर्शन करने वाले उद्यमों के उपभोक्ताओं को वास्तव में क्या चाहिए, और अब उम्मीद करते हैं, उनके उद्देश्यों को शुरू से अंत तक पूरा करने के लिए सक्रिय कार्रवाई की जानी चाहिए, यानी आगे बढ़ें और डॉक्टर की नियुक्ति निर्धारित करें, जिसमें कई डेटाबेस या एपीआई को अपडेट करना शामिल हो सकता है।
एकीकरण, विशेष रूप से वे जो ऊर्ध्वाधर-विशिष्ट हैं, जब जटिल कार्रवाइयों पर विचार किया जाता है, तो वे तेजी से महत्वपूर्ण हो जाते हैं - उनके बिना, चैटजीपीटी एक उद्यम स्तर पर सही स्वचालन करने में असमर्थ है।
संदर्भ लोच - चैटजीपीटी की संदर्भ रखने की क्षमता, विशेष रूप से उच्चारणों के लंबे अनुक्रमों में, और पूरे मानव-एस्क्यू वार्तालाप को बनाए रखना एक असाधारण उपलब्धि है।
संवादात्मक प्रवाह और पूर्वनिर्धारित इरादों की कठोरता के कारण विशिष्ट चाबोट और आवाज सहायकों को तोड़ने के लिए जाना जाता है; ChatGPT के साथ, बातचीत के दौरान कोई संदर्भ नहीं खोता है, जिसका अर्थ है कि ग्राहक, जो निश्चित रूप से मानवीय त्रुटि के लिए प्रवण हैं, दिशाओं को बदल सकते हैं, इनपुट बदल सकते हैं, रीफ़्रेज़ कर सकते हैं, और बहुत कुछ, बिना एक बीट खोए। संदर्भ को शामिल करना, और बातचीत के पिछले हिस्सों को संदर्भित करना, न केवल बेहतर ग्राहक अनुभव के लिए, बल्कि कर्मचारी के उपयोग के मामलों के लिए उन्नत सहायता के लिए भी एक वरदान बन जाएगा।
डेटा वर्चस्व - चैटजीपीटी गैर-प्रतीकवादियों के लिए एक प्रमुख कदम का प्रतिनिधित्व करता है (देखें:
उदाहरण के लिए, समुद्र की पर्याप्त तस्वीरें देखें और एआई आत्मविश्वास से यह निष्कर्ष निकाल सकता है कि यह नीला है। डेटा की विशाल मात्रा उद्यमों को मशीन लर्निंग (एमएल) के माध्यम से अपने स्वयं के मॉडल के प्रशिक्षण की धीमी और महंगी प्रक्रिया को छोड़ने की अनुमति देती है, और अपने स्वयं के प्रशिक्षण डेटा की सीमाओं से परे जाती है। प्रतीकवादी (देखें:
संवादात्मक अनुभव को बेहतर बनाने के लिए चैटजीपीटी के तत्वों का संयोजन, एंटरप्राइज़ डेटा पर चलने वाले अधिक नियंत्रित, और सुरक्षा-भारी इंजन का चयन करते हुए, आगे बढ़ने का अंतिम मार्ग होगा क्योंकि हम संवादात्मक और जनरेटिव एआई की इस अगली लहर में प्रवेश करते हैं। अप-टू-डेट होने पर, विशेष ज्ञान दुनिया के सबसे शक्तिशाली बड़े भाषा मॉडल के साथ समेकित रूप से जुड़ सकता है, संवादात्मक स्वचालन की संभावनाएं वास्तव में अनंत हैं।
यहाँ भी प्रकाशित हुआ।