लेखक:  (1) केक्सुन झांग, यूसी सांता बारबरा और समान योगदान;  (2) हांगकियाओ चेन, नॉर्थवुड हाई स्कूल और समान योगदान;  (3) लेई ली, कार्नेगी मेलन विश्वविद्यालय;  (4) विलियम यांग वांग, यूसी सांता बारबरा।  लिंक की तालिका   सार और परिचय   संबंधित कार्य   ToolDec: परिमित-स्थिति डिकोडिंग के माध्यम से LLM टूल का उपयोग   प्रयोग: ToolDec वाक्यविन्यास त्रुटियों को समाप्त करता है   प्रयोग: ToolDec सामान्यीकृत उपकरण चयन को सक्षम करता है   निष्कर्ष और संदर्भ   अनुबंध  अमूर्त  बड़े भाषा मॉडल (LLM) ने जटिल समस्याओं को हल करने के लिए बाहरी उपकरणों का उपयोग करने में आशाजनक क्षमताएँ दिखाई हैं। हालाँकि, मौजूदा दृष्टिकोणों में या तो उपकरण प्रदर्शनों पर फ़ाइन-ट्यूनिंग शामिल है, जो अतिरिक्त प्रशिक्षण के बिना नए उपकरणों के लिए सामान्यीकृत नहीं है, या संदर्भ में उपकरण प्रलेखन प्रदान करना, उपकरणों की संख्या को सीमित करना। दोनों दृष्टिकोण अक्सर वाक्यविन्यास की दृष्टि से अमान्य उपकरण कॉल उत्पन्न करते हैं। इस पत्र में, हम TOOLDEC का प्रस्ताव करते हैं, जो उपकरण-संवर्धित LLM के लिए एक परिमित-स्थिति मशीन-निर्देशित डिकोडिंग एल्गोरिदम है। TOOLDEC मान्य उपकरण नामों और प्रकार-अनुरूप तर्कों को सुनिश्चित करके किसी भी उपकरण संवर्धित LLM के लिए उपकरण-संबंधी त्रुटियों को समाप्त करता है। इसके अलावा, TOOLDEC LLM को केवल उनके नामों में निहित जानकारी का उपयोग करके प्रभावी ढंग से उपकरण चुनने में सक्षम बनाता है, जिसमें फ़ाइन-ट्यूनिंग या संदर्भ में प्रलेखन की कोई आवश्यकता नहीं होती है। हमने गणित फ़ंक्शन, ज्ञान ग्राफ़ संबंध और जटिल वास्तविक दुनिया RESTful API जैसे उपकरणों से जुड़े विभिन्न कार्यों पर कई पिछली विधियों और उनके TOOLDEC-संवर्धित संस्करणों का मूल्यांकन किया। हमारे प्रयोगों से पता चलता है कि TOOLDEC वाक्यविन्यास संबंधी त्रुटियों को शून्य तक कम करता है, जिसके परिणामस्वरूप काफी बेहतर प्रदर्शन और 2x तक की गति प्राप्त होती है। हम यह भी दिखाते हैं कि TOOLDEC अनदेखे उपकरणों पर बेहतर सामान्यीकरण प्रदर्शन प्राप्त करता है, जो बेसलाइन की तुलना में 8x तक बेहतर प्रदर्शन करता है [1]  1 परिचय  बाहरी उपकरणों (मियालोन एट अल., 2023) के साथ बड़े भाषा मॉडल (एलएलएम) को संवर्धित करना उन्हें जटिल समस्याओं को हल करने में सक्षम बनाता है। वर्तमान एलएलएम रिट्रीवर्स (शेन एट अल., 2023; गुप्ता और केंभवी, 2022; शिक एट अल., 2023), रेस्टफुल एपीआई (किन एट अल., 2023; सॉन्ग एट अल., 2023), प्रोग्राम इंटरप्रिटर्स (चेन एट अल., 2022; गाओ एट अल., 2023) और कई अन्य उपकरणों का उपयोग कर सकते हैं। उपकरण-संवर्धित एलएलएम का प्रदर्शन तीन प्रमुख निर्णय लेने की इसकी क्षमता पर निर्भर करता है—कब उपकरण का उपयोग करना है, किस उपकरण का उपयोग करना है और उपकरण को कैसे लागू करना है। मौजूदा दृष्टिकोण फ़ाइन-ट्यूनिंग या इन-कॉन्टेक्स्ट लर्निंग के माध्यम से ये निर्णय लेना सीखते हैं।  हालाँकि, ये दृष्टिकोण अभी भी गलत टूल कॉल उत्पन्न करते हैं। उदाहरण के लिए, इन-कॉन्टेक्स्ट लर्निंग आसानी से गैर-मौजूद टूल नाम उत्पन्न कर सकती है जो टूल इन्वेंट्री में नहीं हैं क्योंकि गैर-मौजूद टूल अगले टोकन के रूप में भी प्रशंसनीय लग सकते हैं (सोंग एट अल., 2023; किन एट अल., 2023)। फाइन-ट्यून्ड मॉडल, हालांकि आमतौर पर टूल को सही नामों से बुलाते हैं, अक्सर सही टूल फ़ंक्शन (हाओ एट अल., 2023) को अमान्य तर्क देते हैं, ठीक वैसे ही जैसे इन-कॉन्टेक्स्ट लर्निंग करता है। इसके अलावा, पिछले दृष्टिकोण अनदेखे टूल को अच्छी तरह से सामान्यीकृत नहीं करते हैं। फ़ाइन-ट्यूनिंग दृष्टिकोणों को नए टूल को अपनाने के लिए अतिरिक्त प्रशिक्षण डेटा और आगे फ़ाइन-ट्यूनिंग की आवश्यकता होती है। इन-कॉन्टेक्स्ट लर्निंग दृष्टिकोणों को प्रॉम्प्ट में टूल डॉक्यूमेंटेशन की आवश्यकता होती है।  इन मुद्दों को संबोधित करने के लिए, हम TOOLDEC का प्रस्ताव करते हैं, जो एक परिमित-स्थिति मशीन (FSM) द्वारा निर्देशित एक डिकोडिंग एल्गोरिदम है, ताकि यह सुनिश्चित किया जा सके कि LLM उपकरण को ठीक से लागू करें। हमारी मुख्य अंतर्दृष्टि LLM डिकोडिंग के दौरान स्थितियों को स्पष्ट रूप से दर्शाना है। प्रत्येक स्थिति उपकरण नामों और उपकरण तर्कों के अनुरूप टोकन के एक वैध सेट से जुड़ी होती है। डिकोडिंग की प्रगति के साथ TOOLDEC एक स्थिति से दूसरी स्थिति में संक्रमण करता है। प्रत्येक डिकोडिंग चरण में, TOOLDEC भाषा मॉडल की संपूर्ण शब्दावली से नमूना नहीं लेता है। इसके बजाय, यह वर्तमान स्थिति द्वारा अनुमत टोकन के एक सबसेट से नमूना लेता है। TOOLDEC को मार्गदर्शन देने वाला FSM उपकरण प्रलेखन और API हस्ताक्षर से निर्मित होता है ताकि मशीन उपकरण कॉल के व्याकरण का सटीक रूप से प्रतिनिधित्व कर सके। इस तरह, TOOLDEC हमेशा उत्पन्न करने में सक्षम है   वाक्यविन्यास की दृष्टि से सही टूल कॉल। चित्र 1 दर्शाता है कि TOOLDEC द्वारा संवर्धित LLM सटीक तर्कों ("3.14" और "123") के साथ सही फ़ंक्शन कॉल गुणा करने में सक्षम है और इसलिए, यह टूल द्वारा लौटाए गए सही परिणाम प्राप्त करता है। TOOLDEC और अन्य टूल LLM की तुलना करने वाले अधिक उदाहरण परिशिष्ट A.3 में पाए जा सकते हैं।  इसके अलावा, TOOLDEC उन नए औजारों को सामान्यीकृत करता है जो पहले कभी अधिक कुशलता से सामने नहीं आए। पिछले तरीकों के विपरीत, जिनमें नए औजारों के लिए फाइन-ट्यूनिंग या संदर्भ-में-वर्णन की आवश्यकता होती है, TOOLDEC स्वचालित रूप से एक औजार के API हस्ताक्षर (इसका नाम और तर्क प्रकार) से एक परिमित-स्थिति मशीन का निर्माण करता है और इसे मौजूदा FSM में जोड़ता है। TOOLDEC तब फाइन-ट्यूनिंग या संदर्भ-में-प्रदर्शन के बिना नए औजारों को कॉल करने में सक्षम होता है। जबकि पूर्व-प्रशिक्षित भाषा मॉडल संकेत दिए जाने पर औजारों के नाम उत्पन्न कर सकते हैं, वे अक्सर ऐसे संभावित औजारों के नामों की कल्पना करते हैं जो सूची में नहीं होते हैं। TOOLDEC ऐसा नहीं करता है। चित्र 1 में, परिदृश्य के लिए उत्पाद और गुणा दोनों ही संभावित लगते हैं, लेकिन केवल गुणा ही एक दिया गया औजार है। चूंकि TOOLDEC केवल विद्यमान औजारों को कॉल करता है, इसलिए यह एक संभावित लेकिन गैर-मौजूद औजार की कल्पना नहीं करेगा और सही औजार खोजने के लिए औजारों के नामों पर निर्भर कर सकता है।  इस पेपर के योगदान को संक्षेप में इस प्रकार बताया जा सकता है:  • हम TOOLDEC का प्रस्ताव करते हैं, जो LLM को उपकरणों का उचित उपयोग करने में सक्षम बनाने के लिए एक परिमित-स्थिति डिकोडिंग एल्गोरिदम है। TOOLDEC के दो लाभ हैं: इसके द्वारा उत्पन्न उपकरण कॉल वाक्यविन्यास की दृष्टि से सही होने की गारंटी है और यह अदृश्य उपकरणों को कुशलतापूर्वक सामान्यीकृत करता है।  • हम विभिन्न डोमेन से चार विविध डेटासेट पर पहले की मजबूत बेसलाइन की तुलना में TOOLDEC के बेहतर प्रदर्शन को अनुभवजन्य रूप से सत्यापित करते हैं। हमारे व्यापक प्रयोगों से पता चलता है कि TOOLDEC सभी वाक्यविन्यास त्रुटियों और भ्रामक टूल नामों को समाप्त करता है, जिसके परिणामस्वरूप बेहतर सटीकता और 50% कम अनुमान समय होता है। हमारे परिणाम यह भी संकेत देते हैं कि TOOLDEC 9 अदृश्य उपकरणों के साथ गणितीय तर्क पर बेसलाइन की तुलना में 8 गुना से अधिक बेहतर है और 204 अदृश्य उपकरणों के साथ ज्ञान प्रश्न उत्तर देने की तुलना में 7 गुना बेहतर है।  यह पेपर CC 4.0 DEED लाइसेंस के अंतर्गत   है। arxiv पर उपलब्ध  [1] हम अपना कोड और डेटा https://github.com/chenhongqiao/tooldec पर जारी करते हैं।

Part of HackerNoon's growing list of open-source research papers, promoting free access to academic material.

AI Models on HackerNoon

यह ऑडियो कहानी की मूल भाषा में निर्मित है!

एलएलएम के लिए वाक्यविन्यास त्रुटि-रहित और सामान्यीकरण योग्य उपकरण का उपयोग: सार और परिचय

About Author

टिप्पणियाँ

लेबल

इस लेख में चित्रित किया गया था

Related Stories

हैकरनून कोडेड: शीर्ष 10 देश जहां हैकरनून सबसे अधिक सक्रिय है

फ़ोरम से फ़ीड तक: सोशल मीडिया एल्गोरिदम डिजिटल इंटरैक्शन को कैसे आकार देते हैं

HackerNoon लेखन प्रतियोगिता जीतना चाहते हैं? #crypto-api प्रतियोगिता के विजेताओं की सलाह यहाँ पढ़ें

Paint us Red and Call us Santa! Our Devs Just Gifted You a Sleigh of New Features!

हैकरनून कोडेड: शीर्ष 10 देश जहां हैकरनून सबसे अधिक सक्रिय है

फ़ोरम से फ़ीड तक: सोशल मीडिया एल्गोरिदम डिजिटल इंटरैक्शन को कैसे आकार देते हैं

HackerNoon लेखन प्रतियोगिता जीतना चाहते हैं? #crypto-api प्रतियोगिता के विजेताओं की सलाह यहाँ पढ़ें

Paint us Red and Call us Santa! Our Devs Just Gifted You a Sleigh of New Features!

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps