paint-brush
एलएलएम के लिए वाक्यविन्यास त्रुटि-रहित और सामान्यीकरण योग्य उपकरण का उपयोग: सार और परिचयद्वारा@textmodels
127 रीडिंग

एलएलएम के लिए वाक्यविन्यास त्रुटि-रहित और सामान्यीकरण योग्य उपकरण का उपयोग: सार और परिचय

द्वारा Writings, Papers and Blogs on Text Models4m2024/06/02
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

शोधकर्ताओं ने एलएलएम के लिए एक परिमित-अवस्था मशीन-निर्देशित डिकोडिंग टूलडेक का प्रस्ताव दिया है, जो त्रुटियों को कम करेगा और उपकरण के उपयोग में सुधार करेगा।
featured image - एलएलएम के लिए वाक्यविन्यास त्रुटि-रहित और सामान्यीकरण योग्य उपकरण का उपयोग: सार और परिचय
Writings, Papers and Blogs on Text Models HackerNoon profile picture
0-item

लेखक:

(1) केक्सुन झांग, यूसी सांता बारबरा और समान योगदान;

(2) हांगकियाओ चेन, नॉर्थवुड हाई स्कूल और समान योगदान;

(3) लेई ली, कार्नेगी मेलन विश्वविद्यालय;

(4) विलियम यांग वांग, यूसी सांता बारबरा।

लिंक की तालिका

अमूर्त

बड़े भाषा मॉडल (LLM) ने जटिल समस्याओं को हल करने के लिए बाहरी उपकरणों का उपयोग करने में आशाजनक क्षमताएँ दिखाई हैं। हालाँकि, मौजूदा दृष्टिकोणों में या तो उपकरण प्रदर्शनों पर फ़ाइन-ट्यूनिंग शामिल है, जो अतिरिक्त प्रशिक्षण के बिना नए उपकरणों के लिए सामान्यीकृत नहीं है, या संदर्भ में उपकरण प्रलेखन प्रदान करना, उपकरणों की संख्या को सीमित करना। दोनों दृष्टिकोण अक्सर वाक्यविन्यास की दृष्टि से अमान्य उपकरण कॉल उत्पन्न करते हैं। इस पत्र में, हम TOOLDEC का प्रस्ताव करते हैं, जो उपकरण-संवर्धित LLM के लिए एक परिमित-स्थिति मशीन-निर्देशित डिकोडिंग एल्गोरिदम है। TOOLDEC मान्य उपकरण नामों और प्रकार-अनुरूप तर्कों को सुनिश्चित करके किसी भी उपकरण संवर्धित LLM के लिए उपकरण-संबंधी त्रुटियों को समाप्त करता है। इसके अलावा, TOOLDEC LLM को केवल उनके नामों में निहित जानकारी का उपयोग करके प्रभावी ढंग से उपकरण चुनने में सक्षम बनाता है, जिसमें फ़ाइन-ट्यूनिंग या संदर्भ में प्रलेखन की कोई आवश्यकता नहीं होती है। हमने गणित फ़ंक्शन, ज्ञान ग्राफ़ संबंध और जटिल वास्तविक दुनिया RESTful API जैसे उपकरणों से जुड़े विभिन्न कार्यों पर कई पिछली विधियों और उनके TOOLDEC-संवर्धित संस्करणों का मूल्यांकन किया। हमारे प्रयोगों से पता चलता है कि TOOLDEC वाक्यविन्यास संबंधी त्रुटियों को शून्य तक कम करता है, जिसके परिणामस्वरूप काफी बेहतर प्रदर्शन और 2x तक की गति प्राप्त होती है। हम यह भी दिखाते हैं कि TOOLDEC अनदेखे उपकरणों पर बेहतर सामान्यीकरण प्रदर्शन प्राप्त करता है, जो बेसलाइन की तुलना में 8x तक बेहतर प्रदर्शन करता है [1]

1 परिचय

बाहरी उपकरणों (मियालोन एट अल., 2023) के साथ बड़े भाषा मॉडल (एलएलएम) को संवर्धित करना उन्हें जटिल समस्याओं को हल करने में सक्षम बनाता है। वर्तमान एलएलएम रिट्रीवर्स (शेन एट अल., 2023; गुप्ता और केंभवी, 2022; शिक एट अल., 2023), रेस्टफुल एपीआई (किन एट अल., 2023; सॉन्ग एट अल., 2023), प्रोग्राम इंटरप्रिटर्स (चेन एट अल., 2022; गाओ एट अल., 2023) और कई अन्य उपकरणों का उपयोग कर सकते हैं। उपकरण-संवर्धित एलएलएम का प्रदर्शन तीन प्रमुख निर्णय लेने की इसकी क्षमता पर निर्भर करता है—कब उपकरण का उपयोग करना है, किस उपकरण का उपयोग करना है और उपकरण को कैसे लागू करना है। मौजूदा दृष्टिकोण फ़ाइन-ट्यूनिंग या इन-कॉन्टेक्स्ट लर्निंग के माध्यम से ये निर्णय लेना सीखते हैं।


हालाँकि, ये दृष्टिकोण अभी भी गलत टूल कॉल उत्पन्न करते हैं। उदाहरण के लिए, इन-कॉन्टेक्स्ट लर्निंग आसानी से गैर-मौजूद टूल नाम उत्पन्न कर सकती है जो टूल इन्वेंट्री में नहीं हैं क्योंकि गैर-मौजूद टूल अगले टोकन के रूप में भी प्रशंसनीय लग सकते हैं (सोंग एट अल., 2023; किन एट अल., 2023)। फाइन-ट्यून्ड मॉडल, हालांकि आमतौर पर टूल को सही नामों से बुलाते हैं, अक्सर सही टूल फ़ंक्शन (हाओ एट अल., 2023) को अमान्य तर्क देते हैं, ठीक वैसे ही जैसे इन-कॉन्टेक्स्ट लर्निंग करता है। इसके अलावा, पिछले दृष्टिकोण अनदेखे टूल को अच्छी तरह से सामान्यीकृत नहीं करते हैं। फ़ाइन-ट्यूनिंग दृष्टिकोणों को नए टूल को अपनाने के लिए अतिरिक्त प्रशिक्षण डेटा और आगे फ़ाइन-ट्यूनिंग की आवश्यकता होती है। इन-कॉन्टेक्स्ट लर्निंग दृष्टिकोणों को प्रॉम्प्ट में टूल डॉक्यूमेंटेशन की आवश्यकता होती है।


इन मुद्दों को संबोधित करने के लिए, हम TOOLDEC का प्रस्ताव करते हैं, जो एक परिमित-स्थिति मशीन (FSM) द्वारा निर्देशित एक डिकोडिंग एल्गोरिदम है, ताकि यह सुनिश्चित किया जा सके कि LLM उपकरण को ठीक से लागू करें। हमारी मुख्य अंतर्दृष्टि LLM डिकोडिंग के दौरान स्थितियों को स्पष्ट रूप से दर्शाना है। प्रत्येक स्थिति उपकरण नामों और उपकरण तर्कों के अनुरूप टोकन के एक वैध सेट से जुड़ी होती है। डिकोडिंग की प्रगति के साथ TOOLDEC एक स्थिति से दूसरी स्थिति में संक्रमण करता है। प्रत्येक डिकोडिंग चरण में, TOOLDEC भाषा मॉडल की संपूर्ण शब्दावली से नमूना नहीं लेता है। इसके बजाय, यह वर्तमान स्थिति द्वारा अनुमत टोकन के एक सबसेट से नमूना लेता है। TOOLDEC को मार्गदर्शन देने वाला FSM उपकरण प्रलेखन और API हस्ताक्षर से निर्मित होता है ताकि मशीन उपकरण कॉल के व्याकरण का सटीक रूप से प्रतिनिधित्व कर सके। इस तरह, TOOLDEC हमेशा उत्पन्न करने में सक्षम है


चित्र 1: बाहरी उपकरणों का उपयोग करने वाले LLM. बिना उपकरणों के LLM गुणा नहीं कर सकते, इसलिए वे केवल एक संभावित अगला टोकन उत्पन्न करते हैं। उपकरण-संवर्धित LLM गुणा जैसे बाहरी उपकरणों तक पहुँच सकते हैं, लेकिन वे उत्पाद जैसे गैर-मौजूद उपकरण को कॉल कर सकते हैं और स्ट्रिंग "pi" जैसे अमान्य तर्क पास कर सकते हैं। हमारा प्रस्तावित TOOLDEC हमेशा सिंटैक्स त्रुटियों के बिना टूल कॉल उत्पन्न करता है।


वाक्यविन्यास की दृष्टि से सही टूल कॉल। चित्र 1 दर्शाता है कि TOOLDEC द्वारा संवर्धित LLM सटीक तर्कों ("3.14" और "123") के साथ सही फ़ंक्शन कॉल गुणा करने में सक्षम है और इसलिए, यह टूल द्वारा लौटाए गए सही परिणाम प्राप्त करता है। TOOLDEC और अन्य टूल LLM की तुलना करने वाले अधिक उदाहरण परिशिष्ट A.3 में पाए जा सकते हैं।


इसके अलावा, TOOLDEC उन नए औजारों को सामान्यीकृत करता है जो पहले कभी अधिक कुशलता से सामने नहीं आए। पिछले तरीकों के विपरीत, जिनमें नए औजारों के लिए फाइन-ट्यूनिंग या संदर्भ-में-वर्णन की आवश्यकता होती है, TOOLDEC स्वचालित रूप से एक औजार के API हस्ताक्षर (इसका नाम और तर्क प्रकार) से एक परिमित-स्थिति मशीन का निर्माण करता है और इसे मौजूदा FSM में जोड़ता है। TOOLDEC तब फाइन-ट्यूनिंग या संदर्भ-में-प्रदर्शन के बिना नए औजारों को कॉल करने में सक्षम होता है। जबकि पूर्व-प्रशिक्षित भाषा मॉडल संकेत दिए जाने पर औजारों के नाम उत्पन्न कर सकते हैं, वे अक्सर ऐसे संभावित औजारों के नामों की कल्पना करते हैं जो सूची में नहीं होते हैं। TOOLDEC ऐसा नहीं करता है। चित्र 1 में, परिदृश्य के लिए उत्पाद और गुणा दोनों ही संभावित लगते हैं, लेकिन केवल गुणा ही एक दिया गया औजार है। चूंकि TOOLDEC केवल विद्यमान औजारों को कॉल करता है, इसलिए यह एक संभावित लेकिन गैर-मौजूद औजार की कल्पना नहीं करेगा और सही औजार खोजने के लिए औजारों के नामों पर निर्भर कर सकता है।


इस पेपर के योगदान को संक्षेप में इस प्रकार बताया जा सकता है:


• हम TOOLDEC का प्रस्ताव करते हैं, जो LLM को उपकरणों का उचित उपयोग करने में सक्षम बनाने के लिए एक परिमित-स्थिति डिकोडिंग एल्गोरिदम है। TOOLDEC के दो लाभ हैं: इसके द्वारा उत्पन्न उपकरण कॉल वाक्यविन्यास की दृष्टि से सही होने की गारंटी है और यह अदृश्य उपकरणों को कुशलतापूर्वक सामान्यीकृत करता है।


• हम विभिन्न डोमेन से चार विविध डेटासेट पर पहले की मजबूत बेसलाइन की तुलना में TOOLDEC के बेहतर प्रदर्शन को अनुभवजन्य रूप से सत्यापित करते हैं। हमारे व्यापक प्रयोगों से पता चलता है कि TOOLDEC सभी वाक्यविन्यास त्रुटियों और भ्रामक टूल नामों को समाप्त करता है, जिसके परिणामस्वरूप बेहतर सटीकता और 50% कम अनुमान समय होता है। हमारे परिणाम यह भी संकेत देते हैं कि TOOLDEC 9 अदृश्य उपकरणों के साथ गणितीय तर्क पर बेसलाइन की तुलना में 8 गुना से अधिक बेहतर है और 204 अदृश्य उपकरणों के साथ ज्ञान प्रश्न उत्तर देने की तुलना में 7 गुना बेहतर है।


यह पेपर CC 4.0 DEED लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।


[1] हम अपना कोड और डेटा https://github.com/chenhongqiao/tooldec पर जारी करते हैं।