paint-brush
एलएलएम के लिए वाक्यविन्यास त्रुटि-मुक्त और सामान्यीकरण योग्य उपकरण का उपयोग: संबंधित कार्यद्वारा@textmodels

एलएलएम के लिए वाक्यविन्यास त्रुटि-मुक्त और सामान्यीकरण योग्य उपकरण का उपयोग: संबंधित कार्य

द्वारा Writings, Papers and Blogs on Text Models2m2024/06/02
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

शोधकर्ताओं ने एलएलएम के लिए एक परिमित-अवस्था मशीन-निर्देशित डिकोडिंग टूलडेक का प्रस्ताव दिया है, जो त्रुटियों को कम करेगा और उपकरण के उपयोग में सुधार करेगा।
featured image - एलएलएम के लिए वाक्यविन्यास त्रुटि-मुक्त और सामान्यीकरण योग्य उपकरण का उपयोग: संबंधित कार्य
Writings, Papers and Blogs on Text Models HackerNoon profile picture
0-item

लेखक:

(1) केक्सुन झांग, यूसी सांता बारबरा और समान योगदान;

(2) हांगकियाओ चेन, नॉर्थवुड हाई स्कूल और समान योगदान;

(3) लेई ली, कार्नेगी मेलन विश्वविद्यालय;

(4) विलियम यांग वांग, यूसी सांता बारबरा।

लिंक की तालिका

2। संबंधित कार्य

भाषा मॉडल को उपकरणों का उपयोग करने के लिए ठीक करना। भाषा मॉडल को ऐसे उपकरणों का उपयोग करने के लिए ठीक किया जा सकता है, जिनमें डेटा के साथ इंटरलीविंग टेक्स्ट और उपकरण का उपयोग शामिल है। पहले के अध्ययनों में भाषा मॉडल को ठीक करके रिट्रीवल मॉड्यूल (बोर्गेउड एट अल., 2022; गुउ एट अल., 2020) या सर्च इंजन (नाकानो एट अल., 2021) जैसे एकल उपकरण का उपयोग करने के लिए कहा गया है। उपकरण-संवर्धित भाषा मॉडल में हाल की प्रगति जो कई उपकरणों का उपयोग करती है (शिक एट अल., 2023; पेरिसी एट अल., 2022) भी QA मॉडल, अनुवाद मॉडल, कैलकुलेटर और खोज इंजन सहित उपकरणों का उपयोग करने के लिए भाषा मॉडल को ठीक करती है। ToolkenGPT (हाओ एट अल., 2023) उपकरणों का प्रतिनिधित्व करने के लिए कई विशेष टोकन का उपयोग करने का प्रस्ताव करता है और केवल टोकन के एम्बेडिंग को ट्यून करता है ताकि नए उपकरण को अपनाना अधिक कुशल हो सके। हालाँकि, उपकरण के उपयोग के लिए फ़ाइन-ट्यूनिंग दृष्टिकोणों को अभी भी नए डेटा और अतिरिक्त फ़ाइन-ट्यूनिंग की आवश्यकता होती है ताकि मॉडल को नए उपकरणों के अनुकूल बनाया जा सके। हम तालिका 1 में परिमित-अवस्था डिकोडिंग और पिछले दो प्रतिमानों के बीच अंतर सूचीबद्ध करते हैं।


उपकरण उपयोग के लिए संदर्भ में सीखना। भाषा मॉडल संदर्भ में उदाहरणों (ब्राउन एट अल., 2020) से सीख सकते हैं और निर्देशों का पालन कर सकते हैं (ओयांग एट अल., 2022)। इससे प्रॉम्प्ट में उपकरणों के विवरण को आसानी से डालना और भाषा मॉडल से उनका उपयोग करने के लिए कहना संभव हो जाता है। हाल के कार्यों ने समस्याओं को हल करने के लिए न्यूरल मॉडल (शेन एट अल., 2023), RESTful API (किन एट अल., 2023; सॉन्ग एट अल., 2023), प्रोग्राम इंटरप्रिटर्स (चेन एट अल., 2022; गाओ एट अल., 2023) और कई अन्य उपकरणों का उपयोग करने के लिए इस संभावना का उपयोग किया है। संदर्भ में सीखने के लिए नए उपकरणों का उपयोग करने के लिए अतिरिक्त मॉडल ट्यूनिंग की आवश्यकता नहीं होती है। हालाँकि, नए उपकरणों का विवरण और दस्तावेज़ीकरण अभी भी प्रॉम्प्ट में होना चाहिए, जो गणना लागत को बढ़ाता है और मॉडल के लिए कार्य के बारे में वास्तव में तर्क करने के लिए संदर्भ बजट को सीमित करता है।


विवश डिकोडिंग और परिमित-स्थिति मशीनें। पिछली विवश डिकोडिंग विधियाँ मुख्य रूप से शाब्दिक बाधाओं पर ध्यान केंद्रित करती हैं (एंडरसन एट अल., 2017)। वे परिमित-स्थिति मशीनों (एंडरसन एट अल., 2017) के साथ शाब्दिक रूप से विवश डिकोडिंग के बड़े खोज स्थान को कम करते हैं, समान उम्मीदवारों (होकैम्प और लियू, 2017) को एक साथ समूहीकृत करते हैं, और बेहतर खोज एल्गोरिदम (मियाओ एट अल., 2019; लू एट अल., 2021; 2022) का उपयोग करते हैं। हालाँकि, शाब्दिक बाधाएँ टूल कॉल को विनियमित करने के लिए पर्याप्त अभिव्यंजक नहीं हैं। जबकि परिमित-स्थिति मशीनों को प्राकृतिक भाषा में नरम बाधाओं से निपटने के लिए भारित और संभाव्य होना चाहिए (आइसनर, 2002; रस्तोगी एट अल., 2016), वाक्यविन्यास टूल कॉल के लिए बाधाएँ कठोर बाधाएँ हैं जो FSM के लिए बहुत आसान हैं। इसलिए, हम एक वैध टूल कॉल की वाक्यविन्यास संबंधी बाध्यताओं को पूरा करने के लिए TOOLDEC का प्रस्ताव करते हैं।


यह पेपर CC 4.0 DEED लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।