paint-brush
LLM-এর জন্য সিনট্যাক্স ত্রুটি-মুক্ত এবং সাধারণীকরণযোগ্য টুল ব্যবহার: বিমূর্ত এবং ভূমিকাদ্বারা@textmodels
127 পড়া

LLM-এর জন্য সিনট্যাক্স ত্রুটি-মুক্ত এবং সাধারণীকরণযোগ্য টুল ব্যবহার: বিমূর্ত এবং ভূমিকা

দ্বারা Writings, Papers and Blogs on Text Models4m2024/06/02
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

গবেষকরা TOOLDEC প্রস্তাব করেছেন, এলএলএম-এর জন্য একটি সীমিত-রাষ্ট্রীয় মেশিন-নির্দেশিত ডিকোডিং, ত্রুটি হ্রাস করা এবং সরঞ্জামের ব্যবহার উন্নত করা।
featured image - LLM-এর জন্য সিনট্যাক্স ত্রুটি-মুক্ত এবং সাধারণীকরণযোগ্য টুল ব্যবহার: বিমূর্ত এবং ভূমিকা
Writings, Papers and Blogs on Text Models HackerNoon profile picture
0-item

লেখক:

(1) কেক্সুন ঝাং, ইউসি সান্তা বারবারা এবং সমান অবদান;

(2) হংকিয়াও চেন, নর্থউড হাই স্কুল এবং সমান অবদান;

(3) লেই লি, কার্নেগি মেলন বিশ্ববিদ্যালয়;

(4) উইলিয়াম ইয়াং ওয়াং, ইউসি সান্তা বারবারা।

লিঙ্কের টেবিল

বিমূর্ত

বৃহৎ ভাষা মডেল (LLMs) জটিল সমস্যা সমাধানের জন্য বাহ্যিক সরঞ্জাম ব্যবহারে প্রতিশ্রুতিশীল ক্ষমতা দেখিয়েছে। যাইহোক, বিদ্যমান পন্থাগুলির মধ্যে হয় টুল প্রদর্শনের উপর সূক্ষ্ম-টিউনিং জড়িত, যা অতিরিক্ত প্রশিক্ষণ ছাড়াই নতুন সরঞ্জামগুলিতে সাধারণীকরণ করে না, বা প্রেক্ষাপটে টুল ডকুমেন্টেশন প্রদান করে, সরঞ্জামের সংখ্যা সীমিত করে। উভয় পন্থা প্রায়ই সিনট্যাক্টিকভাবে অবৈধ টুল কল তৈরি করে। এই কাগজে, আমরা টুল-অগমেন্টেড এলএলএম-এর জন্য TOOLDEC, একটি সসীম-স্টেট মেশিন-গাইডেড ডিকোডিং অ্যালগরিদম প্রস্তাব করছি। TOOLDEC বৈধ টুলের নাম এবং টাইপ-সামঞ্জস্যপূর্ণ আর্গুমেন্ট নিশ্চিত করার মাধ্যমে যেকোন টুল অগমেন্টেড এলএলএম-এর জন্য টুল-সম্পর্কিত ত্রুটি দূর করে। তদ্ব্যতীত, TOOLDEC LLM কে কার্যকরীভাবে তাদের নামের মধ্যে থাকা তথ্য ব্যবহার করে টুল নির্বাচন করতে সক্ষম করে, যার কোনো ফাইন-টিউনিং বা ইন-প্রসঙ্গ ডকুমেন্টেশনের প্রয়োজন নেই। আমরা গণিত ফাংশন, জ্ঞান গ্রাফ সম্পর্ক, এবং জটিল বাস্তব-বিশ্ব RESTful API-এর মতো সরঞ্জামগুলি জড়িত বিভিন্ন কাজের উপর একাধিক পূর্ববর্তী পদ্ধতি এবং তাদের TOOLDEC-বর্ধিত সংস্করণগুলি মূল্যায়ন করেছি। আমাদের পরীক্ষাগুলি দেখায় যে TOOLDEC সিনট্যাকটিক ত্রুটিগুলিকে শূন্যে কমিয়ে দেয়, ফলস্বরূপ উল্লেখযোগ্যভাবে আরও ভাল কার্যকারিতা অর্জন করে এবং 2x গতি অর্জন করে। আমরা আরও দেখাই যে TOOLDEC অদেখা সরঞ্জামগুলিতে উচ্চতর সাধারণীকরণ কার্যক্ষমতা অর্জন করে, বেসলাইনগুলির তুলনায় 8x পর্যন্ত ভাল পারফর্ম করে [1]

1। পরিচিতি

বাহ্যিক সরঞ্জামগুলির সাথে বড় ভাষা মডেলগুলি (এলএলএম) বৃদ্ধি করা (মিয়ালন এট আল।, 2023) তাদের জটিল সমস্যাগুলি সমাধান করতে সক্ষম করে। বর্তমান এলএলএমগুলি পুনরুদ্ধারকারী ব্যবহার করতে পারে (শেন এট আল।, 2023; গুপ্ত ও কেমভাভি, 2022; শিক এট আল।, 2023), রেস্টফুল এপিআই (কিন এট আল।, 2023; গান এট আল।, 2023), প্রোগ্রাম ইন্টারপ্রেটার (চেন) al., 2022; Gao et al., 2023), এবং অন্যান্য বিভিন্ন সরঞ্জাম। একটি টুল-বর্ধিত এলএলএম-এর কার্যকারিতা তিনটি মূল সিদ্ধান্ত নেওয়ার ক্ষমতার উপর নির্ভর করে- কখন একটি টুল ব্যবহার করতে হবে, কোন টুলটি ব্যবহার করতে হবে এবং কীভাবে একটি টুল ব্যবহার করতে হবে। বিদ্যমান পদ্ধতিগুলি ফাইন-টিউনিং বা ইন-কনটেক্সট লার্নিংয়ের মাধ্যমে এই সিদ্ধান্তগুলি নিতে শেখে।


যাইহোক, এই পদ্ধতিগুলি এখনও ভুল টুল কল তৈরি করে। উদাহরণস্বরূপ, ইন-কনটেক্সট লার্নিং সহজেই অস্তিত্বহীন টুলের নাম তৈরি করতে পারে যেগুলি টুল ইনভেন্টরিতে নেই কারণ অস্তিত্বহীন টুলগুলিও পরবর্তী টোকেন হিসাবে প্রশংসনীয় মনে হতে পারে (Song et al., 2023; Qin et al., 2023) . ফাইন-টিউনড মডেলগুলি, যদিও সাধারণত টুলগুলিকে সঠিক নামে ডাকে, প্রায়শই সঠিক টুল ফাংশনে অবৈধ আর্গুমেন্ট পাস করে (হাও এট আল।, 2023), ঠিক যেমন ইন-কনটেক্সট লার্নিং করে। তদ্ব্যতীত, পূর্বের পদ্ধতিগুলি অদেখা সরঞ্জামগুলিতে ভালভাবে সাধারণীকরণ করে না। ফাইন-টিউনিং পদ্ধতির জন্য অতিরিক্ত প্রশিক্ষণের ডেটা এবং নতুন সরঞ্জামগুলি গ্রহণ করার জন্য আরও সূক্ষ্ম-টিউনিং প্রয়োজন। ইন-কনটেক্সট শেখার পদ্ধতির জন্য প্রম্পটে টুল ডকুমেন্টেশন প্রয়োজন।


এই সমস্যাগুলি সমাধানের জন্য, আমরা TOOLDEC প্রস্তাব করি, একটি ডিকোডিং অ্যালগরিদম যা একটি সীমাবদ্ধ-রাষ্ট্র মেশিন (FSM) দ্বারা নির্দেশিত হয় যাতে এলএলএমগুলি সঠিকভাবে সরঞ্জামগুলি ব্যবহার করে তা নিশ্চিত করতে। আমাদের মূল অন্তর্দৃষ্টি হল এলএলএম ডিকোডিংয়ের সময় রাজ্যগুলিকে স্পষ্টভাবে উপস্থাপন করা। প্রতিটি রাজ্য টুলের নাম এবং টুল আর্গুমেন্টের সাথে সম্পর্কিত টোকেনগুলির একটি বৈধ সেটের সাথে যুক্ত। ডিকোডিং অগ্রগতির সাথে সাথে TOOLDEC রাজ্য থেকে রাজ্যে রূপান্তরিত হয়। প্রতিটি ডিকোডিং ধাপে, TOOLDEC ভাষা মডেলের সম্পূর্ণ শব্দভান্ডার থেকে নমুনা দেয় না। পরিবর্তে, এটি বর্তমান অবস্থা দ্বারা অনুমোদিত টোকেনগুলির একটি উপসেট থেকে নমুনা। এফএসএম যা TOOLDEC-কে নির্দেশনা দেয় টুল ডকুমেন্টেশন এবং API স্বাক্ষর থেকে তৈরি করা হয়েছে যাতে মেশিনটি টুল কলের ব্যাকরণকে সঠিকভাবে উপস্থাপন করে। এইভাবে, TOOLDEC সর্বদা তৈরি করতে সক্ষম


চিত্র 1: বাহ্যিক সরঞ্জাম ব্যবহার করে এলএলএম। টুলস ছাড়া LLM গুন করতে পারে না, তাই তারা শুধু একটি সম্ভাব্য পরবর্তী টোকেন তৈরি করে। টুল-অগমেন্টেড এলএলএমগুলি মাল্টিপ্লাইয়ের মতো বাহ্যিক সরঞ্জামগুলি অ্যাক্সেস করতে পারে, তবে তারা পণ্যের মতো একটি অস্তিত্বহীন টুলকে কল করতে পারে এবং স্ট্রিং "পাই" এর মতো অবৈধ আর্গুমেন্ট পাস করতে পারে। আমাদের প্রস্তাবিত TOOLDEC সর্বদা সিনট্যাক্স ত্রুটি ছাড়াই টুল কল তৈরি করে।


সিনট্যাক্টিক্যালি সঠিক টুল কল। চিত্র 1 দেখায় যে TOOLDEC দ্বারা উন্নত একটি LLM সুনির্দিষ্ট আর্গুমেন্ট ("3.14" এবং "123") সহ সঠিক ফাংশন কল গুনিত করতে সক্ষম এবং তাই, এটি টুল দ্বারা সঠিক ফলাফল ফেরত পায়৷ TOOLDEC এবং অন্যান্য টুল LLM-এর তুলনা করার আরও উদাহরণ পরিশিষ্ট A.3-তে পাওয়া যাবে।


তদুপরি, TOOLDEC নতুন সরঞ্জামগুলিতে সাধারণীকরণ করে যা আগে কখনও আরও দক্ষতার সাথে উপস্থিত হয়নি। পূর্বের পদ্ধতির বিপরীতে যার জন্য নতুন টুলের ফাইন-টিউনিং বা ইন-কনটেক্সট বর্ণনার প্রয়োজন হয়, TOOLDEC স্বয়ংক্রিয়ভাবে একটি টুলের API স্বাক্ষর (এর নাম এবং আর্গুমেন্টের ধরন) থেকে একটি সসীম-স্টেট মেশিন তৈরি করে এবং বিদ্যমান FSM-এ যোগ করে। TOOLDEC তখন ফাইন-টিউনিং বা ইন-প্রসঙ্গ প্রদর্শন ছাড়াই নতুন টুল কল করতে সক্ষম। যদিও প্রাক-প্রশিক্ষিত ভাষা মডেলগুলি যখন প্রম্পট করা হয় তখন টুলের নামগুলি তৈরি করতে পারে, তারা প্রায়শই সম্ভাব্য টুলের নামগুলিকে হ্যালুসিনেট করে যা ইনভেন্টরিতে নেই। TOOLDEC তা করে না। চিত্র 1-এ, উভয় পণ্য এবং গুণক শব্দ দৃশ্যকল্পের জন্য প্রশংসনীয়, কিন্তু শুধুমাত্র গুন একটি প্রদত্ত টুল। যেহেতু TOOLDEC শুধুমাত্র বিদ্যমান সরঞ্জামগুলিকে কল করে, তাই এটি একটি যুক্তিসঙ্গত কিন্তু অস্তিত্বহীন টুলকে হ্যালুসিনেট করবে না এবং সঠিক টুলটি খুঁজে পেতে টুলের নামের উপর নির্ভর করতে পারে।


এই কাগজের অবদানগুলি নিম্নরূপ সংক্ষিপ্ত করা যেতে পারে:


• আমরা TOOLDEC প্রস্তাব করছি, একটি সীমাবদ্ধ-রাষ্ট্র ডিকোডিং অ্যালগরিদম যাতে এলএলএমগুলিকে সরঞ্জামগুলি সঠিকভাবে ব্যবহার করার ক্ষমতা দেয়৷ TOOLDEC দুটি সুবিধা উপভোগ করে: এর জেনারেট করা টুল কলগুলি সিনট্যাকটিকভাবে সঠিক হওয়ার গ্যারান্টি দেওয়া হয় এবং এটি অদেখা টুলগুলিকে দক্ষতার সাথে সাধারণীকরণ করে।


• আমরা বিভিন্ন ডোমেন থেকে চারটি বৈচিত্র্যময় ডেটাসেটের পূর্বের শক্তিশালী বেসলাইনের তুলনায় TOOLDEC-এর উচ্চতর কর্মক্ষমতা পরীক্ষামূলকভাবে যাচাই করি। আমাদের বিস্তৃত পরীক্ষাগুলি দেখায় যে TOOLDEC সমস্ত সিনট্যাক্স ত্রুটি এবং হ্যালুসিনেটেড টুলের নামগুলি দূর করে, যার ফলে আরও সঠিকতা এবং 50% কম অনুমান সময় পাওয়া যায়। আমাদের ফলাফলগুলি আরও ইঙ্গিত করে যে TOOLDEC 9টি অদেখা সরঞ্জাম সহ গাণিতিক যুক্তির বেসলাইনের চেয়ে 8x বেশি এবং 204টি অদেখা সরঞ্জাম সহ জ্ঞান প্রশ্নের উত্তরের চেয়ে 7x ভাল।


এই কাগজটি CC 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ


[1] আমরা আমাদের কোড এবং ডেটা https://github.com/chenhongqiao/tooldec এ প্রকাশ করি।