লেখক:  (1) কেক্সুন ঝাং, ইউসি সান্তা বারবারা এবং সমান অবদান;  (2) হংকিয়াও চেন, নর্থউড হাই স্কুল এবং সমান অবদান;  (3) লেই লি, কার্নেগি মেলন বিশ্ববিদ্যালয়;  (4) উইলিয়াম ইয়াং ওয়াং, ইউসি সান্তা বারবারা।  লিঙ্কের টেবিল   বিমূর্ত এবং ভূমিকা   সম্পর্কিত কাজ   ToolDec: Finite-State Decoding এর মাধ্যমে LLM টুল ব্যবহার   পরীক্ষা: টুলডেক সিনট্যাক্স ত্রুটি দূর করে   পরীক্ষা: টুলডেক সাধারণীকরণযোগ্য টুল নির্বাচন সক্ষম করে   উপসংহার এবং রেফারেন্স   পরিশিষ্ট  বিমূর্ত  বৃহৎ ভাষা মডেল (LLMs) জটিল সমস্যা সমাধানের জন্য বাহ্যিক সরঞ্জাম ব্যবহারে প্রতিশ্রুতিশীল ক্ষমতা দেখিয়েছে। যাইহোক, বিদ্যমান পন্থাগুলির মধ্যে হয় টুল প্রদর্শনের উপর সূক্ষ্ম-টিউনিং জড়িত, যা অতিরিক্ত প্রশিক্ষণ ছাড়াই নতুন সরঞ্জামগুলিতে সাধারণীকরণ করে না, বা প্রেক্ষাপটে টুল ডকুমেন্টেশন প্রদান করে, সরঞ্জামের সংখ্যা সীমিত করে। উভয় পন্থা প্রায়ই সিনট্যাক্টিকভাবে অবৈধ টুল কল তৈরি করে। এই কাগজে, আমরা টুল-অগমেন্টেড এলএলএম-এর জন্য TOOLDEC, একটি সসীম-স্টেট মেশিন-গাইডেড ডিকোডিং অ্যালগরিদম প্রস্তাব করছি। TOOLDEC বৈধ টুলের নাম এবং টাইপ-সামঞ্জস্যপূর্ণ আর্গুমেন্ট নিশ্চিত করার মাধ্যমে যেকোন টুল অগমেন্টেড এলএলএম-এর জন্য টুল-সম্পর্কিত ত্রুটি দূর করে। তদ্ব্যতীত, TOOLDEC LLM কে কার্যকরীভাবে তাদের নামের মধ্যে থাকা তথ্য ব্যবহার করে টুল নির্বাচন করতে সক্ষম করে, যার কোনো ফাইন-টিউনিং বা ইন-প্রসঙ্গ ডকুমেন্টেশনের প্রয়োজন নেই। আমরা গণিত ফাংশন, জ্ঞান গ্রাফ সম্পর্ক, এবং জটিল বাস্তব-বিশ্ব RESTful API-এর মতো সরঞ্জামগুলি জড়িত বিভিন্ন কাজের উপর একাধিক পূর্ববর্তী পদ্ধতি এবং তাদের TOOLDEC-বর্ধিত সংস্করণগুলি মূল্যায়ন করেছি। আমাদের পরীক্ষাগুলি দেখায় যে TOOLDEC সিনট্যাকটিক ত্রুটিগুলিকে শূন্যে কমিয়ে দেয়, ফলস্বরূপ উল্লেখযোগ্যভাবে আরও ভাল কার্যকারিতা অর্জন করে এবং 2x গতি অর্জন করে। আমরা আরও দেখাই যে TOOLDEC অদেখা সরঞ্জামগুলিতে উচ্চতর সাধারণীকরণ কার্যক্ষমতা অর্জন করে, বেসলাইনগুলির তুলনায় 8x পর্যন্ত ভাল পারফর্ম করে [1]  1। পরিচিতি  বাহ্যিক সরঞ্জামগুলির সাথে বড় ভাষা মডেলগুলি (এলএলএম) বৃদ্ধি করা (মিয়ালন এট আল।, 2023) তাদের জটিল সমস্যাগুলি সমাধান করতে সক্ষম করে। বর্তমান এলএলএমগুলি পুনরুদ্ধারকারী ব্যবহার করতে পারে (শেন এট আল।, 2023; গুপ্ত ও কেমভাভি, 2022; শিক এট আল।, 2023), রেস্টফুল এপিআই (কিন এট আল।, 2023; গান এট আল।, 2023), প্রোগ্রাম ইন্টারপ্রেটার (চেন) al., 2022; Gao et al., 2023), এবং অন্যান্য বিভিন্ন সরঞ্জাম। একটি টুল-বর্ধিত এলএলএম-এর কার্যকারিতা তিনটি মূল সিদ্ধান্ত নেওয়ার ক্ষমতার উপর নির্ভর করে- কখন একটি টুল ব্যবহার করতে হবে, কোন টুলটি ব্যবহার করতে হবে এবং কীভাবে একটি টুল ব্যবহার করতে হবে। বিদ্যমান পদ্ধতিগুলি ফাইন-টিউনিং বা ইন-কনটেক্সট লার্নিংয়ের মাধ্যমে এই সিদ্ধান্তগুলি নিতে শেখে।  যাইহোক, এই পদ্ধতিগুলি এখনও ভুল টুল কল তৈরি করে। উদাহরণস্বরূপ, ইন-কনটেক্সট লার্নিং সহজেই অস্তিত্বহীন টুলের নাম তৈরি করতে পারে যেগুলি টুল ইনভেন্টরিতে নেই কারণ অস্তিত্বহীন টুলগুলিও পরবর্তী টোকেন হিসাবে প্রশংসনীয় মনে হতে পারে (Song et al., 2023; Qin et al., 2023) . ফাইন-টিউনড মডেলগুলি, যদিও সাধারণত টুলগুলিকে সঠিক নামে ডাকে, প্রায়শই সঠিক টুল ফাংশনে অবৈধ আর্গুমেন্ট পাস করে (হাও এট আল।, 2023), ঠিক যেমন ইন-কনটেক্সট লার্নিং করে। তদ্ব্যতীত, পূর্বের পদ্ধতিগুলি অদেখা সরঞ্জামগুলিতে ভালভাবে সাধারণীকরণ করে না। ফাইন-টিউনিং পদ্ধতির জন্য অতিরিক্ত প্রশিক্ষণের ডেটা এবং নতুন সরঞ্জামগুলি গ্রহণ করার জন্য আরও সূক্ষ্ম-টিউনিং প্রয়োজন। ইন-কনটেক্সট শেখার পদ্ধতির জন্য প্রম্পটে টুল ডকুমেন্টেশন প্রয়োজন।  এই সমস্যাগুলি সমাধানের জন্য, আমরা TOOLDEC প্রস্তাব করি, একটি ডিকোডিং অ্যালগরিদম যা একটি সীমাবদ্ধ-রাষ্ট্র মেশিন (FSM) দ্বারা নির্দেশিত হয় যাতে এলএলএমগুলি সঠিকভাবে সরঞ্জামগুলি ব্যবহার করে তা নিশ্চিত করতে। আমাদের মূল অন্তর্দৃষ্টি হল এলএলএম ডিকোডিংয়ের সময় রাজ্যগুলিকে স্পষ্টভাবে উপস্থাপন করা। প্রতিটি রাজ্য টুলের নাম এবং টুল আর্গুমেন্টের সাথে সম্পর্কিত টোকেনগুলির একটি বৈধ সেটের সাথে যুক্ত। ডিকোডিং অগ্রগতির সাথে সাথে TOOLDEC রাজ্য থেকে রাজ্যে রূপান্তরিত হয়। প্রতিটি ডিকোডিং ধাপে, TOOLDEC ভাষা মডেলের সম্পূর্ণ শব্দভান্ডার থেকে নমুনা দেয় না। পরিবর্তে, এটি বর্তমান অবস্থা দ্বারা অনুমোদিত টোকেনগুলির একটি উপসেট থেকে নমুনা। এফএসএম যা TOOLDEC-কে নির্দেশনা দেয় টুল ডকুমেন্টেশন এবং API স্বাক্ষর থেকে তৈরি করা হয়েছে যাতে মেশিনটি টুল কলের ব্যাকরণকে সঠিকভাবে উপস্থাপন করে। এইভাবে, TOOLDEC সর্বদা তৈরি করতে সক্ষম   সিনট্যাক্টিক্যালি সঠিক টুল কল। চিত্র 1 দেখায় যে TOOLDEC দ্বারা উন্নত একটি LLM সুনির্দিষ্ট আর্গুমেন্ট ("3.14" এবং "123") সহ সঠিক ফাংশন কল গুনিত করতে সক্ষম এবং তাই, এটি টুল দ্বারা সঠিক ফলাফল ফেরত পায়৷ TOOLDEC এবং অন্যান্য টুল LLM-এর তুলনা করার আরও উদাহরণ পরিশিষ্ট A.3-তে পাওয়া যাবে।  তদুপরি, TOOLDEC নতুন সরঞ্জামগুলিতে সাধারণীকরণ করে যা আগে কখনও আরও দক্ষতার সাথে উপস্থিত হয়নি। পূর্বের পদ্ধতির বিপরীতে যার জন্য নতুন টুলের ফাইন-টিউনিং বা ইন-কনটেক্সট বর্ণনার প্রয়োজন হয়, TOOLDEC স্বয়ংক্রিয়ভাবে একটি টুলের API স্বাক্ষর (এর নাম এবং আর্গুমেন্টের ধরন) থেকে একটি সসীম-স্টেট মেশিন তৈরি করে এবং বিদ্যমান FSM-এ যোগ করে। TOOLDEC তখন ফাইন-টিউনিং বা ইন-প্রসঙ্গ প্রদর্শন ছাড়াই নতুন টুল কল করতে সক্ষম। যদিও প্রাক-প্রশিক্ষিত ভাষা মডেলগুলি যখন প্রম্পট করা হয় তখন টুলের নামগুলি তৈরি করতে পারে, তারা প্রায়শই সম্ভাব্য টুলের নামগুলিকে হ্যালুসিনেট করে যা ইনভেন্টরিতে নেই। TOOLDEC তা করে না। চিত্র 1-এ, উভয় পণ্য এবং গুণক শব্দ দৃশ্যকল্পের জন্য প্রশংসনীয়, কিন্তু শুধুমাত্র গুন একটি প্রদত্ত টুল। যেহেতু TOOLDEC শুধুমাত্র বিদ্যমান সরঞ্জামগুলিকে কল করে, তাই এটি একটি যুক্তিসঙ্গত কিন্তু অস্তিত্বহীন টুলকে হ্যালুসিনেট করবে না এবং সঠিক টুলটি খুঁজে পেতে টুলের নামের উপর নির্ভর করতে পারে।  এই কাগজের অবদানগুলি নিম্নরূপ সংক্ষিপ্ত করা যেতে পারে:  • আমরা TOOLDEC প্রস্তাব করছি, একটি সীমাবদ্ধ-রাষ্ট্র ডিকোডিং অ্যালগরিদম যাতে এলএলএমগুলিকে সরঞ্জামগুলি সঠিকভাবে ব্যবহার করার ক্ষমতা দেয়৷ TOOLDEC দুটি সুবিধা উপভোগ করে: এর জেনারেট করা টুল কলগুলি সিনট্যাকটিকভাবে সঠিক হওয়ার গ্যারান্টি দেওয়া হয় এবং এটি অদেখা টুলগুলিকে দক্ষতার সাথে সাধারণীকরণ করে।  • আমরা বিভিন্ন ডোমেন থেকে চারটি বৈচিত্র্যময় ডেটাসেটের পূর্বের শক্তিশালী বেসলাইনের তুলনায় TOOLDEC-এর উচ্চতর কর্মক্ষমতা পরীক্ষামূলকভাবে যাচাই করি। আমাদের বিস্তৃত পরীক্ষাগুলি দেখায় যে TOOLDEC সমস্ত সিনট্যাক্স ত্রুটি এবং হ্যালুসিনেটেড টুলের নামগুলি দূর করে, যার ফলে আরও সঠিকতা এবং 50% কম অনুমান সময় পাওয়া যায়। আমাদের ফলাফলগুলি আরও ইঙ্গিত করে যে TOOLDEC 9টি অদেখা সরঞ্জাম সহ গাণিতিক যুক্তির বেসলাইনের চেয়ে 8x বেশি এবং 204টি অদেখা সরঞ্জাম সহ জ্ঞান প্রশ্নের উত্তরের চেয়ে 7x ভাল।  এই কাগজটি CC 4.0 DEED লাইসেন্সের অধীনে   । arxiv-এ উপলব্ধ  [1] আমরা আমাদের কোড এবং ডেটা https://github.com/chenhongqiao/tooldec এ প্রকাশ করি।

Part of HackerNoon's growing list of open-source research papers, promoting free access to academic material.

AI Models on HackerNoon

গল্পের মূল ভাষায় এই অডিও তৈরি!

LLM-এর জন্য সিনট্যাক্স ত্রুটি-মুক্ত এবং সাধারণীকরণযোগ্য টুল ব্যবহার: বিমূর্ত এবং ভূমিকা

About Author

মন্তব্য

আসে ট্যাগ

এই নিবন্ধটি উপস্থাপন করা হয়েছে

Related Stories

ডিজিটাল যাযাবর শুনুন: থাইল্যান্ডের নতুন ডিটিভি ভিসা সম্পর্কে আপনার যা জানা দরকার

অদেখা স্তরগুলি: কেন ব্যবহারকারীর সাক্ষাত্কারগুলি একটি অপরিবর্তনীয় সম্পদ

ফোরাম থেকে ফিড পর্যন্ত: কীভাবে সোশ্যাল মিডিয়া অ্যালগরিদম ডিজিটাল ইন্টারঅ্যাকশনকে আকার দেয়

ক্লাউড সনেট 3.5 সিস্টেম প্রম্পট লিক: একটি ফরেনসিক বিশ্লেষণ

ডিজিটাল যাযাবর শুনুন: থাইল্যান্ডের নতুন ডিটিভি ভিসা সম্পর্কে আপনার যা জানা দরকার

অদেখা স্তরগুলি: কেন ব্যবহারকারীর সাক্ষাত্কারগুলি একটি অপরিবর্তনীয় সম্পদ

ফোরাম থেকে ফিড পর্যন্ত: কীভাবে সোশ্যাল মিডিয়া অ্যালগরিদম ডিজিটাল ইন্টারঅ্যাকশনকে আকার দেয়

ক্লাউড সনেট 3.5 সিস্টেম প্রম্পট লিক: একটি ফরেনসিক বিশ্লেষণ

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps