paint-brush
এক্সপ্লোরিং টুল-ইন্টিগ্রেটেড রিজনিং: গণিত-দক্ষ এলএলএম উদ্ভাবনদ্বারা@mikeyoung44
1,130 পড়া
1,130 পড়া

এক্সপ্লোরিং টুল-ইন্টিগ্রেটেড রিজনিং: গণিত-দক্ষ এলএলএম উদ্ভাবন

দ্বারা Mike Young4m2023/10/04
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

TORA যুক্তি-ভিত্তিক এবং প্রোগ্রাম-ভিত্তিক উভয় যুক্তিকে একত্রিত করে গণিতের সমস্যাগুলির ফলাফল প্রদান করতে যা আগে LLM-এর পক্ষে সমাধান করা খুব কঠিন ছিল।
featured image - এক্সপ্লোরিং টুল-ইন্টিগ্রেটেড রিজনিং: গণিত-দক্ষ এলএলএম উদ্ভাবন
Mike Young HackerNoon profile picture
0-item


গাণিতিক যুক্তি দীর্ঘদিন ধরে কৃত্রিম বুদ্ধিমত্তার জন্য একটি চ্যালেঞ্জিং সীমান্ত। যদিও GPT-3 এবং ChatGPT-এর মতো ভাষার মডেলগুলি অনেক ভাষার কাজগুলিতে চিত্তাকর্ষক কর্মক্ষমতা অর্জন করেছে, তারা এখনও জটিল বিশ্ববিদ্যালয়-স্তরের গণিত সমস্যাগুলি সঠিকভাবে সমাধান করার জন্য সংগ্রাম করে। অত্যাধুনিক গাণিতিক যুক্তির ক্ষমতা আয়ত্ত করা বিজ্ঞান, প্রকৌশল, অর্থ এবং আরও অনেক কিছুতে এআই অ্যাপ্লিকেশন আনলক করতে পারে।


সম্প্রতি, সিংহুয়া ইউনিভার্সিটি এবং মাইক্রোসফটের গবেষকরা বৃহৎ ভাষার মডেলের গাণিতিক যুক্তি দক্ষতা জোরদার করার ক্ষেত্রে উল্লেখযোগ্য অগ্রগতি করেছেন। তাদের মূল প্রযুক্তিগত উদ্ভাবন ( এখানে উপস্থাপন করা হয়েছে ) বাহ্যিক গাণিতিক সরঞ্জাম যেমন কম্পিউটেশনাল লাইব্রেরি এবং প্রতীকী সমীকরণ সমাধানকারীকে সরাসরি মডেলের যুক্তি প্রক্রিয়ায় একীভূত করছে।


দেখা যাক এটা কিভাবে কাজ করে!


সমস্যা: ভাষা মডেলের জন্য গণিত কেন কঠিন

সংখ্যাসূচক গণনা এবং মৌলিক বীজগণিতের মতো কাজগুলি বিদ্যমান মডেলগুলির দ্বারা যুক্তিসঙ্গতভাবে পরিচালনা করা যেতে পারে। যাইহোক, বহু-পদক্ষেপ অনুমান, প্রতীকী হেরফের, এবং বিমূর্ত ধারণা জড়িত জটিল গাণিতিক সমস্যা-সমাধান সমস্যাযুক্ত।


উদাহরণস্বরূপ, মডেলগুলি প্রায়শই বীজগণিত শব্দ সমস্যাগুলি সমাধান করতে ব্যর্থ হয় যার জন্য ভেরিয়েবল সনাক্তকরণ, সমীকরণের সিস্টেম স্থাপন এবং পাঠ্যে মৌখিকভাবে বর্ণিত সম্পর্কগুলিকে গাণিতিকভাবে আনুষ্ঠানিককরণের প্রয়োজন হয়। স্থানিক যুক্তি দক্ষতার প্রয়োজনের কারণে জ্যামিতি চ্যালেঞ্জ তৈরি করে। হাই স্কুল এবং ইউনিভার্সিটির গণিত অনুশীলনগুলি প্রমাণ, অখণ্ড, ম্যাট্রিক্স এবং আরও অনেক কিছুর মতো ধারণাগুলিও চালু করে যা বিদ্যমান ভাষার মডেলগুলিকে বিভ্রান্ত করে।


গবেষকরা এই অসুবিধাগুলিকে দুটি প্রধান কারণের জন্য দায়ী করেছেন:


  • বিমূর্ত যুক্তির ক্ষমতার অভাব : ভাষার মডেলগুলি আজ প্রাথমিকভাবে ইন্টারনেট টেক্সট কর্পোরাতে প্রশিক্ষিত। যদিও এটি ভাষাগত দক্ষতা শেখায়, এটি গাণিতিক যুক্তির জন্য প্রয়োজনীয় কাঠামোগত জ্ঞান এবং যুক্তি প্রদান করে না।


  • প্রতীকী গণনা সম্পাদনে অক্ষমতা : গাণিতিক চিহ্নগুলি পরিচালনা করার জন্য ভাষাতে প্রয়োজনীয় কঠোরতা এবং নির্ভুলতার অভাব রয়েছে। মডেলগুলি প্রতিটি ধাপে ছোট ছোট ত্রুটি করতে পারে যা বহু-পদক্ষেপের সমস্যাগুলির উপর জমা হয়।


টুল-ইন্টিগ্রেটেড রিজনিং: একটি নতুন ট্রেনিং প্যারাডাইম

এই চ্যালেঞ্জগুলি মোকাবেলা করার জন্য, গবেষকরা ভাষা মডেলগুলিকে এমন একটি ফর্ম্যাটে যুক্তি শেখানোর প্রস্তাব করেন যা তারা টুল-ইন্টিগ্রেটেড রিজনিং বলে। মূল উদ্ভাবন হল বাহ্যিক গাণিতিক সরঞ্জামগুলিকে আমন্ত্রণ জানানোর জন্য কোড সহ মডেল দ্বারা উত্পন্ন প্রাকৃতিক ভাষার যুক্তিগুলিকে অন্তর্বর্তী করা৷

উদাহরণস্বরূপ, একটি জটিল বীজগণিত শব্দ সমস্যা দেওয়া হলে, মডেলটি প্রথমে শব্দে পদ্ধতির বর্ণনা দিতে পারে, তারপর প্রতীকীভাবে সমীকরণের সিস্টেম সেট আপ করার জন্য SymPy ব্যবহার করে একটি পাইথন প্রোগ্রাম লিখতে পারে, সমাধান পেতে এটি কার্যকর করতে পারে এবং অবশেষে মৌখিকভাবে ফলাফল ব্যাখ্যা করতে পারে।


এটি গাণিতিক সরঞ্জামগুলির নির্ভুলতা এবং গণনা শক্তির সাথে উচ্চ-স্তরের যুক্তি এবং পরিকল্পনায় ভাষার মডেলগুলির শক্তিকে পরিপূরক করে। তারা অনুমান করে যে এটি শব্দার্থগত বোঝাপড়া এবং প্রতীকী ম্যানিপুলেশন উভয়ের প্রয়োজন হয় এমন সমস্যাগুলি সমাধান করার মডেলগুলির ক্ষমতাকে উল্লেখযোগ্যভাবে বাড়িয়ে তুলতে পারে।


প্রশিক্ষণ পদ্ধতি: টুল ইন্টারঅ্যাকশন উদাহরণ থেকে অনুকরণ শিক্ষা

এই দৃষ্টিভঙ্গি উপলব্ধি করার জন্য, গবেষকদের প্রথমে একটি ডেটাসেট তৈরি করতে হয়েছিল যা গণিত সমস্যার উপর টুল-ইন্টিগ্রেটেড যুক্তি প্রদর্শন করে। SymPy-এর মতো টুলগুলির সাথে ইন্টারঅ্যাক্ট করার সময় GSM8k এবং MATH ডেটাসেটগুলি থেকে সমস্যাগুলি সমাধান করার জন্য GPT-3-এর 16,000 উদাহরণ স্বয়ংক্রিয়ভাবে তৈরি করতে তারা GPT-3-এর ক্ষমতাগুলিকে কাজে লাগায়।


টুল ইন্টারঅ্যাকশন ট্র্যাজেক্টোরিজের এই সংস্থার সাথে, দল অনুকরণ শিক্ষা ব্যবহার করে LLaMA মডেলের পূর্ব-প্রশিক্ষিত সংস্করণগুলি। অর্থাৎ, মডেলগুলিকে টুল ব্যবহারের আচরণের ভবিষ্যদ্বাণী করার জন্য প্রশিক্ষিত করা হয়েছিল এবং ডেটাসেটে প্রদর্শিত আন্তঃপ্রকাশিত প্রাকৃতিক ভাষার যুক্তিগুলি।

এই পন্থাটি 7 বিলিয়ন থেকে 70 বিলিয়ন প্যারামিটার পর্যন্ত Tool- ইন্টিগ্রেটেড O pen-source R easoning A gents (TORA) এর একটি সিরিজ তৈরি করেছে।


গণিত যুক্তিতে উল্লেখযোগ্য কর্মক্ষমতা উন্নতি

গবেষকরা 10টি বৈচিত্র্যময় গাণিতিক যুক্তি ডেটাসেটে TORA মডেলগুলিকে পদ্ধতিগতভাবে মূল্যায়ন করেছেন এবং পূর্বের অত্যাধুনিক প্রযুক্তির সাথে কর্মক্ষমতা তুলনা করেছেন।


ফলাফলগুলি দেখায় যে টুল-ইন্টিগ্রেটেড যুক্তি প্রশিক্ষণ মডেলের আকার এবং কার্যগুলি জুড়ে যথেষ্ট লাভ দেয়:


  • সেরা বিদ্যমান ওপেন-সোর্স মডেলের তুলনায় TORA মডেলগুলি গড়ে 13-19% উচ্চতর নির্ভুলতা অর্জন করেছে।

  • একটি চ্যালেঞ্জিং প্রতিযোগিতা-স্তরের গণিত পরীক্ষায় (MATH ডেটাসেট), TORA-7B 40% নির্ভুলতা অর্জন করেছে, আগের সেরা মডেলটিকে 22 শতাংশ পয়েন্টে হারিয়েছে।

  • TORA-34B MATH-এ 51% নির্ভুলতা অর্জন করেছে, একই সমস্যার ক্ষেত্রে GPT-4-এর 43% পারফরম্যান্সকে ছাড়িয়ে গেছে।


এটি পরামর্শ দেয় যে বাহ্যিক সরঞ্জামগুলিকে লিভারেজ করতে শেখা গাণিতিক যুক্তিতে GPT-4 এর মতো খুব বড় মডেলগুলিকে উল্লেখযোগ্যভাবে উন্নত করতে পারে।


মজার বিষয় হল, পাটিগণিত, বীজগণিত, ক্যালকুলাস, জ্যামিতি, সম্ভাব্যতা, ইত্যাদি বিস্তৃত বিভিন্ন ধরণের সমস্যার মধ্যে উন্নতিগুলি সামঞ্জস্যপূর্ণ ছিল। টুল ইন্টিগ্রেশন বিস্তৃত সুবিধা প্রদান করে বলে মনে হয়।


বিশ্লেষণ ভাষা এবং সরঞ্জামের পরিপূরক শক্তি প্রকাশ করে

মডেল আচরণকে আরও ভালভাবে বোঝার জন্য, গবেষকরা পদ্ধতিগতভাবে গাণিতিক ডোমেন জুড়ে সরঞ্জাম ব্যবহারের ধরণগুলি বিশ্লেষণ করেছেন:


  • বীজগণিত সমস্যাগুলির জন্য, মডেলগুলি প্রধানত সমীকরণগুলি পরিচালনা করতে SymPy-এর মতো প্রতীকী সরঞ্জামগুলি ব্যবহার করে। এটি কঠোর, সুনির্দিষ্ট প্রতীকী গণনার প্রয়োজনের সাথে ভালভাবে সারিবদ্ধ।
  • সম্ভাব্যতার মতো সংখ্যাসূচক ডোমেনে, মডেলগুলি ফ্যাক্টোরিয়ালের মতো গণনার জন্য অ্যালগরিদমের উপর বেশি নির্ভর করে।
  • জ্যামিতির জন্য, সরঞ্জাম প্রয়োগ করা ছোট লাভ প্রদান করে, স্থানিক যুক্তি নির্দেশ করে একটি চ্যালেঞ্জ রয়ে গেছে।

তারা প্রাকৃতিক ভাষা যুক্তি বা টুল ইন্টিগ্রেশন অপসারণ অপসারণ মূল্যায়ন করেছে:

  • টুল ইন্টারঅ্যাকশন ধারাবাহিকভাবে শুধুমাত্র প্রোগ্রামিং বা শুধুমাত্র প্রাকৃতিক ভাষা ব্যবহার করে মডেলগুলিকে ছাড়িয়ে গেছে সমস্যার ধরন জুড়ে।
  • যুক্তিগুলি জ্যামিতি, বীজগণিত এবং প্রিক্যালকুলাসের জন্য সবচেয়ে বড় সুবিধা প্রদান করে - ডোমেনগুলির জন্য উচ্চ-স্তরের পরিকল্পনা এবং যুক্তির প্রয়োজন হয়।


এই অন্তর্দৃষ্টিগুলি ভাষাগত এবং প্রতীকী যুক্তি উভয়ের পরিপূরক শক্তিগুলিকে আলোকিত করে।

সীমাবদ্ধতা এবং উন্মুক্ত সমস্যা

টুল ইন্টিগ্রেশন থেকে লাভ হওয়া সত্ত্বেও, উন্নতির জন্য উল্লেখযোগ্য জায়গা রয়ে গেছে। গবেষকরা জ্যামিতি এবং উন্নত বীজগণিতকে এমন ক্ষেত্র হিসাবে চিহ্নিত করেছেন যেখানে মডেলগুলি এখনও লড়াই করে।

SymPy-এর মতো বর্তমান সরঞ্জামগুলির স্থানিক যুক্তির জন্য সীমিত ক্ষমতা থাকায় জ্যামিতি একটি চ্যালেঞ্জ তৈরি করে। মাল্টি-মোডাল যুক্তিতে অগ্রগতি এবং গ্রাফিকাল লাইব্রেরির সাথে কঠোর সংহতকরণ সাহায্য করতে পারে।


বিমূর্ত বীজগণিতের জন্য, মানব গণিতবিদদের দ্বারা ব্যবহৃত কৌশলগুলি যেমন পরিচিত উপপাদ্যগুলি ব্যবহার করা এবং ফলাফল থেকে পিছনের দিকে কাজ করা সমস্যাগুলির প্রয়োজন হতে পারে। শক্তিশালী প্রতীকী যুক্তির ক্ষমতাও সম্ভবত প্রয়োজন।


সামগ্রিকভাবে, এই গবেষণাটি প্রতিশ্রুতিবদ্ধ প্রমাণ সরবরাহ করে যে বিশেষ বাহ্যিক সরঞ্জামগুলির সাথে ভাষার মডেল শক্তিগুলিকে একত্রিত করা গাণিতিক যুক্তিকে উল্লেখযোগ্যভাবে উন্নত করতে পারে। যাইহোক, বিভিন্ন যুক্তির পদ্ধতি এবং উচ্চ-স্তরের গাণিতিক সমস্যা সমাধানের কৌশলগুলি দক্ষতার সাথে একত্রিত করা একটি উন্মুক্ত সমস্যা থেকে যায়। এগুলি ভবিষ্যতের কাজের জন্য গুরুত্বপূর্ণ দিকনির্দেশ।


এখানে উপস্থাপিত টুল-ইন্টিগ্রেটেড ট্রেনিং প্যারাডাইম যুক্তিবিদ্যা, কমনসেন্স যুক্তি এবং শিল্পের মতো শৃঙ্খলা জুড়ে যুক্তি বাড়ানোর জন্য বাহ্যিক ক্ষমতাগুলিকে একীভূত করার জন্য একটি তদন্তকে উত্সাহিত করতে পারে। এটি আরও সক্ষম এবং বহুমুখী এআই সিস্টেমের দিকে একটি গুরুত্বপূর্ণ পদক্ষেপ হতে পারে।