গাণিতিক যুক্তি দীর্ঘদিন ধরে কৃত্রিম বুদ্ধিমত্তার জন্য একটি চ্যালেঞ্জিং সীমান্ত। যদিও GPT-3 এবং ChatGPT-এর মতো ভাষার মডেলগুলি অনেক ভাষার কাজগুলিতে চিত্তাকর্ষক কর্মক্ষমতা অর্জন করেছে, তারা এখনও জটিল বিশ্ববিদ্যালয়-স্তরের গণিত সমস্যাগুলি সঠিকভাবে সমাধান করার জন্য সংগ্রাম করে। অত্যাধুনিক গাণিতিক যুক্তির ক্ষমতা আয়ত্ত করা বিজ্ঞান, প্রকৌশল, অর্থ এবং আরও অনেক কিছুতে এআই অ্যাপ্লিকেশন আনলক করতে পারে।
সম্প্রতি, সিংহুয়া ইউনিভার্সিটি এবং মাইক্রোসফটের গবেষকরা বৃহৎ ভাষার মডেলের গাণিতিক যুক্তি দক্ষতা জোরদার করার ক্ষেত্রে উল্লেখযোগ্য অগ্রগতি করেছেন। তাদের মূল প্রযুক্তিগত উদ্ভাবন (
দেখা যাক এটা কিভাবে কাজ করে!
সংখ্যাসূচক গণনা এবং মৌলিক বীজগণিতের মতো কাজগুলি বিদ্যমান মডেলগুলির দ্বারা যুক্তিসঙ্গতভাবে পরিচালনা করা যেতে পারে। যাইহোক, বহু-পদক্ষেপ অনুমান, প্রতীকী হেরফের, এবং বিমূর্ত ধারণা জড়িত জটিল গাণিতিক সমস্যা-সমাধান সমস্যাযুক্ত।
উদাহরণস্বরূপ, মডেলগুলি প্রায়শই বীজগণিত শব্দ সমস্যাগুলি সমাধান করতে ব্যর্থ হয় যার জন্য ভেরিয়েবল সনাক্তকরণ, সমীকরণের সিস্টেম স্থাপন এবং পাঠ্যে মৌখিকভাবে বর্ণিত সম্পর্কগুলিকে গাণিতিকভাবে আনুষ্ঠানিককরণের প্রয়োজন হয়। স্থানিক যুক্তি দক্ষতার প্রয়োজনের কারণে জ্যামিতি চ্যালেঞ্জ তৈরি করে। হাই স্কুল এবং ইউনিভার্সিটির গণিত অনুশীলনগুলি প্রমাণ, অখণ্ড, ম্যাট্রিক্স এবং আরও অনেক কিছুর মতো ধারণাগুলিও চালু করে যা বিদ্যমান ভাষার মডেলগুলিকে বিভ্রান্ত করে।
গবেষকরা এই অসুবিধাগুলিকে দুটি প্রধান কারণের জন্য দায়ী করেছেন:
বিমূর্ত যুক্তির ক্ষমতার অভাব : ভাষার মডেলগুলি আজ প্রাথমিকভাবে ইন্টারনেট টেক্সট কর্পোরাতে প্রশিক্ষিত। যদিও এটি ভাষাগত দক্ষতা শেখায়, এটি গাণিতিক যুক্তির জন্য প্রয়োজনীয় কাঠামোগত জ্ঞান এবং যুক্তি প্রদান করে না।
প্রতীকী গণনা সম্পাদনে অক্ষমতা : গাণিতিক চিহ্নগুলি পরিচালনা করার জন্য ভাষাতে প্রয়োজনীয় কঠোরতা এবং নির্ভুলতার অভাব রয়েছে। মডেলগুলি প্রতিটি ধাপে ছোট ছোট ত্রুটি করতে পারে যা বহু-পদক্ষেপের সমস্যাগুলির উপর জমা হয়।
এই চ্যালেঞ্জগুলি মোকাবেলা করার জন্য, গবেষকরা ভাষা মডেলগুলিকে এমন একটি ফর্ম্যাটে যুক্তি শেখানোর প্রস্তাব করেন যা তারা টুল-ইন্টিগ্রেটেড রিজনিং বলে। মূল উদ্ভাবন হল বাহ্যিক গাণিতিক সরঞ্জামগুলিকে আমন্ত্রণ জানানোর জন্য কোড সহ মডেল দ্বারা উত্পন্ন প্রাকৃতিক ভাষার যুক্তিগুলিকে অন্তর্বর্তী করা৷
উদাহরণস্বরূপ, একটি জটিল বীজগণিত শব্দ সমস্যা দেওয়া হলে, মডেলটি প্রথমে শব্দে পদ্ধতির বর্ণনা দিতে পারে, তারপর প্রতীকীভাবে সমীকরণের সিস্টেম সেট আপ করার জন্য SymPy ব্যবহার করে একটি পাইথন প্রোগ্রাম লিখতে পারে, সমাধান পেতে এটি কার্যকর করতে পারে এবং অবশেষে মৌখিকভাবে ফলাফল ব্যাখ্যা করতে পারে।
এটি গাণিতিক সরঞ্জামগুলির নির্ভুলতা এবং গণনা শক্তির সাথে উচ্চ-স্তরের যুক্তি এবং পরিকল্পনায় ভাষার মডেলগুলির শক্তিকে পরিপূরক করে। তারা অনুমান করে যে এটি শব্দার্থগত বোঝাপড়া এবং প্রতীকী ম্যানিপুলেশন উভয়ের প্রয়োজন হয় এমন সমস্যাগুলি সমাধান করার মডেলগুলির ক্ষমতাকে উল্লেখযোগ্যভাবে বাড়িয়ে তুলতে পারে।
এই দৃষ্টিভঙ্গি উপলব্ধি করার জন্য, গবেষকদের প্রথমে একটি ডেটাসেট তৈরি করতে হয়েছিল যা গণিত সমস্যার উপর টুল-ইন্টিগ্রেটেড যুক্তি প্রদর্শন করে। SymPy-এর মতো টুলগুলির সাথে ইন্টারঅ্যাক্ট করার সময় GSM8k এবং MATH ডেটাসেটগুলি থেকে সমস্যাগুলি সমাধান করার জন্য GPT-3-এর 16,000 উদাহরণ স্বয়ংক্রিয়ভাবে তৈরি করতে তারা GPT-3-এর ক্ষমতাগুলিকে কাজে লাগায়।
টুল ইন্টারঅ্যাকশন ট্র্যাজেক্টোরিজের এই সংস্থার সাথে, দল অনুকরণ শিক্ষা ব্যবহার করে LLaMA মডেলের পূর্ব-প্রশিক্ষিত সংস্করণগুলি। অর্থাৎ, মডেলগুলিকে টুল ব্যবহারের আচরণের ভবিষ্যদ্বাণী করার জন্য প্রশিক্ষিত করা হয়েছিল এবং ডেটাসেটে প্রদর্শিত আন্তঃপ্রকাশিত প্রাকৃতিক ভাষার যুক্তিগুলি।
এই পন্থাটি 7 বিলিয়ন থেকে 70 বিলিয়ন প্যারামিটার পর্যন্ত Tool- ইন্টিগ্রেটেড O pen-source R easoning A gents (TORA) এর একটি সিরিজ তৈরি করেছে।
গবেষকরা 10টি বৈচিত্র্যময় গাণিতিক যুক্তি ডেটাসেটে TORA মডেলগুলিকে পদ্ধতিগতভাবে মূল্যায়ন করেছেন এবং পূর্বের অত্যাধুনিক প্রযুক্তির সাথে কর্মক্ষমতা তুলনা করেছেন।
ফলাফলগুলি দেখায় যে টুল-ইন্টিগ্রেটেড যুক্তি প্রশিক্ষণ মডেলের আকার এবং কার্যগুলি জুড়ে যথেষ্ট লাভ দেয়:
সেরা বিদ্যমান ওপেন-সোর্স মডেলের তুলনায় TORA মডেলগুলি গড়ে 13-19% উচ্চতর নির্ভুলতা অর্জন করেছে।
একটি চ্যালেঞ্জিং প্রতিযোগিতা-স্তরের গণিত পরীক্ষায় (MATH ডেটাসেট), TORA-7B 40% নির্ভুলতা অর্জন করেছে, আগের সেরা মডেলটিকে 22 শতাংশ পয়েন্টে হারিয়েছে।
TORA-34B MATH-এ 51% নির্ভুলতা অর্জন করেছে, একই সমস্যার ক্ষেত্রে GPT-4-এর 43% পারফরম্যান্সকে ছাড়িয়ে গেছে।
এটি পরামর্শ দেয় যে বাহ্যিক সরঞ্জামগুলিকে লিভারেজ করতে শেখা গাণিতিক যুক্তিতে GPT-4 এর মতো খুব বড় মডেলগুলিকে উল্লেখযোগ্যভাবে উন্নত করতে পারে।
মজার বিষয় হল, পাটিগণিত, বীজগণিত, ক্যালকুলাস, জ্যামিতি, সম্ভাব্যতা, ইত্যাদি বিস্তৃত বিভিন্ন ধরণের সমস্যার মধ্যে উন্নতিগুলি সামঞ্জস্যপূর্ণ ছিল। টুল ইন্টিগ্রেশন বিস্তৃত সুবিধা প্রদান করে বলে মনে হয়।
মডেল আচরণকে আরও ভালভাবে বোঝার জন্য, গবেষকরা পদ্ধতিগতভাবে গাণিতিক ডোমেন জুড়ে সরঞ্জাম ব্যবহারের ধরণগুলি বিশ্লেষণ করেছেন:
তারা প্রাকৃতিক ভাষা যুক্তি বা টুল ইন্টিগ্রেশন অপসারণ অপসারণ মূল্যায়ন করেছে:
এই অন্তর্দৃষ্টিগুলি ভাষাগত এবং প্রতীকী যুক্তি উভয়ের পরিপূরক শক্তিগুলিকে আলোকিত করে।
টুল ইন্টিগ্রেশন থেকে লাভ হওয়া সত্ত্বেও, উন্নতির জন্য উল্লেখযোগ্য জায়গা রয়ে গেছে। গবেষকরা জ্যামিতি এবং উন্নত বীজগণিতকে এমন ক্ষেত্র হিসাবে চিহ্নিত করেছেন যেখানে মডেলগুলি এখনও লড়াই করে।
SymPy-এর মতো বর্তমান সরঞ্জামগুলির স্থানিক যুক্তির জন্য সীমিত ক্ষমতা থাকায় জ্যামিতি একটি চ্যালেঞ্জ তৈরি করে। মাল্টি-মোডাল যুক্তিতে অগ্রগতি এবং গ্রাফিকাল লাইব্রেরির সাথে কঠোর সংহতকরণ সাহায্য করতে পারে।
বিমূর্ত বীজগণিতের জন্য, মানব গণিতবিদদের দ্বারা ব্যবহৃত কৌশলগুলি যেমন পরিচিত উপপাদ্যগুলি ব্যবহার করা এবং ফলাফল থেকে পিছনের দিকে কাজ করা সমস্যাগুলির প্রয়োজন হতে পারে। শক্তিশালী প্রতীকী যুক্তির ক্ষমতাও সম্ভবত প্রয়োজন।
সামগ্রিকভাবে, এই গবেষণাটি প্রতিশ্রুতিবদ্ধ প্রমাণ সরবরাহ করে যে বিশেষ বাহ্যিক সরঞ্জামগুলির সাথে ভাষার মডেল শক্তিগুলিকে একত্রিত করা গাণিতিক যুক্তিকে উল্লেখযোগ্যভাবে উন্নত করতে পারে। যাইহোক, বিভিন্ন যুক্তির পদ্ধতি এবং উচ্চ-স্তরের গাণিতিক সমস্যা সমাধানের কৌশলগুলি দক্ষতার সাথে একত্রিত করা একটি উন্মুক্ত সমস্যা থেকে যায়। এগুলি ভবিষ্যতের কাজের জন্য গুরুত্বপূর্ণ দিকনির্দেশ।
এখানে উপস্থাপিত টুল-ইন্টিগ্রেটেড ট্রেনিং প্যারাডাইম যুক্তিবিদ্যা, কমনসেন্স যুক্তি এবং শিল্পের মতো শৃঙ্খলা জুড়ে যুক্তি বাড়ানোর জন্য বাহ্যিক ক্ষমতাগুলিকে একীভূত করার জন্য একটি তদন্তকে উত্সাহিত করতে পারে। এটি আরও সক্ষম এবং বহুমুখী এআই সিস্টেমের দিকে একটি গুরুত্বপূর্ণ পদক্ষেপ হতে পারে।
এছাড়াও এখানে প্রকাশিত.