লেখক:
(1) Xiaofei Sun, Zhejiang University;
(2) Xiaoya Li, Shannon.AI এবং Bytedance;
(3) Shengyu Zhang, Zhejiang বিশ্ববিদ্যালয়;
(4) শুহে ওয়াং, পিকিং বিশ্ববিদ্যালয়;
(5) ফেই উ, ঝেজিয়াং বিশ্ববিদ্যালয়;
(6) Jiwei Li, Zhejiang University;
(7) Tianwei Zhang, Nanyang প্রযুক্তি বিশ্ববিদ্যালয়;
(8) Guoyin Wang, Shannon.AI এবং Bytedance.
সেন্টিমেন্ট বিশ্লেষণের জন্য এলএলএম আলোচনা
এই বিভাগে, আমরা সেন্টিমেন্ট বিশ্লেষণের জন্য মাল্টি-এলএলএম আলোচনার কাঠামোর বিশদ বিবরণ দিই: দুটি এলএলএম উত্তর জেনারেটর এবং বৈষম্যকারী হিসাবে কাজ করে। আমরা জেনারেটর এবং বৈষম্যকারীর মধ্যে মিথস্ক্রিয়াকে একটি আলোচনা হিসাবে উল্লেখ করি। একটি ঐক্যমত্যে না পৌঁছানো পর্যন্ত বা আলোচনার সর্বাধিক সংখ্যা অতিক্রম না করা পর্যন্ত আলোচনার পুনরাবৃত্তি হবে। চিত্র 1 এবং 2 এ দেখানো হয়েছে।
জেনারেটর একটি বৃহৎ ভাষা মডেল দ্বারা ব্যাকবোন করা হয়. আমরা প্রম্পটের মাধ্যমে ICL দৃষ্টান্তের উপর ভিত্তি করে উত্তর জেনারেটরকে জিজ্ঞাসা করি, একটি ধাপে ধাপে যুক্তির চেইন তৈরি করা এবং পরীক্ষার ইনপুটের সেন্টিমেন্ট পোলারিটির দিকে একটি সিদ্ধান্ত নেওয়ার লক্ষ্যে।
প্রম্পট তিনটি উপাদানের সমন্বয়ে গঠিত: একটি টাস্ক বর্ণনা, প্রদর্শন এবং একটি পরীক্ষা ইনপুট। টাস্কের বর্ণনা হল স্বাভাবিক ভাষায় টাস্কের বর্ণনা (যেমন, "দয়া করে পরীক্ষা ইনপুটের সামগ্রিক অনুভূতি নির্ধারণ করুন।"); পরীক্ষার ইনপুট হল পরীক্ষার সেটের পাঠ্য ইনপুট (যেমন, "আকাশ নীল।"); বিক্ষোভ টাস্ক ট্রেন সেট থেকে হয়. প্রতিটি তিনটি উপাদান নিয়ে গঠিত: ইনপুট, যুক্তি চেইন, এবং সংবেদনশীল সিদ্ধান্ত।
প্রতিটি পরীক্ষার ইনপুটের জন্য, আমরা প্রথমে প্রদর্শনী হিসাবে সেট করা ট্রেন থেকে K নিকটতম প্রতিবেশী (ইনপুট, অনুভূতির সিদ্ধান্ত) পুনরুদ্ধার করি। তারপর, আমরা জেনারেটরকে যুক্তির চেইন তৈরি করতে অনুরোধ করে প্রদর্শনগুলিকে (ইনপুট, যুক্তি প্রক্রিয়া, অনুভূতির সিদ্ধান্ত) ত্রিপলে রূপান্তরিত করি। টাস্ক বর্ণনা, প্রদর্শন এবং পরীক্ষার ইনপুট সংযুক্ত করার পরে, আমরা জেনারেটরের কাছে প্রম্পট ফরোয়ার্ড করি, যা ধাপে ধাপে যুক্তি চেইন এবং একটি আবেগপূর্ণ সিদ্ধান্তের সাথে প্রতিক্রিয়া জানাবে।
বৈষম্যকারী অন্য এলএলএম দ্বারা পৃষ্ঠপোষক। উত্তর তৈরির প্রক্রিয়া শেষ করার পরে, জেনারেটরের দ্বারা নেওয়া সিদ্ধান্ত সঠিক কিনা তা বিচার করতে এবং একটি যুক্তিসঙ্গত ব্যাখ্যা প্রদান করতে উত্তর বৈষম্যকারী ব্যবহার করা হয়।
এই লক্ষ্যটি সম্পন্ন করার জন্য, আমরা প্রথমে উত্তর বৈষম্যকারীর জন্য প্রম্পট তৈরি করি। প্রম্পটটি চারটি উপাদানের সমন্বয়ে গঠিত: একটি কাজের বিবরণ, প্রদর্শন, একটি পরীক্ষা ইনপুট এবং উত্তর জেনারেটরের প্রতিক্রিয়া। টাস্ক ডিসক্রিপশন হল পাঠ্যের একটি টুকরো যা কাজটিকে স্বাভাবিক ভাষায় বর্ণনা করে (যেমন, "অনুগ্রহ করে নির্ধারণ করুন সিদ্ধান্তটি সঠিক কিনা।")। প্রতিটি প্রদর্শন ছয়টি উপাদানের সমন্বয়ে গঠিত: (ইনপুট পাঠ্য, একটি যুক্তির শৃঙ্খল, অনুভূতির সিদ্ধান্ত, বৈষম্যমূলক মনোভাব, বৈষম্যমূলক ব্যাখ্যা, বৈষম্যকারী সিদ্ধান্ত) এবং ইনপুট পাঠ্যের জন্য অনুভূতির সিদ্ধান্ত কেন সঠিক তা ব্যাখ্যা করার জন্য উত্তর বৈষম্যকারীকে অনুরোধ করে নির্মিত।
তারপর আমরা কনস্ট্রাক্ট প্রম্পট সহ বৈষম্যকারীকে জিজ্ঞাসা করি। উত্তর বৈষম্যকারী একটি টেক্সট স্ট্রিং দিয়ে প্রতিক্রিয়া জানাবে, যেখানে একটি মনোভাব রয়েছে (যেমন, হ্যাঁ, না) যা বোঝায় যে বৈষম্যকারী জেনারেটরের সাথে একমত কিনা, ব্যাখ্যা যা ব্যাখ্যা করে যে কেন বৈষম্যকারী জেনারেটরের সাথে একমত/অসম্মত, এবং একটি বৈষম্যকারী সিদ্ধান্ত যা নির্ধারণ করে পরীক্ষার ইনপুটের অনুভূতি।
কেন দুটি এলএলএম কিন্তু একটি নয়? দুটি ভূমিকা হিসাবে কাজ করার জন্য একটি একক এলএলএম ব্যবহার করার পরিবর্তে জেনারেটর এবং বৈষম্যকারীর জন্য পৃথকভাবে দুটি ভিন্ন এলএলএম ব্যবহার করার দুটি কারণ রয়েছে: (1) যদি একটি এলএলএম ভুল যুক্তির কারণে জেনারেটর হিসাবে ভুল করে, তবে এটি হওয়ার সম্ভাবনা বেশি। এটি বৈষম্যকারীর মতো একই ভুল করবে যেহেতু জেনারেটর এবং একই মডেলের বৈষম্যকারী একই রকম যুক্তি তৈরি করার সম্ভাবনা রয়েছে; (2) দুটি পৃথক মডেল ব্যবহার করে, আমরা দুটি মডেলের পরিপূরক ক্ষমতার সুবিধা নিতে সক্ষম।
দুটি এলএলএম আলোচনার মাধ্যমে শেষ হওয়ার পরে, আমরা তাদের ফ্লিপ ভূমিকা জিজ্ঞাসা করি এবং একটি নতুন আলোচনা শুরু করি, যেখানে দ্বিতীয় এলএলএম জেনারেটর হিসাবে কাজ করে এবং প্রথম এলএলএম বৈষম্যকারী হিসাবে কাজ করে। আমরা ফ্লিপড ভূমিকা সহ দুটি এলএলএম-এর মিথস্ক্রিয়াকে ভূমিকা-ফ্লিপড আলোচনা হিসাবে উল্লেখ করি। একইভাবে, ভূমিকা-ফ্লিপড আলোচনা শেষ হয় যতক্ষণ না একটি ঐক্যমত্যে পৌঁছানো হয় বা আলোচনার সর্বাধিক সংখ্যা অতিক্রম করা হয়।
যখন উভয় আলোচনার ফলাফল একটি চুক্তিতে পরিণত হয় এবং তাদের সিদ্ধান্ত একই হয়, তখন আমরা উভয় সিদ্ধান্তকেই চূড়ান্ত হিসাবে বেছে নিতে পারি যেহেতু তারা একই। আলোচনার একটি যদি ঐকমত্যে পৌঁছাতে ব্যর্থ হয় যখন অন্যটি একটি সিদ্ধান্তে পৌঁছায়, আমরা চূড়ান্ত সিদ্ধান্ত হিসাবে ঐকমত্যে পৌঁছেছে এমন আলোচনা থেকে সিদ্ধান্ত বেছে নিই। যাইহোক, যদি উভয় আলোচনাই ঐকমত্যে পৌঁছায় কিন্তু তাদের সিদ্ধান্তগুলি সারিবদ্ধ না হয়, তাহলে আমাদের একটি অতিরিক্ত ভাষা মডেলের (LLM) সহায়তার প্রয়োজন হবে, যা নীচে আরও বিশদে ব্যাখ্যা করা হবে।"
একটি তৃতীয় এলএলএম প্রবর্তন যদি দুটি আলোচনার সিদ্ধান্ত সারিবদ্ধ না হয়, আমরা একটি তৃতীয় এলএলএম প্রবর্তন করি এবং উপরে উল্লিখিত দুটি এলএলএম-এর প্রত্যেকটির সাথে আলোচনা এবং ভূমিকা-ফ্লিপড আলোচনা পরিচালনা করি। পরবর্তীকালে, আমরা 6টি আলোচনার ফলাফল পাব এবং এই ফলাফলগুলিতে ভোট দেব: যে সিদ্ধান্তটি প্রায়শই প্রদর্শিত হয় তা ইনপুট পরীক্ষার অনুভূতির পোলারিটি হিসাবে নেওয়া হয়।
এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।