paint-brush
উন্নত অনুভূতি বিশ্লেষণের সিদ্ধান্তের জন্য দুটি এলএলএম ব্যবহার করাদ্বারা@textmodels
254 পড়া

উন্নত অনুভূতি বিশ্লেষণের সিদ্ধান্তের জন্য দুটি এলএলএম ব্যবহার করা

দ্বারা Writings, Papers and Blogs on Text Models4m2024/05/20
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

অনুভূতি বিশ্লেষণের জন্য একটি মাল্টি-এলএলএম আলোচনার কাঠামোতে দুটি এলএলএম জড়িত, একটি জেনারেটর হিসাবে এবং অন্যটি বৈষম্যকারী হিসাবে, সঠিক অনুভূতির সিদ্ধান্তের জন্য ভূমিকা-ফ্লিপড আলোচনায় জড়িত। প্রয়োজনে পরস্পরবিরোধী সিদ্ধান্তের সমাধানের জন্য তৃতীয় এলএলএম চালু করা হয়। এই পদ্ধতিটি সেন্টিমেন্ট অ্যানালাইসিস অ্যালগরিদমকে অপ্টিমাইজ করে এবং সেন্টিমেন্ট অ্যানালাইসিস কাজগুলিতে এআই ক্ষমতা বাড়ায়।
featured image - উন্নত অনুভূতি বিশ্লেষণের সিদ্ধান্তের জন্য দুটি এলএলএম ব্যবহার করা
Writings, Papers and Blogs on Text Models HackerNoon profile picture
0-item

লেখক:

(1) Xiaofei Sun, Zhejiang University;

(2) Xiaoya Li, Shannon.AI এবং Bytedance;

(3) Shengyu Zhang, Zhejiang বিশ্ববিদ্যালয়;

(4) শুহে ওয়াং, পিকিং বিশ্ববিদ্যালয়;

(5) ফেই উ, ঝেজিয়াং বিশ্ববিদ্যালয়;

(6) Jiwei Li, Zhejiang University;

(7) Tianwei Zhang, Nanyang প্রযুক্তি বিশ্ববিদ্যালয়;

(8) Guoyin Wang, Shannon.AI এবং Bytedance.

লিঙ্কের টেবিল

বিমূর্ত এবং ভূমিকা

সম্পর্কিত কাজ

সেন্টিমেন্ট বিশ্লেষণের জন্য এলএলএম আলোচনা

পরীক্ষা-নিরীক্ষা

অ্যাবলেশন স্টাডিজ

উপসংহার এবং রেফারেন্স

সেন্টিমেন্ট বিশ্লেষণের জন্য 3 এলএলএম আলোচনা

3.1 ওভারভিউ

এই বিভাগে, আমরা সেন্টিমেন্ট বিশ্লেষণের জন্য মাল্টি-এলএলএম আলোচনার কাঠামোর বিশদ বিবরণ দিই: দুটি এলএলএম উত্তর জেনারেটর এবং বৈষম্যকারী হিসাবে কাজ করে। আমরা জেনারেটর এবং বৈষম্যকারীর মধ্যে মিথস্ক্রিয়াকে একটি আলোচনা হিসাবে উল্লেখ করি। একটি ঐক্যমত্যে না পৌঁছানো পর্যন্ত বা আলোচনার সর্বাধিক সংখ্যা অতিক্রম না করা পর্যন্ত আলোচনার পুনরাবৃত্তি হবে। চিত্র 1 এবং 2 এ দেখানো হয়েছে।

3.2 রিজনিং-ইনফিউজড জেনারেটর

জেনারেটর একটি বৃহৎ ভাষা মডেল দ্বারা ব্যাকবোন করা হয়. আমরা প্রম্পটের মাধ্যমে ICL দৃষ্টান্তের উপর ভিত্তি করে উত্তর জেনারেটরকে জিজ্ঞাসা করি, একটি ধাপে ধাপে যুক্তির চেইন তৈরি করা এবং পরীক্ষার ইনপুটের সেন্টিমেন্ট পোলারিটির দিকে একটি সিদ্ধান্ত নেওয়ার লক্ষ্যে।


প্রম্পট তিনটি উপাদানের সমন্বয়ে গঠিত: একটি টাস্ক বর্ণনা, প্রদর্শন এবং একটি পরীক্ষা ইনপুট। টাস্কের বর্ণনা হল স্বাভাবিক ভাষায় টাস্কের বর্ণনা (যেমন, "দয়া করে পরীক্ষা ইনপুটের সামগ্রিক অনুভূতি নির্ধারণ করুন।"); পরীক্ষার ইনপুট হল পরীক্ষার সেটের পাঠ্য ইনপুট (যেমন, "আকাশ নীল।"); বিক্ষোভ টাস্ক ট্রেন সেট থেকে হয়. প্রতিটি তিনটি উপাদান নিয়ে গঠিত: ইনপুট, যুক্তি চেইন, এবং সংবেদনশীল সিদ্ধান্ত।


প্রতিটি পরীক্ষার ইনপুটের জন্য, আমরা প্রথমে প্রদর্শনী হিসাবে সেট করা ট্রেন থেকে K নিকটতম প্রতিবেশী (ইনপুট, অনুভূতির সিদ্ধান্ত) পুনরুদ্ধার করি। তারপর, আমরা জেনারেটরকে যুক্তির চেইন তৈরি করতে অনুরোধ করে প্রদর্শনগুলিকে (ইনপুট, যুক্তি প্রক্রিয়া, অনুভূতির সিদ্ধান্ত) ত্রিপলে রূপান্তরিত করি। টাস্ক বর্ণনা, প্রদর্শন এবং পরীক্ষার ইনপুট সংযুক্ত করার পরে, আমরা জেনারেটরের কাছে প্রম্পট ফরোয়ার্ড করি, যা ধাপে ধাপে যুক্তি চেইন এবং একটি আবেগপূর্ণ সিদ্ধান্তের সাথে প্রতিক্রিয়া জানাবে।

3.3 ব্যাখ্যা-প্রাপ্ত বৈষম্যকারী

বৈষম্যকারী অন্য এলএলএম দ্বারা পৃষ্ঠপোষক। উত্তর তৈরির প্রক্রিয়া শেষ করার পরে, জেনারেটরের দ্বারা নেওয়া সিদ্ধান্ত সঠিক কিনা তা বিচার করতে এবং একটি যুক্তিসঙ্গত ব্যাখ্যা প্রদান করতে উত্তর বৈষম্যকারী ব্যবহার করা হয়।


এই লক্ষ্যটি সম্পন্ন করার জন্য, আমরা প্রথমে উত্তর বৈষম্যকারীর জন্য প্রম্পট তৈরি করি। প্রম্পটটি চারটি উপাদানের সমন্বয়ে গঠিত: একটি কাজের বিবরণ, প্রদর্শন, একটি পরীক্ষা ইনপুট এবং উত্তর জেনারেটরের প্রতিক্রিয়া। টাস্ক ডিসক্রিপশন হল পাঠ্যের একটি টুকরো যা কাজটিকে স্বাভাবিক ভাষায় বর্ণনা করে (যেমন, "অনুগ্রহ করে নির্ধারণ করুন সিদ্ধান্তটি সঠিক কিনা।")। প্রতিটি প্রদর্শন ছয়টি উপাদানের সমন্বয়ে গঠিত: (ইনপুট পাঠ্য, একটি যুক্তির শৃঙ্খল, অনুভূতির সিদ্ধান্ত, বৈষম্যমূলক মনোভাব, বৈষম্যমূলক ব্যাখ্যা, বৈষম্যকারী সিদ্ধান্ত) এবং ইনপুট পাঠ্যের জন্য অনুভূতির সিদ্ধান্ত কেন সঠিক তা ব্যাখ্যা করার জন্য উত্তর বৈষম্যকারীকে অনুরোধ করে নির্মিত।


তারপর আমরা কনস্ট্রাক্ট প্রম্পট সহ বৈষম্যকারীকে জিজ্ঞাসা করি। উত্তর বৈষম্যকারী একটি টেক্সট স্ট্রিং দিয়ে প্রতিক্রিয়া জানাবে, যেখানে একটি মনোভাব রয়েছে (যেমন, হ্যাঁ, না) যা বোঝায় যে বৈষম্যকারী জেনারেটরের সাথে একমত কিনা, ব্যাখ্যা যা ব্যাখ্যা করে যে কেন বৈষম্যকারী জেনারেটরের সাথে একমত/অসম্মত, এবং একটি বৈষম্যকারী সিদ্ধান্ত যা নির্ধারণ করে পরীক্ষার ইনপুটের অনুভূতি।


কেন দুটি এলএলএম কিন্তু একটি নয়? দুটি ভূমিকা হিসাবে কাজ করার জন্য একটি একক এলএলএম ব্যবহার করার পরিবর্তে জেনারেটর এবং বৈষম্যকারীর জন্য পৃথকভাবে দুটি ভিন্ন এলএলএম ব্যবহার করার দুটি কারণ রয়েছে: (1) যদি একটি এলএলএম ভুল যুক্তির কারণে জেনারেটর হিসাবে ভুল করে, তবে এটি হওয়ার সম্ভাবনা বেশি। এটি বৈষম্যকারীর মতো একই ভুল করবে যেহেতু জেনারেটর এবং একই মডেলের বৈষম্যকারী একই রকম যুক্তি তৈরি করার সম্ভাবনা রয়েছে; (2) দুটি পৃথক মডেল ব্যবহার করে, আমরা দুটি মডেলের পরিপূরক ক্ষমতার সুবিধা নিতে সক্ষম।

3.4 ভূমিকা-ফ্লিপড আলোচনা

দুটি এলএলএম আলোচনার মাধ্যমে শেষ হওয়ার পরে, আমরা তাদের ফ্লিপ ভূমিকা জিজ্ঞাসা করি এবং একটি নতুন আলোচনা শুরু করি, যেখানে দ্বিতীয় এলএলএম জেনারেটর হিসাবে কাজ করে এবং প্রথম এলএলএম বৈষম্যকারী হিসাবে কাজ করে। আমরা ফ্লিপড ভূমিকা সহ দুটি এলএলএম-এর মিথস্ক্রিয়াকে ভূমিকা-ফ্লিপড আলোচনা হিসাবে উল্লেখ করি। একইভাবে, ভূমিকা-ফ্লিপড আলোচনা শেষ হয় যতক্ষণ না একটি ঐক্যমত্যে পৌঁছানো হয় বা আলোচনার সর্বাধিক সংখ্যা অতিক্রম করা হয়।


যখন উভয় আলোচনার ফলাফল একটি চুক্তিতে পরিণত হয় এবং তাদের সিদ্ধান্ত একই হয়, তখন আমরা উভয় সিদ্ধান্তকেই চূড়ান্ত হিসাবে বেছে নিতে পারি যেহেতু তারা একই। আলোচনার একটি যদি ঐকমত্যে পৌঁছাতে ব্যর্থ হয় যখন অন্যটি একটি সিদ্ধান্তে পৌঁছায়, আমরা চূড়ান্ত সিদ্ধান্ত হিসাবে ঐকমত্যে পৌঁছেছে এমন আলোচনা থেকে সিদ্ধান্ত বেছে নিই। যাইহোক, যদি উভয় আলোচনাই ঐকমত্যে পৌঁছায় কিন্তু তাদের সিদ্ধান্তগুলি সারিবদ্ধ না হয়, তাহলে আমাদের একটি অতিরিক্ত ভাষা মডেলের (LLM) সহায়তার প্রয়োজন হবে, যা নীচে আরও বিশদে ব্যাখ্যা করা হবে।"


একটি তৃতীয় এলএলএম প্রবর্তন যদি দুটি আলোচনার সিদ্ধান্ত সারিবদ্ধ না হয়, আমরা একটি তৃতীয় এলএলএম প্রবর্তন করি এবং উপরে উল্লিখিত দুটি এলএলএম-এর প্রত্যেকটির সাথে আলোচনা এবং ভূমিকা-ফ্লিপড আলোচনা পরিচালনা করি। পরবর্তীকালে, আমরা 6টি আলোচনার ফলাফল পাব এবং এই ফলাফলগুলিতে ভোট দেব: যে সিদ্ধান্তটি প্রায়শই প্রদর্শিত হয় তা ইনপুট পরীক্ষার অনুভূতির পোলারিটি হিসাবে নেওয়া হয়।


এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ