paint-brush
পোলারিটি মিনিমাইজেশন লস সহ ফ্রেমিং পক্ষপাত কমানো: পরীক্ষামূলক বিবরণদ্বারা@mediabias
656 পড়া
656 পড়া

পোলারিটি মিনিমাইজেশন লস সহ ফ্রেমিং পক্ষপাত কমানো: পরীক্ষামূলক বিবরণ

দ্বারা Tech Media Bias [Research Publication]2m2024/05/18
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

এই গবেষণাপত্রে, গবেষকরা রাজনৈতিক মেরুকরণের একটি মূল চালক মিডিয়াতে পক্ষপাতিত্বের কথা বলেছেন। তারা প্রতিবেদনে পোলারিটি পার্থক্য কমিয়ে কার্যকরভাবে পক্ষপাত কমাতে একটি নতুন ক্ষতির ফাংশন প্রস্তাব করে।
featured image - পোলারিটি মিনিমাইজেশন লস সহ ফ্রেমিং পক্ষপাত কমানো: পরীক্ষামূলক বিবরণ
Tech Media Bias [Research Publication] HackerNoon profile picture
0-item

এই কাগজটি CC BY-NC-SA 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ।

লেখক:

(1) ইয়েজিন ব্যাং, কৃত্রিম বুদ্ধিমত্তা গবেষণা কেন্দ্র (CAiRE), হংকং ইউনিভার্সিটি অফ সায়েন্স অ্যান্ড টেকনোলজি;

(2) নাইওন লি, সেন্টার ফর আর্টিফিশিয়াল ইন্টেলিজেন্স রিসার্চ (CAiRE), হংকং ইউনিভার্সিটি অফ সায়েন্স অ্যান্ড টেকনোলজি;

(3) Pascale Fung, সেন্টার ফর আর্টিফিশিয়াল ইন্টেলিজেন্স রিসার্চ (CAiRE), হংকং ইউনিভার্সিটি অফ সায়েন্স অ্যান্ড টেকনোলজি।

লিঙ্কের টেবিল

A. পরীক্ষামূলক বিবরণ


BERTSCORE-F1 গুরুত্বপূর্ণ তথ্য মূল্যায়নের জন্য, আমরা টোকেন-এম্বেডিং-ভিত্তিক মেট্রিক BERTSCORE-F1 গ্রহণ করেছি। আমরা অত্যাধুনিক চেকপয়েন্ট হিসেবে (Zhang* et al., 2020) দ্বারা প্রদত্ত প্রাক-প্রশিক্ষিত 'microsoft/deberta-xlarge-mnli' সংস্করণ ব্যবহার করেছি।

A.1 মানব মূল্যায়ন


আমরা 30টি এলোমেলোভাবে নির্বাচিত নমুনার সাথে মূল্যায়ন পরিচালনা করেছি। আমরা দুটি মডেল থেকে দুটি নিবন্ধ (এলোমেলো ক্রমে) প্রদান করি এবং সেই সাথে ইস্যু বাক্য যা নিবন্ধগুলি সম্পর্কে বর্ণনা করে। তারপর, টীকাকারকে "কোন নিবন্ধটি বেশি পক্ষপাতদুষ্ট?" প্রশ্নের উত্তর দিতে বলা হয়, Spinde et al অনুসরণ করে। (2021); লি এট আল। (2022)। আমরা প্রতিটি নমুনার জন্য তিনটি টীকা পাই এবং সংখ্যাগরিষ্ঠ ভোটিং নির্বাচন করি। যেহেতু অনেক পরীক্ষার নমুনা মার্কিন রাজনীতির সাথে ঘনিষ্ঠভাবে জড়িত, তাই মূল্যায়নের সাথে জড়িত কোনো রাজনৈতিক পক্ষপাত বা ব্যক্তিগত পছন্দ কমাতে আমরা তিনজন নন -মার্কিন নাগরিক/জাতীয়/নিবাসী নিয়োগ করেছি। তিনজন টীকাকারই নিজেদেরকে রাজনৈতিক ঝোঁকে মধ্যপন্থী বলে দাবি করেছেন এবং তারা ইংরেজিতে মূল্যায়ন করার যোগ্য (তারা সবাই ইংরেজিতে তাদের তৃতীয় শিক্ষা পেয়েছে)।


জোড়ায় কোনটি পক্ষপাতদুষ্ট নির্বাচনটি এলোমেলো নয় তা যাচাই করার জন্য, মূল্যায়নের ফলাফল পাওয়ার পর একটি দ্বিপদ পরীক্ষা করা হয়। নাল হাইপোথিসিসটি ছিল "এলআর-ইনফো (আমাদের প্রস্তাবিত পদ্ধতি) থেকে কম পক্ষপাতিত্বের জন্য তৈরি নিবন্ধগুলির নির্বাচন র্যান্ডম"। তারপরে, আমরা 0.019 এর একটি পি-মান পেয়েছি, যা নাল হাইপোথিসিস (p <0.05) প্রত্যাখ্যান করেছে। তাই, কম পক্ষপাতমূলক হতে LR-INFO থেকে উত্পন্ন নিবন্ধগুলির নির্বাচন এলোমেলো নয়।


যখন মডেলটিকে পোলারিটি মিনিমাইজেশন লসের সাথে প্রশিক্ষিত করা হয়, তখন এটি BARTNEUSFT-T ক্ষতিগ্রস্ত হওয়ার সময় পক্ষপাত-প্ররোচিত তথ্য অপসারণ করতে শিখতে পারে। সারণি 4-এ যেমন দেখানো হয়েছে, আমাদের মডেল LR-INFO পক্ষপাত-প্ররোচিত তথ্য "ট্রাম্প প্রেসিডেন্ট জো বিডেনের অভিবাসন নীতিতে আক্রমণ করবেন বলে আশা করা হচ্ছে" সারাংশ থেকে "CPAC-তে ট্রাম্প কথা বলবেন" এর সারাংশ থেকে সরাতে পারে যখন BARTNEUSFTT এটি অপসারণ করতে ব্যর্থ হয়।


সারণি 4: মানব মূল্যায়ন উদাহরণ।



সারণী 5: প্রস্তাবিত পোলারিটি মিনিমাইজেশন লস, LR-VALENCE, LRAROUSAL, LR-INFO, LRC-AROUSAL, LRC-ইনফো, বিভিন্ন ওজন (λ) সহ আমাদের মডেলগুলির জন্য পরীক্ষামূলক ফলাফল। বায়াস মেট্রিক ফ্রেম করার জন্য, নিম্ন সংখ্যাটি ভাল (↓)। অন্যান্য স্কোরের জন্য, উচ্চতর নম্বরটি ভাল (↑)। পোলারিটি মিনিমাইজেশন লস সহ আমাদের মডেলগুলির ফলাফলগুলি (যেগুলি + দিয়ে বোঝায়) সেরা λ দিয়ে রিপোর্ট করা হয়েছে। λ-এর সম্পূর্ণ অন্বেষণ পরিশিষ্ট এবং চিত্র 2-এ উপলব্ধ