paint-brush
মিডিয়ার বহুভাষিক মোটা রাজনৈতিক অবস্থানের শ্রেণীবিভাগ: স্বীকৃতি এবং উল্লেখদ্বারা@mediabias
103 পড়া

মিডিয়ার বহুভাষিক মোটা রাজনৈতিক অবস্থানের শ্রেণীবিভাগ: স্বীকৃতি এবং উল্লেখ

দ্বারা Tech Media Bias [Research Publication]6m2024/05/19
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

এই কাগজে, গবেষকরা প্রামাণিক নিউজ আউটলেট রেটিং ব্যবহার করে AI-উত্পন্ন সংবাদ নিবন্ধগুলির নিরপেক্ষতা এবং বিভিন্ন ভাষা জুড়ে অবস্থানের বিবর্তন বিশ্লেষণ করেছেন।
featured image - মিডিয়ার বহুভাষিক মোটা রাজনৈতিক অবস্থানের শ্রেণীবিভাগ: স্বীকৃতি এবং উল্লেখ
Tech Media Bias [Research Publication] HackerNoon profile picture
0-item

এই কাগজটি CC BY-NC-SA 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ।

লেখক:

(1) Cristina España-Bonet, DFKI GmbH, সারল্যান্ড ইনফরমেটিক্স ক্যাম্পাস।

লিঙ্কের টেবিল

স্বীকৃতি

লেখক অন্তর্দৃষ্টিপূর্ণ মন্তব্য এবং আলোচনার জন্য বেনামী পর্যালোচকদের ধন্যবাদ. Eran dos ifs.

তথ্যসূত্র

জুলিয়েন আবাদজি, পেড্রো জাভিয়ের অর্টিজ সুয়ারেজ, লরেন্ট রোমারি এবং বেনোইট সাগোট। 2021. Ungoliant: একটি খুব বড় আকারের বহুভাষিক ওয়েব কর্পাস তৈরির জন্য একটি অপ্টিমাইজ করা পাইপলাইন৷ বৃহৎ কর্পোরা (CMLC-9) 2021-এর ব্যবস্থাপনায় চ্যালেঞ্জ সম্পর্কিত কর্মশালার কার্যপ্রণালী। লিমেরিক, 12 জুলাই 2021 (অনলাইন-ইভেন্ট), পৃষ্ঠা 1-9, ম্যানহেইম। LeibnizInstitut für Deutsche Sprache.


দিমিত্রি আকসেনভ, পিটার বোর্গঞ্জে, ক্যারোলিনা জাকজিনস্কা, মাল্টে ওস্টেনডর্ফ, জুলিয়ান মোরেনো-শ্নেইডার এবং জর্জ রেহম। 2021. জার্মান সংবাদে রাজনৈতিক পক্ষপাতের সূক্ষ্ম শ্রেণীবিভাগ: একটি ডেটা সেট এবং প্রাথমিক পরীক্ষা। অনলাইন অপব্যবহার এবং ক্ষতি (WOAH 2021), পৃষ্ঠা 121-131, অনলাইনে 5 তম কর্মশালার কার্যধারায়। কম্পিউটেশনাল ভাষাবিজ্ঞানের জন্য সমিতি।


র‌্যামি বালি, জিওভানি দা সান মার্টিনো, জেমস গ্লাস এবং প্রেসলাভ নাকভ। 2020. আমরা আপনার পক্ষপাত সনাক্ত করতে পারি: সংবাদ নিবন্ধগুলির রাজনৈতিক মতাদর্শের পূর্বাভাস। প্রাকৃতিক ভাষা প্রক্রিয়াকরণে (EMNLP) 2020 সম্মেলনের কার্যপ্রণালীতে, পৃষ্ঠা 4982–4991, অনলাইন। কম্পিউটেশনাল ভাষাবিজ্ঞানের জন্য সমিতি।


মিকাহ ক্যারল, অ্যালান চ্যান, হেনরি অ্যাশটন এবং ডেভিড ক্রুগার। 2023. এআই সিস্টেম থেকে চরিত্রগত ম্যানিপুলেশন। arXiv প্রিপ্রিন্ট arXiv:2303.09387।


লিংজিয়াও চেন, মাতেই জাহারিয়া এবং জেমস জু। 2023. সময়ের সাথে সাথে ChatGPT-এর আচরণ কীভাবে পরিবর্তিত হচ্ছে? arXiv প্রিপ্রিন্ট arXiv:2307.09009।


অ্যালেক্সিস কনেউ, কার্তিকে খান্ডেলওয়াল, নমন গোয়াল, বিশ্ব চৌধুরী, গুইলাম ওয়েনজেক, ফ্রান্সিসকো গুজমান, এডোয়ার্ড গ্রেভ, মাইল ওট, লুক জেটলমোয়ার এবং ভেসেলিন স্টোয়ানভ। 2020. স্কেল এ তত্ত্বাবধানহীন ক্রস-লিঙ্গুয়াল রিপ্রেজেন্টেশন লার্নিং। অ্যাসোসিয়েশন ফর কম্পিউটেশনাল লিঙ্গুইস্টিকসের 58তম বার্ষিক সভার কার্যপ্রণালীতে, পৃষ্ঠা 8440– 8451, অনলাইন। কম্পিউটেশনাল ভাষাবিজ্ঞানের জন্য সমিতি।


অমিত দেশপান্ডে, বিশ্বক মুরাহরি, তন্ময় রাজপুরোহিত, অশ্বিন কল্যাণ, এবং কার্তিক নরসিমহন। 2023. চ্যাটজিপিটি-তে বিষাক্ততা: ব্যক্তি-নির্ধারিত ভাষার মডেল বিশ্লেষণ করা। arXiv প্রিপ্রিন্ট arXiv:2304.05335।


ক্রিস্টিনা এস্পানা-বোনেট। 2023. মিডিয়ার বহুভাষিক মোটা রাজনৈতিক অবস্থানের শ্রেণীবিভাগ। একটি চ্যাটজিপিটি এবং বার্ড সংবাদপত্রের সম্পাদকীয় লাইন। Zenodo, v1.0-এ ডেটাসেট।


হোসে আন্তোনিও গার্সিয়া-ডিয়াজ, রিকার্ডো কলোমো-পালাসিওস এবং রাফায়েল ভ্যালেন্সিয়া-গার্সিয়া। 2022. রাজনৈতিক মতাদর্শের উপর ভিত্তি করে সাইকোগ্রাফিক বৈশিষ্ট্য সনাক্তকরণ: 2020 সালে পোস্ট করা স্প্যানিশ রাজনীতিবিদদের টুইটের উপর একজন লেখক বিশ্লেষণ অধ্যয়ন। ভবিষ্যতের জেনার। কম্পিউট সিস্টেম।, 130(C):59-74।


Xinyang Geng, Arnav Gudibande, Hao Liu, Eric Wallace, Pieter Abbeel, Sergey Levine, and Dawn Song. 2023. কোয়ালা: একাডেমিক গবেষণার জন্য একটি সংলাপ মডেল। ব্লগ পোস্ট.


গুগল 2023. বার্ড [নির্দেশ-অনুসরণ বড় ভাষা মডেল]।


জোচেন হার্টম্যান, জ্যাসপার শোয়েনজো এবং ম্যাক্সিমিলিয়ান উইটে। 2023. কথোপকথনমূলক এআইয়ের রাজনৈতিক মতাদর্শ: চ্যাটজিপিটি-এর পরিবেশগত, বাম-স্বাধীনতাবাদী অভিমুখে একান্তরিত প্রমাণ। arXiv প্রিপ্রিন্ট arXiv:2301.01768।


Xiaowei Huang, Wenjie Ruan, Wei Huang, Gaojie Jin, Yi Dong, Changshun Wu, Saddek Bensalem, Ronghui Mu, Yi Qi, Xingyu Zhao, et al. 2023. যাচাইকরণ এবং বৈধতার লেন্সের মাধ্যমে বড় ভাষার মডেলগুলির নিরাপত্তা এবং বিশ্বস্ততার একটি সমীক্ষা। arXiv প্রিপ্রিন্ট arXiv:2305.11391।


মরিস জ্যাকেশ, অদ্বৈত ভাট, ড্যানিয়েল বুশেক, লিওর জালম্যানসন এবং মোর নামান। 2023. মতামতযুক্ত ভাষার মডেলের সাথে সহ-লেখা ব্যবহারকারীদের মতামতকে প্রভাবিত করে। কম্পিউটিং সিস্টেমে হিউম্যান ফ্যাক্টরস অন 2023 সিএইচআই কনফারেন্সের কার্যপ্রণালীতে, পৃষ্ঠা 1-15, নিউ ইয়র্ক, এনওয়াই, ইউএসএ। কম্পিউটিং মেশিনের পরিষদ.


জোহানেস কিজেল, মারিয়া মেস্ত্রে, ঋষভ শুক্লা, ইমানুয়েল ভিনসেন্ট, পায়ম আদিনেহ, ডেভিড কর্নি, বেনো স্টেইন এবং মার্টিন পোথাস্ট। 2019. SemEval2019 টাস্ক 4: হাইপারপার্টিসান নিউজ ডিটেকশন। শব্দার্থিক মূল্যায়নের উপর 13 তম আন্তর্জাতিক কর্মশালার কার্যক্রমে, পৃষ্ঠা 829-839, মিনিয়াপোলিস, মিনেসোটা, মার্কিন যুক্তরাষ্ট্র। কম্পিউটেশনাল ভাষাবিজ্ঞানের জন্য সমিতি।


বিবেক কুলকার্নি, জান্টিং ইয়ে, স্টিভ স্কিয়েনা এবং উইলিয়াম ইয়াং ওয়াং। 2018. সংবাদ নিবন্ধগুলির রাজনৈতিক মতাদর্শ সনাক্তকরণের জন্য মাল্টি-ভিউ মডেল। প্রাকৃতিক ভাষা প্রক্রিয়াকরণে 2018 সালের সম্মেলনের কার্যপ্রণালীতে, পৃষ্ঠা 3518-3527, ব্রাসেলস, বেলজিয়াম। কম্পিউটেশনাল ভাষাবিজ্ঞানের জন্য সমিতি।


অ্যান্ড্রু ক্যাচাইটস ম্যাককালাম। 2002. MALLET: ভাষা টুলকিটের জন্য একটি মেশিন লার্নিং। http://mallet.cs.umass.edu।


ফ্যাবিও মোটোকি, ভালদেমার পিনহো নেটো এবং ভিক্টর রদ্রিগেস। 2023. মানুষের চেয়ে বেশি মানুষ: ChatGPT রাজনৈতিক পক্ষপাত পরিমাপ করা। পাবলিক চয়েস।


নিকলাস মুয়েনিঘোফ, থমাস ওয়াং, লিন্টাং সুতাভিকা, অ্যাডাম রবার্টস, স্টেলা বিডারম্যান, তেভেন লে স্কাও, এম সাইফুল বারি, শেং শেন, ঝেং জিন ইয়ং, হেইলি শোয়েলকপফ, জিয়াংরু ট্যাং, ড্রগোমির রাদেভ, আলহাম ফিকরি আজি, খালিদ আলমুবারক, জায়েদ আলমুবারক আল্যাফেই, আলবার্ট ওয়েবসন, এডওয়ার্ড রাফ এবং কলিন রাফেল। 2023. মাল্টিটাস্ক ফাইনটিউনিংয়ের মাধ্যমে ক্রসলিঙ্গুয়াল সাধারণীকরণ। অ্যাসোসিয়েশন ফর কম্পিউটেশনাল লিঙ্গুইস্টিকসের 61তম বার্ষিক সভার কার্যক্রমে (ভলিউম 1: লং পেপারস), পৃষ্ঠা 15991-16111, টরন্টো, কানাডা। কম্পিউটেশনাল ভাষাবিজ্ঞানের জন্য সমিতি।


রেইচিরো নাকানো, জ্যাকব হিলটন, সুচির বালাজি, জেফ উ, লং ওয়াং, ক্রিস্টিনা কিম, ক্রিস্টোফার হেসে, শান্তনু জৈন, ভিনিত কোসারাজু, উইলিয়াম সন্ডার্স, এট আল। 2021. WebGPT: মানুষের প্রতিক্রিয়া সহ ব্রাউজার-সহায়ক প্রশ্নের উত্তর। arXiv প্রিপ্রিন্ট arXiv:2112.09332।


রবার্তো নাভিগলি, সিমোন কোনিয়া এবং বজর্ন রস। 2023. বৃহৎ ভাষার মডেলে পক্ষপাত: উৎপত্তি, তালিকা, এবং আলোচনা। J. ডেটা এবং তথ্যের গুণমান, 15(2)।


OpenAI। 2023. ChatGPT [নির্দেশ-অনুসরণ বড় ভাষা মডেল]।


পেড্রো জাভিয়ের অরটিজ সুয়ারেজ, বেনোইট সাগোট এবং লরেন্ট রোমারি। 2019. মাঝারি থেকে নিম্ন সম্পদ অবকাঠামোতে বিশাল কর্পোরা প্রক্রিয়াকরণের জন্য অসিঙ্ক্রোনাস পাইপলাইন। বৃহৎ কর্পোরা (CMLC-7) 2019 এর ব্যবস্থাপনায় চ্যালেঞ্জের উপর কর্মশালার কার্যক্রম। কার্ডিফ, 22শে জুলাই 2019, পৃষ্ঠা 9-16, ম্যানহেইম। Leibniz-Institut für Deutsche Sprache.


লং ওউয়াং, জেফরি উ, জু জিয়াং, ডিয়োগো আলমেদা, ক্যারল ওয়েনরাইট, পামেলা মিশকিন, চং ঝাং, সন্ধিনি আগরওয়াল, ক্যাটারিনা স্লামা, অ্যালেক্স রে, জন শুলম্যান, জ্যাকব হিলটন, ফ্রেজার কেল্টন, লুক মিলার, ম্যাডি সিমেনস, পিটার আস্কেল , পল এফ ক্রিশ্চিয়ানো, জ্যান লেইক এবং রায়ান লো। 2022. মানুষের প্রতিক্রিয়া সহ নির্দেশাবলী অনুসরণ করার জন্য ভাষা মডেল প্রশিক্ষণ। নিউরাল ইনফরমেশন প্রসেসিং সিস্টেমের অগ্রগতিতে, ভলিউম 35, পৃষ্ঠা 27730–27744। Curran Associates, Inc.


ডেভিড রোজাডো। 2023. মেশিনে বিপদ: এআই সিস্টেমে এমবেডেড রাজনৈতিক ও জনসংখ্যাগত পক্ষপাতের বিপদ। ম্যানহাটন ইনস্টিটিউ, ইস্যু ব্রিফ, পৃষ্ঠা 1-16।


ড্যানিয়েল রুশো, সালুদ মারিয়া জিমেনেজ-জাফরা, হোসে আন্তোনিও গার্সিয়া-ডিয়াজ, টমাসো ক্যাসেলি, এল. আলফোনসো উরেনালোপেজ এবং রাফায়েল ভ্যালেন্সিয়া-গার্সিয়া। 2023. EVALITA 2023 এ PoliticIT: ইতালীয় টেক্সট টাস্কে রাজনৈতিক মতাদর্শ সনাক্তকরণের ওভারভিউ। ইতালীয় 2023-এর জন্য প্রাকৃতিক ভাষা প্রক্রিয়াকরণ এবং বক্তৃতা সরঞ্জামগুলির অষ্টম মূল্যায়ন প্রচারাভিযানে, CEUR ওয়ার্কশপ প্রসিডিংস, আচেনে 3473 নম্বর।


রোহান তাওরি, ইশান গুলরাজানি, তিয়ানই ঝাং, ইয়ান দুবোইস, জুয়েচেন লি, কার্লোস গেস্ট্রিন, পার্সি লিয়াং এবং তাতসুনোরি বি হাশিমোটো। 2023. স্ট্যানফোর্ড আলপাকা: একটি নির্দেশ-অনুসরণকারী LLaMA মডেল। https://github.com/tatsu-lab/stanford_alpaca।


হুগো টুভরন, লুই মার্টিন, কেভিন স্টোন, পিটার অ্যালবার্ট, আমজাদ আলমাহাইরি, ইয়াসমিন বাবাই, নিকোলে বাশলাইকভ, সৌম্য বাত্রা, প্রজ্জ্বল ভার্গব, শ্রুতি ভোসলে, ড্যান বিকেল, লুকাস ব্লেচার, ক্রিস্টিয়ান ক্যান্টন ফেরার, মোয়া চেন, গুইলেম কুকুরুল, ডেভিড জুবেল, সৌম্য। ফার্নান্দেস, জেরেমি ফু, ওয়েনিন ফু, ব্রায়ান ফুলার, সিনথিয়া গাও, ভেদানুজ গোস্বামী, নমন গোয়াল, অ্যান্টনি হার্টশর্ন, সাগর হোসেইনি, রুই হাউ, হাকান ইনান, মারসিন কারদাস, ভিক্টর কারকেজ, মাদিয়ান খাবসা, ইসাবেল ক্লুম্যান, আর্টেম সিং কোরেনেভ। , মারি-অ্যান ল্যাচক্স, থিবাউট লাভরিল, জেনিয়া লি, ডায়ানা লিসকোভিচ, ইংহাই লু, ইউনিং মাও, জেভিয়ার মার্টিনেট, টোডর মিহাইলভ, পুষ্কর মিশ্র, ইগর মলি-বগ, ইক্সিন নি, অ্যান্ড্রু পল্টন, জেরেমি রেইজেনস্টাইন, রাশি সালাদিতা, অ্যালান শেল্টেন, রুয়ান সিলভা, এরিক মাইকেল স্মিথ, রঞ্জন সুব্রামানিয়ান, জিয়াওকিং এলেন তান, বিন তাং, রস টেলর, আদিনা উইলিয়ামস, জিয়ান জিয়াং কুয়ান, পুক্সিন জু, ঝেং ইয়ান, ইলিয়ান জারভ, ইউচেন ঝাং, অ্যাঞ্জেলা ফ্যান, মেলানি কাম্বাদুর, শরণ নারং। , অরেলিয়ান রদ্রিগেজ, রবার্ট স্টোজনিক, সের্গেই এডুনভ, এবং থমাস স্শিয়ালম। 2023. লামা 2: ওপেন ফাউন্ডেশন এবং ফাইনটিউনড চ্যাট মডেল। arXiv প্রিপ্রিন্ট arXiv:2307.09288।


ইভা এএম ভ্যান ডিস, জোহান বোলেন, উইলেম জুইডেমা, রবার্ট ভ্যান রুইজ এবং ক্লাউডি এল. বকটিং। 2023. ChatGPT: গবেষণার জন্য পাঁচটি অগ্রাধিকার। প্রকৃতি, 614(7947):224-226।


বক্সিন ওয়াং, ওয়েইক্সিন চেন, হেংঝি পেই, চুলিন জি, মিন্টং কাং, চেনহুই ঝাং, চেজিয়ান জু, জিডি জিওং, রিতিক দত্ত, রাইলান শ্যাফার, এট আল। 2023a. ডিকোডিং ট্রাস্ট: GPT মডেলগুলিতে বিশ্বস্ততার একটি ব্যাপক মূল্যায়ন। arXiv প্রিপ্রিন্ট arXiv:2306.11698।


Yizhong Wang, Yeganeh Kordi, স্বরূপ মিশ্র, Alisa Liu, Noah A. Smith, Daniel Khashabi, and Hannaneh Hajishirzi। 2023 খ. স্ব-নির্দেশ: স্ব-উত্পাদিত নির্দেশাবলীর সাথে ভাষার মডেলগুলি সারিবদ্ধ করা। অ্যাসোসিয়েশন ফর কম্পিউটেশনাল লিঙ্গুইস্টিকসের 61তম বার্ষিক সভার কার্যক্রমে (ভলিউম 1: লং পেপারস), পৃষ্ঠা 13484-13508, টরন্টো, কানাডা। কম্পিউটেশনাল ভাষাবিজ্ঞানের জন্য সমিতি।


ইজহং ওয়াং, স্বরূপ মিশ্র, পেগাহ আলিপুরমোলাবাশি, ইয়েগানেহ কোর্ডি, আমিররেজা মির্জাই, অথর্ব নায়েক, অর্জুন অশোক, অরুত সেলভান ধানসেকরন, অঞ্জনা অরুণকুমার, ডেভিড স্ট্যাপ, এশান পাঠক, জিয়ানিস কারামানোলাকিস, হাইজি লাই, কিরশানি, ইসবাই, মনিসন লাই, আইজিও। কুজনিয়া, ক্রিমা দোশি, কুন্তল কুমার পাল, মৈত্রেয় প্যাটেল, মেহরাদ মোরাদশাহী, মিহির পারমার, মিরালি পুরোহিত, নীরজ বর্ষনে, ফণী রোহিত কাজা, পুলকিত ভার্মা, রাভসেহজ সিং পুরী, রুশং কারিয়া, সাভান দোশি, শৈলজা কেয়ুর সম্পাত, সিদ্ধার্থ রেড্ডি, সিদ্ধার্থ মিস। এ, সুমন্ত পাত্রো, তনয় দীক্ষিত এবং জুডং শেন। 2022. সুপার-ন্যাচারাল ইনস্ট্রাকশন: 1600+ NLP টাস্কে ঘোষণামূলক নির্দেশের মাধ্যমে সাধারণীকরণ। প্রাকৃতিক ভাষা প্রক্রিয়াকরণে অভিজ্ঞতামূলক পদ্ধতির 2022 সম্মেলনের কার্যপ্রণালীতে, পৃষ্ঠা 5085-5109, আবুধাবি, সংযুক্ত আরব আমিরাত। কম্পিউটেশনাল ভাষাবিজ্ঞানের জন্য সমিতি।


জেসন ওয়েই, মারটেন বোসমা, ভিনসেন্ট ঝাও, কেলভিন গু, অ্যাডামস ওয়েই ইউ, ব্রায়ান লেস্টার, নান ডু, অ্যান্ড্রু এম ডাই এবং কুওক ভি লে। 2022. ফাইনটিউনড ল্যাঙ্গুয়েজ মডেল শূন্য-শট লার্নার্স। শেখার প্রতিনিধিত্বের আন্তর্জাতিক সম্মেলনে।