この論文は、CC BY-NC-SA 4.0 DEED ライセンスの下で arxiv で公開されています。
著者:
(1)クリスティーナ・エスパーニャ・ボネット、DFKI GmbH、ザールラント情報学キャンパス。
メディアソースには編集方針とそれに伴う偏りがあります。人間にとって政治的偏りを取り除くことは困難ですが、それを認識することでニュースの全体像を把握するのに役立ちます。偏りは明らかな場合や有害なテキストの形で現れる場合もありますが、微妙で検出が難しい場合もあります。これらの微妙な隠れた偏りは潜在的に危険であり、気付かないうちに操作につながります。この研究では、ChatGPT と Bard の背後にある微妙な政治的偏り、つまりペルソナの役割を割り当てずに現れる偏りを体系的に研究しました (Deshpande et al., 2023)。ChatGPT の方向性は時間とともに変化し、言語によって異なることを示しました。2023 年 2 月から 8 月の間に、ChatGPT は左派から中立派の政治的方向性に移行し、英語とスペイン語では途中で右寄りの期間がありました。Bard の進化はまだ研究できません。2023 年 8 月現在のバージョンでは、研究対象の 4 つの言語で一貫して左派を示しています。この偏りは、モデルが生成する事実上の誤りとは無関係であり、ユーザーも考慮する必要があります。私たちは、ゼロショットアプローチを使用して、米国、ドイツ、スペイン、および密接に関連する政治的コンテキストと言語のテキスト生成におけるバイアスを定期的にチェックするためのモデルを提供します。
分析の副産物として、政治的立場とトピックの大まかな注釈が付いた120万件の新聞記事の多言語コーパスを作成しました。コーパスが多様である限り、遠隔監視によって大まかな政治的立場の分類のための意味のあるモデルを構築できることを示しています。このデータは、LM世代とコードとともにZenodo(España-Bonet、2023)とGithubを通じて公開しています。[12]
[12] https://github.com/cristinae/docTransformer