この論文は、CC BY-NC-SA 4.0 DEED ライセンスの下で arxiv で公開されています。
著者:
(1)香港科技大学人工知能研究センター(CAiRE)、イェジン・バン氏
(2)香港科技大学人工知能研究センター(CAiRE)のナヨン・リー氏
(3)香港科技大学人工知能研究センター(CAiRE)、パスカル・ファング氏
この研究は、ベンチマークの英語ベースのタスク設定に固執しているため、限界があります。分析は、米国と英語の政治思想に限定されています。さらに、BART モデルの 1024 サブトークンの入力制限により、入力として含めることができる偏ったソース記事の数が制限されます。これらの制限は、研究結果の範囲に影響を与える可能性がありますが、自然言語処理の研究では珍しいことではないことに注意してください。とはいえ、将来の研究では、より広範な政治思想 (米国以外の政治思想) と言語に対する代替方法を検討し、より包括的な範囲のソース記事をキャプチャするためにより長い入力テキストを組み込むことで、これらの制限に対処することでメリットが得られる可能性があります。
フレーミングによる偏向記事の問題は、特定の人物、グループ、またはトピックに対する読者の意見に影響を与え、分極化につながる可能性があるため、広く研究されてきました。この問題に対処するために、私たちの研究では、モデルが生成された要約のフレーミングバイアスを削減できるように組み込むことができる損失関数の導入に焦点を当てています。
しかし、自動技術は、その広範な影響を慎重に考慮して開発されなければ、意図しない悪影響をもたらす可能性もあることを認識することが重要です。たとえば、機械学習モデルは出力にバイアスを導入し、既知のソースバイアスを別の形式のバイアスに置き換える可能性があります (Lee et al., 2022)。このリスクを軽減するために、Lee et al. (2022) は、自動生成された中立的な要約と一緒にソース記事を明示的に記載することを提案しています。さらに、私たちの研究は人間が生成した記事のフレーミングバイアスを取り除くことを目的としていますが、生成時に幻覚が生じる可能性があり、これは生成モデルのよく知られた問題です (Ji et al., 2023)。したがって、このような自動技術を実際のユースケースに実装する場合は、ガードレール (ソース参照の提供など) を装備することが重要です。
これらの課題にもかかわらず、私たちの研究は、社会の二極化を減らすために、人間が作り出したフレーミングバイアスを軽減する取り組みに貢献することができます。使用例の 1 つは、フレーミングバイアスのないマルチビュー合成記事を提供するプロセスで人間の専門家を支援することです。より広範な社会的影響の観点から、私たちの研究がオンラインユーザーがオンラインでより多くの二極化されていない情報にアクセスできるようにすることに役立つことを願っています。
2021. センター – 「センター」メディアバイアス評価とは何を意味するのでしょうか?
Ramy Baly、Giovanni Da San Martino、James Glass、Preslav Nakov。2020年。「私たちはあなたの偏見を検出できます:ニュース記事の政治的イデオロギーを予測します。」2020年自然言語処理における経験的手法に関する会議(EMNLP)の議事録、4982〜4991ページ、オンライン。計算言語学協会。
Adriana Beratšová、Kristína Krchová、Nikola Gažová、Michal Jirásek。 2016. フレーミングとバイアス:最近の研究結果に関する文献レビュー。セントラルヨーロッパ経営ジャーナル、3(2)。
デニス・チョンとジェームズ・N・ドラックマン。2007年。「フレーミング理論」Annu. Rev. Polit. Sci.、10:103–126。
ロバート・M・エントマン。2002年。「フレーミング:断片化されたパラダイムの明確化に向けて」。マックウェイルのマスコミュニケーション理論読本。ロンドン、カリフォルニアおよびニューデリー:セージ。
ロバート・M・エントマン。2007年。「フレーミングバイアス:権力の分配におけるメディア」コミュニケーションジャーナル、57(1):163–173。
ロバート・M・エントマン。2010年。「メディアのフレーミングバイアスと政治力:2008年の選挙報道における偏向の説明」ジャーナリズム、11(4):389–408。
Alexander R Fabbri、Irene Li、Tianwei She、Suyi Li、Dragomir R Radev。2019。マルチニュース:大規模なマルチドキュメント要約データセットと抽象階層モデル。arXiv プレプリント arXiv:1906.01749
Lisa Fan、Marshall White、Eva Sharma、Ruisi Su、Prafulla Kumar Choubey、Ruihong Huang、Lu Wang。2019年。「明白な光景:事実報道のレンズを通して見るメディアの偏り」arXivプレプリントarXiv:1909.02670。
マシュー・ゲンツコウとジェシー・M・シャピロ。2006年。「メディアの偏りと評判」政治経済ジャーナル、114(2):280–316。
マシュー・ゲンツコウ、ジェシー・M・シャピロ、ダニエル・F・ストーン。2015年。「市場におけるメディアバイアス:理論」。メディア経済学ハンドブック第1巻、623~645ページ。エルゼビア。
アーヴィング・ゴフマン。1974年。フレーム分析:経験の組織化に関するエッセイ。ハーバード大学出版局
フェリックス・ハンボルグ、カルステン・ドネイ、ベラ・ギップ。2019年。ニュース記事におけるメディアバイアスの自動識別:学際的な文献レビュー。国際デジタル図書館ジャーナル、20(4):391–415。
Felix Hamborg、Norman Meuschke、Bela Gipp。2017。「マトリックスベースのニュースアグリゲーション:さまざまなニュースの視点を探る」。2017 ACM/IEEE Joint Conference on Digital Libraries (JCDL)、1~10 ページ。IEEE。
Ziwei Ji、Nayeon Lee、Rita Frieske、Tiezheng Yu、Dan Su、Yan Xu、Etsuko Ishii、Ye Jin Bang、Andrea Madotto、およびPascale Fung。2023。自然言語生成における幻覚の調査。ACM Comput. Surv.、55(12)。
ダニエル・カーネマンとエイモス・トヴェルスキー。2013年。「プロスペクト理論:リスク下での意思決定の分析」。金融意思決定の基礎ハンドブック:パートI、99~127ページ。ワールドサイエンティフィック。
Philippe Laban と Marti A Hearst。2017 年。newslens: 広範囲にわたるニュース ストーリーの構築と視覚化。Events and Stories in the News Workshop の議事録、1 ~ 9 ページ。
Nayeon Lee、Yejin Bang、Tiezheng Yu、Andrea Madotto、および Pascale Fung。2022。NeuS:フレーミングバイアスを軽減するための中立的なマルチニュース要約。2022年北米支部計算言語学会会議議事録:人間言語技術、3131〜3148ページ、シアトル、米国。計算言語学会。
Mike Lewis、Yinhan Liu、Naman Goyal、Marjan Ghazvininejad、Abdelrahman Mohamed、Omer Levy、Ves Stoyanov、およびLuke Zettlemoyer。2019年。Bart:自然言語の生成、翻訳、および理解のためのシーケンスツーシーケンスの事前トレーニングによるノイズ除去。arXivプレプリントarXiv:1910.13461。
Yujian Liu、Xinliang Frederick Zhang、David Wegsman、Nicholas Beauchamp、Lu Wang。2022年。政治:イデオロギー予測とスタンス検出のための同一ストーリー記事比較による事前トレーニング。計算言語学協会の調査結果:NAACL 2022、1354~1374ページ、シアトル、米国。計算言語学協会。
Saif Mohammad. 2018. 20,000 の英語単語に対する、人間による信頼性の高い価、覚醒度、優位性の評価の取得。第 56 回計算言語学会年次会議の議事録 (第 1 巻: 長文論文)、174 ~ 184 ページ。
Fred Morstatter、Liang Wu、Uraz Yavanoglu、Stephen R Corman、Huan Liu。2018年。オンラインニュースにおけるフレーミングバイアスの特定。ACM Transactions on Social Computing、1(2):1–18。
Kishore Papineni、Salim Roukos、Todd Ward、WeiJing Zhu。2002。Bleu: 機械翻訳の自動評価方法。計算言語学会第 40 回年次会議の議事録、311 ~ 318 ページ。
Souneil Park、Seungwoo Kang、Sangyoung Chung、Junehwa Song。2009。「Newscube: メディアの偏りを軽減するためにニュースのさまざまな側面を配信する」。コンピューティング システムにおける人間工学に関する SIGCHI カンファレンスの議事録、443 ~ 452 ページ。
Dietram A Scheufele. 2000. アジェンダ設定、プライミング、フレーミングの再考:政治的コミュニケーションの認知効果に関する新たな考察。マスコミュニケーションと社会、3(2-3):297–316。
All Sides。2018年。メディア偏向評価。Allsides.com。
Timo Spinde、Christina Kreuter、Wolfgang Gaissmaier、Felix Hamborg、Bela Gipp、Helge Giese。2021年。偏っていると思いますか?メディアの偏りの認識を求める方法。2021 ACM/IEEE Joint Conference on Digital Libraries (JCDL)、61~69ページ。IEEE。
Esther van den Berg と Katja Markert。2020。情報バイアス検出におけるコンテキスト。第 28 回国際計算言語学会議の議事録、6315 ~ 6326 ページ、バルセロナ、スペイン (オンライン)。国際計算言語学委員会。
ジョージ・ライトとポール・グッドウィン。2002年。「もっとよく考える」ための簡単な指示と管理職経験のある回答者によるフレーミングバイアスの排除:『フレームを破る』についてのコメント。戦略管理ジャーナル、23(11):1059–1067。
Jingqing Zhang、Yao Zhao、Mohammad Saleh、Peter J. Liu。2019a。Pegasus: 抽象要約のための抽出されたギャップ文による事前トレーニング。
Tianyi Zhang*、Varsha Kishore*、Felix Wu*、Kilian Q. Weinberger、Yoav Artzi。2020。Bertscore: bert によるテキスト生成の評価。International Conference on Learning Representations にて。
Yifan Zhang、Giovanni Da San Martino、Alberto BarrónCedeno、Salvatore Romeo、Jisun An、Haewoon Kwak、Todor Staykovski、Israa Jaradat、Georgi Karadzhov、Ramy Baly、他。2019b。Tanbih: 読んでいるものを知ってください。EMNLP-IJCNLP 2019、223ページ。