paint-brush
ヨーロッパにおけるニュースと誤情報の消費:結果と考察@newsbyte
150 測定値

ヨーロッパにおけるニュースと誤情報の消費:結果と考察

NewsByte.Tech9m2024/06/07
Read on Terminal Reader

長すぎる; 読むには

この論文では、研究者らがヨーロッパのニュース消費パターン、誤情報のソース、Twitter 上の視聴者の行動を分析しています。
featured image - ヨーロッパにおけるニュースと誤情報の消費:結果と考察
NewsByte.Tech HackerNoon profile picture
0-item

著者:

(1)アネス・バキル、ヴェネツィア・カフォスカリ大学(イタリア)

(2)アレッサンドロ・ガレアッツィ、イタリア、ヴェネツィア・カ・フォスカリ大学

(3)ファビアナ・ゾッロ、ヴェネツィア・カフォスカリ大学(イタリア)、新環境人文学センター(イタリア)。

リンク一覧

3。結果と考察

このセクションでは、分析結果を次のようにまとめています。まず、3 年間にわたるヨーロッパ諸国の情報環境の概要を示します。このステップは、各国で広く共有されている主要なトピックを特定し、疑わしい情報源と信頼できる情報源を区別して、一貫した比較を可能にするために重要です。次に、ユーザーの関与と消費パターンに焦点を当てて、これらのトピックに関する各国のオンライン ディスカッションの共通点と相違点の両方を調べます。

3.1 各国における公共言説の進化

選択した国の公共言説の状況を比較するために、最初のステップでは、4か国すべてで、疑わしい情報源と信頼できる情報源の両方で広く議論されている共通のトピックを特定します。この目的のために、BERTopic(Grootendorst、2022)を使用して、3年間にわたってニュースメディアのアカウントによって生成されたコンテンツのトピックモデリングを実行します(詳細についてはセクション2を参照)。分析に適したトピックを特定するために、データセットを年と国ごとに分割し、各サブセットに対してBERTopicアルゴリズムを実行します。図1に報告されている結果は、国とソースカテゴリごとに、各年で最も議論されたトピックを示しています。各トピックのサイズは、それに貢献しているニュースソースの数を表し、その位置は包括的なトピックとの関連性を反映しています。フロー図は、時間の経過に伴うニュースメディアでのトピックの普及を示しています。


図 1 は、国やニュースソースの種類によって、さまざまなトピックに対する報道機関の注目度がどのように異なるかを示しています。特に、共通の関心事である特定のトピックに加えて、報道機関は抗議活動、外国の影響、宗教、電気自動車、麻薬合法化など、国家的に関連する主題を優先する傾向がありました。また、同じ国内でも、疑わしい情報源と信頼できる情報源が扱うトピックに格差があることが観察されます。たとえば、イタリアでのコロナウイルスワクチンについて報道する報道機関の割合は、疑わしい情報源よりも信頼できる情報源の方が高くなっていました。さらに、「フライト」(イタリア、信頼できる)、「水管理」(フランス、信頼できる)、「パレスチナ闘争」(英国、疑わしい)など、特定のトピックは 1 つのタイプの情報源に限定されていました。これらの調査結果は、関心のレベルが国と検討対象の情報源の両方の影響を受け、疑わしい情報源はより幅広い関心を示し、信頼できる情報源はすべての国に共通するトピックに重点を置いていることを示しています。


重要なのは、私たちの分析が、すべての国の疑わしい議論と信頼できる議論の両方に共通のトピックが存在することを明らかにしていることです。具体的には、「Brexit」(2019年)、「コロナウイルス」(2020年)、「Covidワクチン」(2021年)の3つのトピックが、すべての国の議論で一貫して登場しました。したがって、その後の分析では、これらのトピックのみに焦点を当てて、国をまたいだ言説の調査を行います。この選択の背後にある理論的根拠は、これらのトピックがさまざまな国の報道機関やユーザーによってどのように報道され、消費されたかの違いと類似点にスポットライトを当て、トピック固有の変動が分析に与える影響を最小限に抑えることです。さらに、これらのトピックは欧州レベルで広く議論されているため、欧州の重要性を持つ主題がさまざまな国でどのように認識されているかを理解するために、私たちの分析は価値があります。


オンラインでの公開討論における3つのトピックの関連性を強調し、各トピックに割り当てられた時間枠の正確さを検証するために、Googleトレンドの検索分析を実施しました。


図 1: 国別の疑わしいニュース ソースと信頼できるニュース ソースのコンテンツに関するトピック モデリングの結果。各トピックのサイズは、そのトピックに寄与する固有のニュース ソースの割合によって示されます。フローは、時間の経過とともにさまざまなトピックに対するニュース アウトレットの関心の変化を表しています。


図2に示すように、2019年から2021年にかけて、フランス、ドイツ、イタリア、英国におけるBrexit、コロナウイルス、Covidワクチンへの関心が高まっています。


Google トレンドの分析により、選択されたトピックが、より広範なオンライン コンテキストにおいて、指定された期間に最も高い注目を集めたことが確認されました。そのため、今後は、これら 3 つのトピック (Brexit、コロナウイルス、および Covid ワクチン) に焦点を当てて、欧州の状況におけるニュースの制作と消費の相違点と類似点を調査します。これらのトピックのみで分析を行うために、ニュース アウトレットのタイムラインをフィルターし、それぞれの時間範囲内で選択したトピックに関連するツイートのみを選択します (詳細についてはセクション 2 を参照)。

3.2 ユーザーの関与とコミュニティ構造

我々は、ソーシャル メディア プラットフォーム上で特定されたトピックに関連するコンテンツへのエンゲージメントを比較することで、調査を続けます。図 3 は、3 つのトピックごとに、NewsGuard (セクション 2 を参照) によって分類された信頼できるニュース ソース (青) と疑わしいニュース ソース (オレンジ) の、いいね、リツイート、引用、返信の合計として計算された国別のツイート インタラクションの分布を示しています。わずかな地理的な違いはあるものの、ユーザー インタラクションの分布は、3 つのトピックすべてで同様のロングテール分布を示しており、少数のツイートが多数のインタラクションを獲得する一方で、大多数のツイートはほとんどインタラクションを獲得していません。信頼できるニュース ソースは、疑わしいニュース ソースよりも多くのインタラクションを獲得しています。


図 2: 2019 年から 2021 年にかけてフランス、ドイツ、イタリア、英国で行われた Brexit、コロナウイルス、Covid ワクチンの検索インタレストに関する Google トレンドの分析。グラフは、各トピックの検索インタレストが時間の経過とともにどのように変化したかを示しており、各行は 1 つのトピックを表しています。関心の傾向から、Brexit は 2019 年に最も人気があり、その後 2020 年末にいくつかの例外を除いて 2020 年と 2021 年に急激に減少したことがわかります。コロナウイルスは 2020 年初頭にピークに達し、その後減少しましたが、Covid ワクチンは 2021 年初頭に勢いを増し、2021 年半ばにピークに達し、2021 年末に再び急増しました。括弧は、各トピックの分析で考慮された期間を表します。


疑わしい情報源は、x軸に沿って広く分布していることからもわかるように、疑わしい情報源が多い。ただし、COVID-19ワクチンの議論における英国やコロナウイルスの議論におけるフランスなど、いくつかの例外も見られる。さらに、Brexitの議論では、他の議論ではあまり目立たないが、ドイツとイタリアでは分布の末端に疑わしい情報源が目立つ存在となっている。全体として、疑わしい情報源の存在とそれが生み出した関与は、国と検討中の特定のトピックの両方に応じて変化する可能性がある。


次に、ニュースの消費パターンに注目し、ニュースメディアの視聴者の違いと類似点を浮き彫りにします。Brexit、コロナウイルス、Covidワクチンに関するTwitterデータを分析し、同じタイプのニュースメディアが同様の視聴者によって消費されているかどうかを調査します。リツイート者のコサイン類似度(セクション2を参照)に基づく指標を定義し、視聴者の観点からニュースメディア間の類似性を定量化します。リツイート者の割合が高いニュースメディアは類似度指標の値が高くなります(1に近い)が、共有リツイート者が少数のニュースメディアは類似度が低くなります(0に近い)。


次に、ニュース アウトレットがノードとして表され、重み付けされたエッジがそれらの間の類似性のレベルを示す無向ネットワークを構築します。公平な比較を可能にするために、国とトピックごとに 1 つのネットワークを作成します。結果のネットワークは、図 4 に視覚化されています。より強い接続のみを強調するために、各ネットワークのエッジの全体的な中央値よりも低い重みを持つエッジを破棄します (完全なネットワークの結果については、SI の図 1 と 2 を参照してください)。


検討対象の国やトピックに応じて、ネットワーク構造に変化が見られる場合があります。実際、フランス、ドイツ、イタリアでは、疑わしいソース(オレンジ色の三角形)が明確に識別できるクラスターが表示される傾向があり、主に疑わしいコンテンツを消費するコミュニティの存在を示しています。英国では、この区別はそれほど顕著ではありません。トピック固有の違いを見ると、英国を除くすべての国で、Brexitの場合、ネットワークはまばらで、エッジ密度が低い傾向があることがわかります。コロナウイルスとCovidワクチンの議論では、ネットワークはより接続されており、エッジ密度が高くなります(SIの表2を参照)。これは、疑わしいニュースソースと信頼できるニュースソースの分離に反映されています。Brexitの議論では、2種類のニュースの分離がより明確に見えますが、他の議論では、SIの表3に示すように、それらの接続の数が多くなっています。この行動をさらに定量化するために、私たちは調整された名目上の同類性をネットワークに適用し(Karimi and Oliveira、2022)、Brexit 論争の文脈ではより高いレベルの同類性が達成されることを示しました。ただし、英国はおそらくこの論争に直接関与しているため、異なる行動を示しています。


図3: Brexit(上段)、コロナウイルス(中段)、Covidワクチン(下段)に関する信頼できる(青)および疑わしい(オレンジ)ニュースソースの国別ツイートインタラクション分布。ツイートインタラクションは、各ツイートが受け取ったいいね、リツイート、引用、コメントの合計として計算されます。


また、私たちの分析では、疑わしいニュースと信頼できるニュースの間に絶対的な区別がないことも明らかになりました。これは、一部のユーザーが主にまたは排他的に信頼できるコンテンツまたは疑わしいコンテンツを消費する一方で、他のユーザーは両方のタイプのニュースをさまざまな割合で消費する混合ニュース ダイエットをしていることを示しています。この問題をさらに深く掘り下げるために、各ユーザーが消費する疑わしいニュースの割合を分析し、その分布を図 5 に示します。結果は、各議論のユーザーの大多数が主に信頼できるニュース ソースに依存していることを示しています (SI の表 4 も参照)。ただし、すべての議論で、疑わしいニュースのみを支持するユーザーが少数ながら目立っていますが、その顕著さはさまざまです。特に、図は特徴的な二峰性分布を示しており、スペクトルの両端から外れたユーザーはほとんどいません。これらのユーザーは、類似性ネットワーク内で疑わしいニュースと信頼できるニュースの間のギャップを埋める重要な役割を果たします。さらに、信頼できるニュース ソースはネットワークの中核を占める傾向があり、疑わしいソースは一般的により周辺的な位置にあります。実際、各ネットワークのPageRankアルゴリズムによって特定された上位25のソース(Bakshy et al., 2011)のうち、かなりの大多数(少なくとも95.3%)が信頼できるニュースソースであることが判明しています(詳細はSIを参照)。類似性ネットワークのコミュニティ構造を調べることで分析を締めくくります。コミュニティ検出は、ルーヴァンクラスタリングを使用して実行します。


図 4: ニュース アウトレット間の類似性ネットワーク。各ニュース ソースはノードとして表され、エッジはニュース アウトレット間のオーディエンスの類似性を表します。ノードの色と形はニュース ソースの分類を示し、エッジの太さは 2 つのニュース ソース間のリツイートの類似性のレベルを表します。エッジの全体的な中央値よりも低い重みを持つエッジは破棄しました。各ネットワークは、1 つの国における 1 つのトピックに関するニュース アウトレットの類似性を表します。


アルゴリズム (Blondel et al., 2008) を適用し、図 6 に結果を報告しています。クラスターは疑わしいニュース アウトレットの割合に基づいて色分けされており、暗い色は疑わしいソースの割合が高いことを示しています。


すべての国とトピックにおいて、クラスターの大部分は主に信頼できるニュース アウトレットで構成されており、これらのクラスター内では、PageRank 分類に従って最も重要なノードも見つかりました。ただし、分析により、疑わしいニュース アウトレットの割合が高い小さなクラスターも存在することが明らかになりました。これらのクラスターの数とサイズは、国とトピックによって異なります。たとえば、ドイツとイタリアでは、トピックごとに 1 つのクラスターがありますが、フランスの Brexit 議論では 2 つのクラスターがあります。英国では、分離は明確ではなく、疑わしいニュース アウトレットの割合が高いクラスターはありません。また、信頼できるクラスターはサイズが小さいものの数が多い傾向があるのに対し、疑わしいクラスターは大きく、各ネットワークで一意であることが多いことにも気付きました。これは、疑わしいコンテンツを消費するユーザーは、ネットワークの疑わしいソースのほとんどを支持する傾向があるのに対し、信頼できるニュースの消費者はより少ないニュース アウトレットに注目する傾向があることを示唆しています。


全体として、私たちの分析は、選択された国のオンラインニュース消費状況を縦断的に把握し、信頼できるニュースソースが優勢であることを強調する一方で、多くの国やトピックで疑わしいニュースソースの割合が高いクラスターの存在を明らかにしています。このようなクラスターの存在は、信頼できるソースを避けながら、さまざまな疑わしいソースからのコンテンツを消費するユーザーグループの存在を示唆しています。この行動は、オンライン討論で広く観察される現象であるエコーチェンバーの潜在的な存在と一致しています(Cinelli et al.、2021; Falkenberg et al.、2022; Cota et al.、2019)。


この論文はCC 4.0ライセンスの下でarxivで公開されています