저자:
(1) 이탈리아 베니스의 Ca' Foscari 대학교 Anees Baqir;
(2) Alessandro Galeazzi, 이탈리아 베니스 Ca' Foscari 대학교;
(3) Fabiana Zollo, 이탈리아 베니스 Ca' Foscari 대학 및 이탈리아 환경 인문학을 위한 새로운 연구소 센터.
본 절에서는 다음과 같이 정리된 분석 결과를 제시한다. 첫째, 우리는 지난 3년 동안 일부 유럽 국가의 정보 환경에 대한 개요를 제공합니다. 이 단계는 국가 간에 널리 공유되는 주요 주제를 식별하고 의심스러운 출처와 신뢰할 수 있는 출처를 구별하여 일관된 비교를 가능하게 하는 데 중요합니다. 다음으로, 사용자 참여와 소비 패턴에 초점을 맞춰 이러한 주제에 대한 온라인 토론에서 국가 간 공통점과 차이점을 조사합니다.
선택된 국가의 공개 담론 환경을 비교하기 위한 첫 번째 단계는 4개 국가 모두에서 의심스럽고 신뢰할 수 있는 출처에서 광범위하게 논의된 공통 주제를 식별하는 것입니다. 이를 위해 우리는 BERTopic(Grootendorst, 2022)을 사용하여 3년 동안 뉴스 매체 계정에서 생성된 콘텐츠에 대한 주제 모델링을 수행합니다(자세한 내용은 섹션 2 참조). 분석에 적합한 주제를 식별하기 위해 데이터 세트를 연도별, 국가별로 나누고 각 하위 집합에 대해 BERTopic 알고리즘을 실행합니다. 그림 1에 보고된 결과는 국가 및 소스 카테고리별로 매년 가장 많이 논의된 주제를 보여줍니다. 각 주제의 크기는 해당 주제에 기여하는 뉴스 매체의 수를 나타내며, 해당 주제의 위치는 전체 주제와의 관련성을 반영합니다. 흐름도는 시간 경과에 따라 뉴스 매체에서 해당 주제가 얼마나 널리 퍼져 있는지를 보여줍니다.
그림 1은 다양한 주제에 대한 뉴스 매체의 관심이 국가 및 뉴스 매체 유형에 따라 어떻게 다른지를 보여줍니다. 특히 언론 매체에서는 특정 공통 관심사 주제 외에도 시위, 외국의 영향, 종교, 전기차, 마약 합법화 등 국가적 관련성을 지닌 주제를 우선적으로 다루는 경향이 있었습니다. 우리는 또한 동일한 국가 내에서 의심스럽고 신뢰할 수 있는 출처가 다루는 주제에 차이가 있음을 관찰합니다. 예를 들어, 이탈리아의 코로나바이러스 백신에 대해 보도하는 언론 매체의 비율은 의심스러운 출처보다 신뢰할 수 있는 출처에서 더 높았습니다. 게다가 특정 주제는 '항공편'(이탈리아, 신뢰할 수 있음), '물 관리'(프랑스, 신뢰할 수 있음) 또는 '팔레스타인 투쟁'(영국, 의심스러움)과 같은 한 가지 유형의 출처에만 국한되었습니다. 이러한 결과는 관심 수준이 국가와 고려되는 출처 유형 모두에 의해 영향을 받는다는 것을 나타냅니다. 의심스러운 출처는 더 넓은 범위의 관심을 표시하고 신뢰할 수 있는 출처는 모든 국가에 공통된 주제에 더 중점을 둡니다.
결정적으로, 우리의 분석은 모든 국가의 의심스럽고 신뢰할 수 있는 논쟁 사이에 공통 주제가 존재한다는 점을 강조합니다. 구체적으로, '브렉시트'(2019), '코로나바이러스'(2020), '코비드 백신'(2021)이라는 세 가지 주제가 모든 국가의 논의에서 일관되게 등장했습니다. 따라서 후속 분석에서는 담론의 국가 간 검토를 위해 이러한 주제에만 중점을 둡니다. 이러한 선택의 이유는 이러한 주제가 다양한 국가의 뉴스 매체와 사용자에 의해 보고되고 소비되는 방식의 차이점과 유사점을 조명하여 분석에 대한 주제별 변형의 영향을 최소화하는 것입니다. 또한 이러한 주제는 유럽 수준에서 광범위하게 논의되었으므로 우리의 분석은 유럽의 중요성이 다른 국가에서 어떻게 인식되는지 이해하는 데 유용합니다.
온라인 공개 토론에서 선택한 세 가지 주제의 관련성을 강조하고 각 주제에 할당된 기간의 정확성을 검증하기 위해 Google에서는 검색에 대한 Google 트렌드 분석을 수행합니다.
그림 2에서 볼 수 있듯이 2019년부터 2021년까지 프랑스, 독일, 이탈리아, 영국의 브렉시트, 코로나바이러스, 코비드 백신에 대한 관심.
Google 트렌드 분석을 통해 선택한 주제가 더 넓은 온라인 맥락에서 특정 기간 동안 가장 높은 관심을 끌었다는 사실이 확인되었습니다. 따라서 앞으로 우리의 분석은 유럽 환경 내에서 뉴스 생산 및 소비의 차이점과 유사점을 조사하기 위해 세 가지 주제(브렉시트, 코로나바이러스, 코로나바이러스 백신)에 중점을 둡니다. 이러한 주제에 대해서만 분석을 수행하기 위해 우리는 뉴스 매체의 타임라인을 필터링하여 해당 시간 범위 내에서 선택한 주제와 관련된 트윗만 선택합니다(자세한 내용은 섹션 2 참조).
우리는 소셜 미디어 플랫폼에서 식별된 주제와 관련된 콘텐츠와 참여도를 비교하여 연구를 계속합니다. 그림 3은 NewsGuard에서 분류한 신뢰할 수 있는 뉴스 소스(파란색)와 의심스러운 뉴스 소스(주황색)에 대해 좋아요, 리트윗, 인용문 및 답글의 합계로 계산된 국가별 트윗 상호작용 분포를 보여줍니다(섹션 2 참조). 세 가지 주제 각각에 대해. 사소한 지리적 변화에도 불구하고 사용자 상호 작용의 분포는 세 가지 주제 모두에 대해 유사한 긴 꼬리 분포를 표시합니다. 즉 소수의 트윗이 많은 수의 상호 작용을 수신하는 반면 대다수는 매우 적은 수의 상호 작용을 수신합니다. 신뢰할 수 있는 뉴스 소스는 일반적으로 의심스러운 뉴스 소스보다 더 많은 상호작용을 얻었습니다.
x축을 따라 더 넓은 분포로 표시됩니다. 그러나 영국의 코로나19 백신 논의, 프랑스의 코로나19 논의 등 몇 가지 예외가 관찰된다. 더욱이 브렉시트 담론에서는 독일과 이탈리아의 분포 꼬리 부분에 의심스러운 출처가 눈에 띄게 존재하지만 다른 논의에서는 눈에 띄지 않습니다. 전반적으로, 의심스러운 출처의 존재와 그들이 생성한 참여는 국가와 고려 중인 특정 주제에 따라 달라질 수 있습니다.
그런 다음 뉴스 소비 패턴에 관심을 기울여 뉴스 매체 독자의 차이점과 유사점을 강조합니다. 브렉시트, 코로나바이러스, 코로나바이러스 백신에 대한 트위터 데이터를 분석하여 동일한 유형의 뉴스 매체가 유사한 독자에 의해 소비되는지 조사합니다. 우리는 청중 측면에서 뉴스 매체 간의 유사성을 정량화하기 위해 리트윗자의 코사인 유사성(섹션 2 참조)을 기반으로 측정항목을 정의합니다. 높은 비율의 리트윗자를 공유하는 뉴스 매체는 유사성 측정항목의 값이 더 높은(1에 가까움) 반면, 소수의 공유 리트윗만 있는 매체는 낮은 유사성(0에 가까움)을 얻습니다.
그런 다음 뉴스 매체가 노드로 표시되고 가중치 에지가 이들 간의 유사성 수준을 나타내는 무방향 네트워크를 구축합니다. 공정한 비교가 가능하도록 고려되는 각 국가 및 주제별로 하나의 네트워크를 만듭니다. 결과 네트워크는 그림 4에 시각화되어 있습니다. 더 강한 연결만 강조하기 위해 각 네트워크 가장자리의 전체 중앙값보다 낮은 가중치를 가진 가장자리를 삭제합니다(전체 네트워크의 결과는 SI의 그림 1 및 2 참조).
고려 중인 국가와 주제에 따라 네트워크 구조가 달라질 수 있습니다. 실제로 프랑스, 독일, 이탈리아에서는 명확하게 식별 가능한 의심스러운 소스 클러스터(주황색 삼각형)가 표시되는 경향이 있는데, 이는 주로 의심스러운 콘텐츠를 소비하는 커뮤니티가 있음을 나타냅니다. 영국에서는 이러한 구분이 덜 뚜렷합니다. 주제별 차이점을 살펴보면 영국을 제외한 모든 국가에서 Brexit의 경우 네트워크가 더 희박하고 가장자리 밀도가 낮은 경향이 있음을 알 수 있습니다. 코로나바이러스 및 코비드 백신 논의의 경우 네트워크는 더 많이 연결되어 있고 더 높은 에지 밀도를 나타냅니다(SI의 표 2 참조). 이는 의심스러운 뉴스 소스와 신뢰할 수 있는 뉴스 소스 사이의 구분에 반영됩니다. Brexit 토론에서는 두 가지 유형의 뉴스 사이의 구분이 더 명확하게 나타나는 반면, 다른 토론에서는 SI의 표 3에 표시된 것처럼 더 많은 수의 연결을 공유합니다. . 이 행동을 더 정량화하기 위해 우리는 조정된 명목 분류성을 네트워크에 적용하여(Karimi and Oliveira, 2022), Brexit 논의의 맥락에서 더 높은 수준의 분류성이 달성되었음을 보여줍니다. 그러나 영국은 논쟁에 직접 참여했기 때문에 다른 행동을 보였습니다.
우리의 분석은 또한 의심스러운 뉴스 매체와 신뢰할 수 있는 뉴스 매체 사이에 절대적인 구분이 없다는 것을 보여줍니다. 이는 일부 사용자는 신뢰할 수 있거나 의심스러운 콘텐츠를 주로 또는 독점적으로 소비하는 반면, 다른 사용자는 혼합된 뉴스 다이어트를 하며 두 유형을 다양한 비율로 소비한다는 것을 의미합니다. 이 질문을 더 자세히 조사하기 위해 우리는 각 사용자가 소비한 의심스러운 뉴스의 비율을 분석하고 그림 5에 분포를 제시합니다. 결과는 각 토론에서 대다수의 사용자가 주로 신뢰할 수 있는 뉴스 소스에 의존한다는 것을 나타냅니다(SI의 표 4 참조). ). 그러나 모든 토론에는 다양한 정도의 중요성에도 불구하고 의심스러운 뉴스만을 지지하는 사용자의 작지만 눈에 띄는 부분이 있습니다. 특히, 그림은 스펙트럼의 극단을 벗어나는 사용자가 거의 없는 독특한 이중 모드 분포를 보여줍니다. 이러한 사용자는 유사성 네트워크 내에서 의심스러운 뉴스와 신뢰할 수 있는 뉴스 간의 격차를 해소하는 데 중요한 역할을 합니다. 더욱이, 신뢰할 수 있는 뉴스 소스는 네트워크의 핵심을 차지하는 경향이 있는 반면, 의심스러운 소스는 일반적으로 좀 더 주변적인 위치에 위치합니다. 실제로 각 네트워크의 PageRank 알고리즘에 의해 식별된 상위 25개 소스(Bakshy et al., 2011) 중 상당수(95.3% 이상)가 신뢰할 수 있는 뉴스 소스인 것으로 나타났습니다(자세한 내용은 SI 참조). 유사성 네트워크의 커뮤니티 구조를 조사하여 분석을 마무리합니다. Louvain 클러스터링을 사용하여 커뮤니티 감지를 수행합니다.
알고리즘(Blondel et al., 2008)을 사용하여 그림 6에 결과를 보고합니다. 클러스터는 의심스러운 뉴스 매체의 비율을 기준으로 색상으로 구분되며, 음영이 어두울수록 의심스러운 소스의 비율이 높다는 것을 나타냅니다.
모든 국가 및 주제에 걸쳐 대부분의 클러스터는 주로 신뢰할 수 있는 뉴스 매체로 구성되었으며, 이러한 클러스터 내에서는 PageRank 분류에 따라 가장 중요한 노드도 찾습니다. 그러나 우리의 분석은 또한 의심스러운 뉴스 매체의 비율이 높은 소규모 클러스터의 존재를 보여줍니다. 이러한 클러스터의 수와 크기는 국가와 주제에 따라 다릅니다. 예를 들어 독일과 이탈리아에서는 주제별로 하나의 클러스터가 있는 반면, 프랑스의 브렉시트 논쟁에는 두 개의 클러스터가 있습니다. 영국에서는 의심스러운 뉴스 매체의 비율이 높은 클러스터를 표시하지 않아 분리가 덜 명확합니다. 또한 신뢰할 수 있는 클러스터는 크기는 작지만 숫자는 더 많은 경향이 있는 반면, 의심스러운 클러스터는 더 크고 각 네트워크에서 고유한 경우가 많습니다. 이는 의심스러운 콘텐츠를 소비하는 사용자가 네트워크의 의심스러운 소스 대부분을 지지하는 경향이 있는 반면, 신뢰할 수 있는 뉴스 소비자는 더 적은 수의 뉴스 매체에 집중한다는 것을 의미합니다.
전반적으로, 우리의 분석은 선택된 국가의 온라인 뉴스 소비 환경에 대한 종단적 관점을 제공하며, 신뢰할 수 있는 뉴스 소스의 우세를 강조하는 동시에 많은 국가와 주제에서 의심스러운 뉴스 소스의 비율이 더 높은 클러스터의 존재를 드러냅니다. 이러한 클러스터의 존재는 신뢰할 수 있는 소스는 피하면서 의심스러운 다양한 소스의 콘텐츠를 소비하는 사용자 그룹이 있음을 나타냅니다. 이러한 행동은 온라인 토론에서 널리 관찰되는 현상인 에코 챔버의 잠재적 존재와 일치합니다(Cinelli et al., 2021; Falkenberg et al., 2022; Cota et al., 2019).
이 문서는 CC 4.0 라이선스에 따라 arxiv에서 볼 수 있습니다.