Этот документ доступен на arxiv под лицензией CC BY-NC-SA 4.0 DEED.   Авторы:  (1) Кристина Испания-Бонет, DFKI GmbH, Кампус информатики Саара.  Таблица ссылок   Аннотация и введение   Корпоративная подборка   Классификация политических позиций   Резюме и выводы   Ограничения и заявление об этике   Благодарности и ссылки   А. Газеты в ОСКАР 22.01   Б. Темы   C. Распределение тем по газетам   D. Темы для генерации статей ChatGPT и Bard   E. Классификация позиций на уровне статей   F. Детали обучения  4. Резюме и выводы  Источники СМИ имеют редакционную линию и связанную с ней предвзятость. Людям сложно избавиться от политических предубеждений, но осознание их помогает нам получить глобальный взгляд на новости. Предвзятости иногда очевидны и/или проявляются в виде вредного текста, но иногда они незаметны и их трудно обнаружить. Эти тонкие скрытые предубеждения потенциально опасны и приводят к манипуляциям, когда мы о них не знаем. В этой работе мы систематически изучали тонкие политические предубеждения, стоящие за ChatGPT и Bard, те, которые проявляются без указания какой-либо роли личности (Deshpande et al., 2023). Мы показали, что ориентация ChatGPT меняется со временем и различается в зависимости от языка. В период с февраля по август 2023 года ChatGPT перешел с левой на нейтральную политическую ориентацию с правым периодом посередине для английского и испанского языков. Эволюцию Барда пока невозможно изучить. В его текущей версии по состоянию на август 2023 года для четырех изучаемых языков постоянно отображается левостороннее направление. Эта предвзятость не зависит от фактических ошибок, которые порождает модель, и ее пользователи также должны учитывать ее. Мы предоставляем модели для регулярной проверки предвзятости в генерации текста для США, Германии и Испании, а также в тесно связанных политических контекстах и языках, используя подход с нулевым шансом.  В качестве побочного продукта нашего анализа мы создали многоязычный корпус из 1,2 миллиона газетных статей с грубыми аннотациями политических позиций и тем. Мы показываем, что дистанционный контроль позволяет нам строить значимые модели для грубой классификации политических позиций, если корпус разнообразен. Мы предоставляем эти данные вместе с поколениями LM и нашим кодом через Zenodo (España-Bonet, 2023) и Github.[12]  [12] https://github.com/cristinae/docTransformer

Part of HackerNoon's growing list of open-source research papers, promoting free access to academic material.

MediaBias.TECH

We publish deeply researched (and often vastly underread) academic papers about our collective omnipresent media bias.

MediaBias's

Этот звук создан на языке оригинала истории!

Многоязычная грубая политическая классификация СМИ: Резюме и выводы

About Author

КОММЕНТАРИИ

БИРКИ

ЭТА СТАТЬЯ БЫЛА ПРЕДСТАВЛЕНА В

Related Stories

Как улучшить ваш рабочий процесс в 10 раз: 17 основных приложений

Цифровые кочевники слушают: что нужно знать о новой визе DTV в Таиланде

Руководство архитектора по созданию эталонной архитектуры для озера данных AI/ML

Хотите выиграть конкурс HackerNoon? Вот что рекомендуют победители конкурса #crypto-api

Как улучшить ваш рабочий процесс в 10 раз: 17 основных приложений

Цифровые кочевники слушают: что нужно знать о новой визе DTV в Таиланде

Руководство архитектора по созданию эталонной архитектуры для озера данных AI/ML

Хотите выиграть конкурс HackerNoon? Вот что рекомендуют победители конкурса #crypto-api

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps