Этот документ доступен на arxiv под лицензией CC BY-NC-SA 4.0 DEED.
Авторы:
(1) Еджин Банг, Центр исследований искусственного интеллекта (CAiRE), Гонконгский университет науки и технологий;
(2) Наён Ли, Центр исследований искусственного интеллекта (CAiRE), Гонконгский университет науки и технологий;
(3) Паскаль Фунг, Центр исследований искусственного интеллекта (CAiRE), Гонконгский университет науки и технологий.
Предвзятость в фреймировании играет важную роль в усугублении политической поляризации, искажая восприятие реальных событий. Средства массовой информации с разными политическими позициями часто используют поляризованный язык в репортажах об одном и том же событии. Мы предлагаем новую функцию потерь, которая побуждает модель минимизировать разницу полярности между поляризованными входными статьями, чтобы уменьшить смещение кадра. В частности, наша потеря предназначена для совместной оптимизации модели для двунаправленного сопоставления концов полярности. Наши экспериментальные результаты показывают, что включение предложенной минимизации потерь полярности приводит к существенному уменьшению смещения кадра по сравнению с моделью суммирования нескольких документов на основе BART. Примечательно, что мы обнаружили, что эффективность этого подхода наиболее выражена, когда модель обучена минимизировать потерю полярности, связанную с предвзятостью информационного кадрирования (т. е. искаженным отбором информации для отчета).
Предвзятость в фреймировании стала широко распространенной проблемой в современных средствах массовой информации, вводя в заблуждение понимание того, что на самом деле произошло, из-за искаженного выбора информации и языка (Entman, 2007, 2010; Gentzkow and Shapiro, 2006). Наиболее заметным последствием рамочной предвзятости является усиление полярности между конфликтующими политическими партиями и средствами массовой информации. Устранение предвзятости в формулировании имеет решающее значение для обеспечения точной и объективной подачи информации.
Одной из перспективных парадигм смягчения последствий является создание нейтральной версии новостной статьи путем синтеза нескольких мнений из предвзятых исходных статей (Sides, 2018; Lee et al., 2022). Чтобы более эффективно добиться нейтрализации новостей, мы вводим потерю минимизации полярности, которая использует индуктивное смещение, которое побуждает модель отдавать предпочтение генерации с минимальной разницей полярностей. Предлагаемые нами потери тренируют модель, чтобы одновременно хорошо сопоставлять статьи с одного конца спектра полярности на другой конец спектра и наоборот, как показано на рис. 1. Интуитивно модель вынуждена учиться и фокусироваться на общем аспекте. между противоположными полярностями с двух противоположных концов.
В этой работе мы демонстрируем эффективность предложенной нами функции потерь путем минимизации полярности в различных аспектах предвзятости фрейминга – лексической и информационной (Entman, 2002). Лексическая поляризация возникает в результате выбора слов с разной валентностью и активацией для объяснения одной и той же информации (например, «протест» или «бунт»). Информационная поляризация возникает в результате различного выбора информации для освещения, часто включая ненужную или несвязанную информацию, связанную с освещаемой проблемой. Наше исследование показывает, что изучение противоположных полярностей, которые различаются в информационном измерении, позволяет модели лучше сосредоточиться на общей основе и минимизировать предвзятость в поляризованных входных статьях. В конечном счете, предлагаемая нами потеря позволяет удалить информацию, вызывающую предвзятость, и создать более нейтральный языковой выбор.