paint-brush
Medyanın Çok Dilli Kaba Siyasi Duruş Sınıflandırması: Sınırlamalar ve Etik Beyanıile@mediabias
120 okumalar

Medyanın Çok Dilli Kaba Siyasi Duruş Sınıflandırması: Sınırlamalar ve Etik Beyanı

Çok uzun; Okumak

Bu makalede araştırmacılar, yapay zeka tarafından oluşturulan haber makalelerinin tarafsızlığını ve diller arasındaki duruş gelişimini özgün haber kaynağı derecelendirmelerini kullanarak analiz ediyor.
featured image - Medyanın Çok Dilli Kaba Siyasi Duruş Sınıflandırması: Sınırlamalar ve Etik Beyanı
Tech Media Bias [Research Publication] HackerNoon profile picture
0-item

Bu makale arxiv'de CC BY-NC-SA 4.0 DEED lisansı altında mevcuttur.

Yazarlar:

(1) Cristina España-Bonet, DFKI GmbH, Saarland Bilişim Kampüsü.

Bağlantı Tablosu

5.1 Sınırlamalar

Tüm medya kaynaklarının bir editoryal çizgisi ve bununla bağlantılı bir önyargısı olduğunu varsayıyoruz ve ILM'yi diğer medya kaynakları gibi ele alıyoruz. Bir ChatGPT veya Bard makalesinin tarafsız olma ihtimalini dikkate almıyoruz. Bu, halihazırda ikili bir siyasi duruş açıklamasına izin veren verileri toplamak için kullanılan uzaktan denetim yöntemiyle ilgilidir. Gerçekten çok dilli bir ortamda yüz binlerce makaleye siyasi önyargılarla manuel olarak açıklama eklemek öngörülebilir gelecekte mümkün görünmediğinden, tamamen veriye dayalı bir yöntem uygulamaya ve bu yöntemin dil ve kültür aktarım yeteneklerini incelemeye karar verdik.


Ancak makale düzeyinde siyasi duruşun tespitinde uzaktan denetimin kullanılması hassas bir konudur. Birincisi, aynı gazetenin zamanla ideolojiyi değiştirebilmesidir. İkincisi, ki bu daha çok tek bir makalenin içeriğiyle ilgilidir, tartışmalı olmayan konularda önyargı olmayabilir. Önyargıların mevcut olduğu durumlarda bile iki ideoloji arasında kesin bir ayrım yerine aşırı Soldan aşırı Sağa kadar uzanan bir yelpaze söz konusudur.


Mevcut sınırlamaları ölçmek ve mümkünse azaltmak için, insan açıklamalı derlemlerin (Baly ve diğerleri, 2020; Aksenov ve diğerleri, 2021) stilistik bir analizini yapmayı ve bunu yarı otomatik olarak açıklamalı derlemimizle karşılaştırmayı planlıyoruz. . Bu çalışmanın devamı olarak, iyi genelleme ve aktarım yeteneklerini sağlamak için eğitim verileri arasında benzer bir stile ihtiyaç duyulduğundan, ILM tarafından oluşturulan metinlerin de stilistik bir analizini gerçekleştireceğiz.

5.2. Etik Beyanı

Test verilerimizi oluşturmak için üretken dil modelleri ChatGPT ve Bard'ı kullanıyoruz. Pek çok tartışmalı konuyu (ölüm cezası, cinsel taciz, uyuşturucu vb.) ele aldığımız için otomatik oluşturma, zararlı metinler üretebilir. Burada sunulan veriler herhangi bir insan revizyonuna tabi tutulmamıştır. Kullanılan sistem sürümünün belirtilmesiyle birlikte, derlemi oluşturulduğu şekliyle analiz ediyor ve sağlıyoruz.