paint-brush
Medyanın Çok Dilli Kaba Siyasi Duruş Sınıflandırması: Eğitim Detaylarıile@mediabias
165 okumalar

Medyanın Çok Dilli Kaba Siyasi Duruş Sınıflandırması: Eğitim Detayları

Çok uzun; Okumak

Bu makalede araştırmacılar, yapay zeka tarafından oluşturulan haber makalelerinin tarafsızlığını ve diller arasındaki duruş gelişimini özgün haber kaynağı derecelendirmelerini kullanarak analiz ediyor.
featured image - Medyanın Çok Dilli Kaba Siyasi Duruş Sınıflandırması: Eğitim Detayları
Tech Media Bias [Research Publication] HackerNoon profile picture
0-item

Bu makale arxiv'de CC BY-NC-SA 4.0 DEED lisansı altında mevcuttur.

Yazarlar:

(1) Cristina España-Bonet, DFKI GmbH, Saarland Bilişim Kampüsü.

Bağlantı Tablosu

F. Eğitim Detayları

F.1 L/R Sınıflandırıcı

Şekil 1'de şematize edildiği gibi L ve R sınıflandırması için büyük XLM-RoBERTa'ya (Conneau ve diğerleri, 2020) ince ayar yapıyoruz. Sınıflandırıcımız, RoBERTa'nın üzerinde, ilk olarak RoBERTa'nın [CLS] belirtecinde 0,1 olasılıkla bırakma işlemini gerçekleştiren küçük bir ağdır, bunu doğrusal bir katman ve bir tanh takip eder. 0,1 olasılıkla başka bir bırakma katmanından geçiyoruz ve son doğrusal katman iki sınıfa yansıyor. Tüm mimari ince ayarlıdır.


Şekil 1: İnce ayar mimarisi.


Çapraz entropi kaybı, AdamW iyileştiricisi ve doğrusal olarak azalan bir öğrenme oranı kullanıyoruz. Toplu iş boyutunu, öğrenme oranını, ısınma süresini ve dönem sayısını ayarlıyoruz. Dil ve model başına en iyi değerler Tablo 12'de özetlenmiştir.


Tablo 12: Kullanılan ana hiper parametreler ve bunların üç tek dilli ince ayarda (en, de ve, es) ve çok dilli olanda (en+de+es) performansı.


Tüm eğitimler 32 GB kapasiteli tek bir NVIDIA Tesla V100 Volta GPU kullanılarak gerçekleştirilmektedir.

F.2 Konu Modelleme

Engellenen sözcükleri kaldırdıktan sonra derlem üzerinde LDA gerçekleştirmek için Mallet'i (McCallum, 2002) kullanıyoruz, hiperparametre optimizasyon seçeneği etkinleştiriliyor ve her 10 yinelemede bir yapılıyor. Diğer parametreler varsayılanlardır. Her dil için 10 konu içeren bir çalışma ve 15 konu içeren başka bir çalışma yapıyoruz. Corpus'u her iki etiketle de etiketliyoruz.