paint-brush
Hint Twitter'ında Gazeteci-Politikacı Etkileşimindeki Cinsiyet Önyargısını Ortaya Çıkarmak: Veri Toplamaile@mediabias
442 okumalar
442 okumalar

Hint Twitter'ında Gazeteci-Politikacı Etkileşimindeki Cinsiyet Önyargısını Ortaya Çıkarmak: Veri Toplama

Çok uzun; Okumak

Bu makalede araştırmacılar, Hindistan'ın Twitter'daki siyasi söylemindeki cinsiyet önyargısını analiz ederek sosyal medyada cinsiyet çeşitliliğine olan ihtiyacın altını çiziyor.
featured image - Hint Twitter'ında Gazeteci-Politikacı Etkileşimindeki Cinsiyet Önyargısını Ortaya Çıkarmak: Veri Toplama
Tech Media Bias [Research Publication] HackerNoon profile picture
0-item

Bu makale arxiv'de CC BY-NC-ND 4.0 DEED lisansı altında mevcuttur.

Yazarlar:

(1) Brisha Jain, Bağımsız araştırmacı Hindistan ve [email protected];

(2) Mainack Mondal, IIT Kharagpur Hindistan ve [email protected].

Bağlantı Tablosu

3. VERİ TOPLAMA

Bu bölümde Twitter'dan veri toplama sürecimizi anlatıyoruz. Popülerliklerine ve cinsiyetlerine göre örneklenen Twitter'daki belirli Hintli politikacılar ve gazeteciler arasındaki etkileşimler hakkında özel olarak veri topladık. İlk olarak, çalışmamız için Hintli gazetecilerin ve politikacıların bir listesini nasıl oluşturduğumuzla başlıyoruz.

3.1. Hintli politikacıların ve gazetecilerin Twitter hesaplarını belirleme


Bireysel Hintli politikacıların Twitter hesaplarını belirleme: Pal ve arkadaşlarının[20] önceki araştırmalarından elde edilen Hintli Politikacıların veri kümesinden yararlandık. Bu veri kümesi, siyasetle ilgilenen (politikacı olarak etiketlenmiş) birden fazla Hint Twitter hesabının adlarını ve tanıtıcılarını içeriyordu. Ancak, bu veri setinin hem siyasi organizasyonların (örneğin, Andaman ve Nikobar Adaları için BJP) hem de bireylerin hesaplarını içerdiğini fark ettik. Bu amaçla, öncelikle Hindistan seçimlerine şeffaflık getirmek amacıyla Demokratik Reformlar Derneği (ADR) tarafından işletilen açık bir veri deposu platformu olan MyNeta[3]'daki adlarla bu veri kümesindeki adları çapraz eşleştirerek veri kümesini temizledik. Pal ve ark.'daki Hint siyasi açıklamalarının her biri için. adlı kullanıcının veri kümesinde hesabın adıyla MyNeta platformunu araştırdık. Aramada bu isimde bir politikacı bulunmazsa, bu hesap muhtemelen bir bireye ait olmadığından, hesabı analizimizin dışında bırakırız. İşlem sonunda siyasilerin 4.484 Twitter hesabına ulaştık.


Bireysel Hintli siyasi gazetecilerin Twitter hesaplarının belirlenmesi: Daha sonra, Pal ve arkadaşlarının önceki araştırması [3] tarafından yayınlanan Twitter etkileyicilerinin veri kümesinden bireysel gazeteciler olarak işaretlenen Twitter hesaplarına odaklanıyoruz (medya evlerinin hesaplarından ayrı olarak). Bu tür 4.099 hesap vardı. Ancak yine bir zorlukla karşılaştık: Siyasi gazetecileri nasıl tespit edebiliriz? Spesifik olarak, bu listenin siyasi habercilikle ilgisi olmayan ve eğlence, spor vb. alanlara odaklanan birkaç gazeteciyi içerdiğini fark ettik. Bu nedenle, siyasi gazetecileri - önemsiz olmayan bir şekilde politikacıların hesaplarından doğrudan bahseden gazeteci hesapları - belirlemeye karar verdik. tweet (örneğin, yalnızca emojiler, URL'ler, doğum günü tebrikleri içeren tweet'leri indirdikten sonra). Bu amaçla, Ocak 2020 ile Aralık 2022 arasında bu 4.099 hesap tarafından gönderilen tüm tweet'leri krep adı verilen açık kaynaklı bir araç kullanarak topladık. Daha sonra yalnızca emoji, URL'ler, selamlamalar içeren tweet'leri dikkate almadık ve son tweet'lerden herhangi birinin Hintli bir politikacının Twitter hesabından (yukarıda açıklandığı gibi toplanan) söz edip etmediğini kontrol ettik. Son olarak veri setimize 3.214 gazetecinin (%78,4) hesabını siyasi gazeteci olarak dahil ediyoruz.


Twitter hesaplarının doğruluğunun doğrulanması: Son olarak, filtreleme yaklaşımımızın Hintli politikacıların ve siyasi gazetecilerin doğru Twitter hesaplarını gerçekten tespit edip etmediğini manuel olarak doğruladık. Kırk politikacı ve yirmi gazeteci hesabını rastgele örnekledik. Daha sonra bir yazar, hesabın gerçekten Hintli bir politikacıya (veya siyasi gazeteciye) ait olduğundan emin olmak için gerçek Twitter hesaplarını ziyaret etti ve ilk 20 tweet'i okudu. Rastgele örneklemin %92,5'inde filtreleme yaklaşımımız Hintli politikacıların (veya siyasi gazetecilerin) Twitter hesaplarını doğru bir şekilde tanımladı.

3.2. Hintli politikacıların ve siyasi gazetecilerin cinsiyetinin çıkarımı

Daha sonra, önceki bölümde tanımlandığı gibi Hintli politikacıların (veya siyasi gazetecilerin) Twitter hesaplarının cinsiyetini çıkarıyoruz. Bu amaçla Generize [25] adında bir hizmet kullandık. Bu hizmet, isimleri cinsiyetlere göre eşleştirir, Hint isimlerine göre özelleştirilmiştir ve önceki çalışmalar, bu hizmetten elde edilen cinsiyet çıkarımının yüksek doğruluğunu bildirmiştir [19]. Tüm hesapların cinsiyetini çıkardıktan sonra, bu çalışma için en popüler (takipçi sayısına göre) politikacı ve gazeteci hesaplarına odaklandık. Özellikle politikacı hesaplarını takipçi sayısına göre sıraladık ve erkek politikacılar ve kadın politikacılar için (Genderize tarafından belirlenen) en iyi 50 hesabı belirledik. Bu 100 Twitter hesabı için çıkarılan cinsiyetin doğruluğunu manuel olarak da doğruladık. Benzer şekilde en popüler 100 gazeteci hesabını (50 erkek ve 50 kadın) belirledik.

3.3. Gazeteci-politikacı Twitter etkileşim verilerinin toplanması

Son olarak araştırma sorularımızı yanıtlamak için Hintli politikacılar ile siyasi gazetecilerin hesapları arasındaki etkileşim verilerini topluyoruz. Spesifik olarak, 100 popüler siyasi gazeteci hesabı tarafından gönderilen tüm tweet'leri topladık ve ardından veri setimizdeki 100 popüler Hintli politikacının herhangi birinden bahseden tweet'leri filtreledik. Böylece topladığımız tweet'leri şu dört kategoriye ayırdık: Erkek gazetecilerin Erkek Politikacılardan bahseden tweetleri ( MJ-MP ), Kadın gazetecilerin Erkek Politikacılardan bahseden tweetleri ( FJ-MP ), Erkek gazetecilerin Kadın Politikacılardan bahseden tweetleri ( MJ-FP ) ve Kadın Gazeteci Kadın Politikacılardan ( FJ-FP ) bahsediyor. Toplamda 21.188 benzersiz tweet topladık. Tek bir tweet'in birden fazla hesaptan bahsedebileceğini unutmayın.


Tablo 1: Hintli gazeteciler tarafından politikacılardan bahseden tweetlerin sayısı. Kadın politikacılar nispeten daha az bahsedilen tweetler aldı.


Cinsiyetler arası neredeyse yüz gazetecinin tamamının, tweet'lerinde seçtiğimiz popüler politikacı hesaplarından toplu olarak bahsettiğini belirtiyoruz. Ayrıca Tablo 1, dört kategorimizdeki tweet sayısını göstermektedir. Dikkat çekici bir şekilde, kadın politikacıların açıklamaları hem erkek hem de kadın Hintli gazetecilerden çok daha az bahsedildi. Şimdi, Hint Twitter'ındaki gazeteci-politikacı etkileşimlerindeki potansiyel cinsiyet yanlılığını belirlemek için Twitter'dan toplanan bu etkileşim verilerini analiz ettik. Ayrıca Tablo 2'de dört kategorinin her birinden tweet alıntıları sunulmaktadır. Bu örnek, veri setimizdeki farklı kategorilerdeki tweetlerin çoğunun politika kararları ve genel yönetimle ilgili olduğunu gösteriyor.




[3] https://www.myneta.info/