এই কাগজটি CC BY-NC-ND 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ।
লেখক:
(1) বৃশা জৈন, স্বাধীন গবেষক ভারত এবং [email protected];
(2) মাইনাক মন্ডল, আইআইটি খড়গপুর ভারত এবং [email protected]।
এই বিভাগে আমরা টুইটার থেকে আমাদের ডেটা সংগ্রহ প্রক্রিয়া বর্ণনা করি। আমরা বিশেষভাবে তাদের জনপ্রিয়তা এবং লিঙ্গের উপর ভিত্তি করে টুইটারে নির্দিষ্ট ভারতীয় রাজনীতিবিদ এবং সাংবাদিকদের মধ্যে মিথস্ক্রিয়া সম্পর্কে তথ্য সংগ্রহ করেছি। প্রথমত, আমরা আমাদের অধ্যয়নের জন্য ভারতীয় সাংবাদিক এবং রাজনীতিবিদদের একটি তালিকা কীভাবে তৈরি করেছি তা দিয়ে শুরু করি।
পৃথক ভারতীয় রাজনীতিবিদদের টুইটার অ্যাকাউন্ট সনাক্তকরণ: আমরা পাল এট আল-এর পূর্ববর্তী গবেষণা থেকে ভারতীয় রাজনীতিবিদদের একটি ডেটাসেট ব্যবহার করেছি।[20]। এই ডেটাসেটে একাধিক ভারতীয় টুইটার অ্যাকাউন্টের নাম এবং হ্যান্ডেল রয়েছে যা রাজনীতিতে জড়িত (রাজনীতিবিদ হিসাবে লেবেলযুক্ত)। যাইহোক, আমরা লক্ষ্য করেছি যে এই ডেটাসেটে উভয় রাজনৈতিক সংস্থার অ্যাকাউন্ট রয়েছে (যেমন, আন্দামান ও নিকোবর দ্বীপপুঞ্জের জন্য বিজেপি) পাশাপাশি ব্যক্তি। সেই লক্ষ্যে, আমরা প্রথমে ডেটাসেট পরিষ্কার করেছিলাম, এই ডেটাসেটের নামগুলি MyNeta[3]-এর নামের সাথে ক্রস-ম্যাচ করে যা ভারতীয় নির্বাচনে স্বচ্ছতা আনার জন্য অ্যাসোসিয়েশন ফর ডেমোক্রেটিক রিফর্মস (ADR) দ্বারা পরিচালিত একটি উন্মুক্ত ডেটা রিপোজিটরি প্ল্যাটফর্ম। পাল এট আল-এর প্রতিটি ভারতীয় রাজনৈতিক অ্যাকাউন্টের জন্য। এর ডেটাসেট, আমরা অ্যাকাউন্টের নাম দিয়ে MyNeta প্ল্যাটফর্ম অনুসন্ধান করেছি। অনুসন্ধানে যদি এই নামের কোনো রাজনীতিবিদ খুঁজে না পাওয়া যায়, তাহলে আমরা আমাদের বিশ্লেষণ থেকে অ্যাকাউন্টটি বাতিল করে দিই কারণ সেই অ্যাকাউন্টটি সম্ভবত কোনো ব্যক্তির নয়। প্রক্রিয়া শেষে, আমরা রাজনীতিবিদদের 4,484 টি টুইটার অ্যাকাউন্ট দিয়ে শেষ করেছি।
পৃথক ভারতীয় রাজনৈতিক সাংবাদিকদের টুইটার অ্যাকাউন্ট সনাক্ত করা: এরপর, আমরা পাল এট আল-এর পূর্ববর্তী গবেষণা [৩] (মিডিয়া হাউসের অ্যাকাউন্ট থেকে পৃথক) দ্বারা প্রকাশিত টুইটার প্রভাবকদের ডেটাসেট থেকে পৃথক সাংবাদিক হিসাবে চিহ্নিত টুইটার অ্যাকাউন্টগুলিতে ফোকাস করি। এই ধরনের 4,099টি অ্যাকাউন্ট ছিল। যাইহোক, আমরা আবার একটি চ্যালেঞ্জের সম্মুখীন হলাম—কীভাবে আমরা রাজনৈতিক সাংবাদিকদের চিহ্নিত করব? বিশেষ করে, আমরা লক্ষ্য করেছি যে এই তালিকায় এমন বেশ কিছু সাংবাদিক রয়েছে যারা রাজনৈতিক প্রতিবেদনের সাথে যুক্ত নন এবং বিনোদন, খেলাধুলা ইত্যাদির মতো ক্ষেত্রগুলিতে ফোকাস করেন। এইভাবে, আমরা রাজনৈতিক সাংবাদিকদের চিহ্নিত করতে সেট করেছি- সাংবাদিক অ্যাকাউন্ট যা সরাসরি রাজনীতিবিদদের অ্যাকাউন্টগুলিকে অ-তুচ্ছ বলে উল্লেখ করেছে। টুইট (উদাহরণস্বরূপ, শুধুমাত্র ইমোজি, ইউআরএল, জন্মদিনের শুভেচ্ছা সহ টুইটগুলিকে ছাড় দেওয়ার পরে)। সেই লক্ষ্যে, আমরা ক্রেপ নামক একটি ওপেন-সোর্স টুল ব্যবহার করে জানুয়ারী 2020 এবং ডিসেম্বর 2022-এর মধ্যে এই 4,099 অ্যাকাউন্টগুলি দ্বারা পোস্ট করা সমস্ত টুইট সংগ্রহ করেছি। তারপরে আমরা শুধুমাত্র ইমোজি, ইউআরএল, শুভেচ্ছা সহ টুইটগুলি ছাড় দিয়েছি এবং চূড়ান্ত টুইটগুলির মধ্যে কোনও ভারতীয় রাজনীতিকের টুইটার অ্যাকাউন্ট (উপরে বর্ণিত হিসাবে সংগৃহীত) উল্লেখ করা হয়েছে কিনা তা পরীক্ষা করে দেখেছি। অবশেষে, আমরা রাজনৈতিক সাংবাদিক হিসাবে আমাদের ডেটাসেটে 3,214 সাংবাদিকের অ্যাকাউন্ট (78.4%) অন্তর্ভুক্ত করি।
টুইটার অ্যাকাউন্টগুলির যথার্থতা যাচাই করা: অবশেষে, আমরা ম্যানুয়ালি যাচাই করেছি যে আমাদের ফিল্টারিং পদ্ধতি আসলে ভারতীয় রাজনীতিবিদ এবং রাজনৈতিক সাংবাদিকদের সঠিক টুইটার অ্যাকাউন্টগুলি সনাক্ত করেছে কিনা। আমরা এলোমেলোভাবে চল্লিশজন রাজনীতিবিদ এবং বিশটি সাংবাদিক অ্যাকাউন্টের নমুনা নিয়েছি। তারপরে একজন লেখক প্রকৃত টুইটার অ্যাকাউন্টগুলি পরিদর্শন করেন এবং অ্যাকাউন্টটি প্রকৃতপক্ষে একজন ভারতীয় রাজনীতিবিদ (বা রাজনৈতিক সাংবাদিক) এর কিনা তা নিশ্চিত করতে প্রথম 20টি টুইট পড়েন। 92.5% এলোমেলো নমুনায়, আমাদের ফিল্টারিং পদ্ধতি ভারতীয় রাজনীতিবিদদের (বা রাজনৈতিক সাংবাদিকদের) টুইটার অ্যাকাউন্টগুলিকে সঠিকভাবে চিহ্নিত করেছে।
পরবর্তীতে, আমরা পূর্ববর্তী বিভাগে চিহ্নিত ভারতীয় রাজনীতিবিদদের (বা রাজনৈতিক সাংবাদিকদের) টুইটার অ্যাকাউন্টগুলির লিঙ্গ অনুমান করি৷ এই উদ্দেশ্যে, আমরা জেনারাইজ [25] নামে একটি পরিষেবা ব্যবহার করেছি। এই পরিষেবাটি লিঙ্গের নামগুলিকে ম্যাপ করে, ভারতীয় নামের সাথে কাস্টমাইজ করা হয়েছে, এবং পূর্ববর্তী গবেষণাগুলি এই পরিষেবা থেকে লিঙ্গ অনুমানের উচ্চ নির্ভুলতার রিপোর্ট করেছে [19]। একবার আমরা সমস্ত অ্যাকাউন্টের লিঙ্গ অনুমান করি, এই গবেষণার জন্য আমরা সবচেয়ে জনপ্রিয় (অনুসারীদের সংখ্যা অনুসারে) রাজনীতিবিদ এবং সাংবাদিক অ্যাকাউন্টগুলিতে মনোনিবেশ করেছি। বিশেষত, আমরা অনুসরণকারীদের সংখ্যা অনুসারে রাজনীতিবিদদের অ্যাকাউন্টগুলিকে সাজিয়েছি এবং পুরুষ রাজনীতিবিদ এবং মহিলা রাজনীতিবিদদের জন্য শীর্ষ 50টি অ্যাকাউন্ট চিহ্নিত করেছি (জেন্ডারাইজ দ্বারা চিহ্নিত)৷ আমরা আরও ম্যানুয়ালি এই 100টি টুইটার অ্যাকাউন্টের জন্য অনুমানকৃত লিঙ্গের সঠিকতা যাচাই করেছি। আমরা একইভাবে সর্বাধিক জনপ্রিয় 100টি সাংবাদিক অ্যাকাউন্ট (50টি পুরুষ এবং 50টি মহিলা) চিহ্নিত করেছি।
অবশেষে, আমাদের গবেষণা প্রশ্নের উত্তর দিতে, আমরা ভারতীয় রাজনীতিবিদ এবং রাজনৈতিক সাংবাদিকদের অ্যাকাউন্টের মধ্যে মিথস্ক্রিয়া ডেটা সংগ্রহ করি। বিশেষত, আমরা 100টি জনপ্রিয় রাজনৈতিক সাংবাদিক অ্যাকাউন্টের পোস্ট করা সমস্ত টুইট সংগ্রহ করেছি এবং তারপরে আমাদের ডেটাসেটে 100 জন জনপ্রিয় ভারতীয় রাজনীতিবিদদের মধ্যে যেকোনও উল্লেখ করা টুইটগুলিকে ফিল্টার করেছি। এইভাবে, আমরা আমাদের সংগৃহীত টুইটগুলিকে নিম্নলিখিত চারটি বিভাগে বিভক্ত করেছি - পুরুষ সাংবাদিকের টুইটগুলি পুরুষ রাজনীতিবিদদের ( MJ-MP ) উল্লেখ করে, মহিলা সাংবাদিকের টুইটগুলি পুরুষ রাজনীতিবিদদের ( FJ-MP ) উল্লেখ করে, পুরুষ সাংবাদিকের টুইটগুলি মহিলা রাজনীতিবিদদের উল্লেখ করে ( MJ-FP ) এবং মহিলা সাংবাদিক মহিলা রাজনীতিবিদদের ( এফজে-এফপি ) উল্লেখ করেছেন। মোট আমরা 21,188 টি অনন্য টুইট সংগ্রহ করেছি। মনে রাখবেন যে একটি একক টুইট একাধিক অ্যাকাউন্ট উল্লেখ করতে পারে।
আমরা লক্ষ করি যে, লিঙ্গ জুড়ে প্রায় শতাধিক সাংবাদিক সম্মিলিতভাবে তাদের টুইটগুলিতে আমাদের নির্বাচিত জনপ্রিয় রাজনীতিকের অ্যাকাউন্টগুলি উল্লেখ করেছেন। উপরন্তু, টেবিল 1 আমাদের চারটি বিভাগ জুড়ে টুইটের সংখ্যা উপস্থাপন করে। উল্লেখযোগ্যভাবে, মহিলা রাজনীতিবিদদের অ্যাকাউন্টগুলি পুরুষ এবং মহিলা উভয় ভারতীয় সাংবাদিকদের কাছ থেকে যথেষ্ট কম উল্লেখ পেয়েছে। এখন, আমরা ভারতীয় টুইটারে সাংবাদিক-রাজনীতিবিদ মিথস্ক্রিয়ায় সম্ভাব্য লিঙ্গ পক্ষপাত সনাক্ত করতে টুইটার থেকে সংগৃহীত এই ইন্টারঅ্যাকশন ডেটা বিশ্লেষণ করেছি। তদ্ব্যতীত, টেবিল 2 চারটি বিভাগের প্রতিটি থেকে টুইটের উদ্ধৃতি উপস্থাপন করে। এই উদাহরণগুলি দেখায় যে বিভিন্ন বিভাগে আমাদের ডেটাসেটের অনেকগুলি টুইট নীতিগত সিদ্ধান্ত এবং সাধারণ শাসনের সাথে সম্পর্কিত।
[৩] https://www.myneta.info/