Advancing knowledge and solutions in carbonization, shaping sustainable practices for a greener future.
Part of HackerNoon's growing list of open-source research papers, promoting free access to academic material.
লেখক:
(1) আরভ প্যাটেল, অ্যামিটি আঞ্চলিক উচ্চ বিদ্যালয় – ইমেল: aarav.dhp@gmail.com;
(2) পিটার গ্লোর, সেন্টার ফর কালেকটিভ ইন্টেলিজেন্স, ম্যাসাচুসেটস ইনস্টিটিউট অফ টেকনোলজি এবং সংশ্লিষ্ট লেখক – ইমেল: pgloor@mit.edu।
র্যান্ডম ফরেস্ট রিগ্রেশন মডেল সম্ভবত সেরা পারফর্ম করেছে কারণ এটি একাধিক সিদ্ধান্ত গাছের ভবিষ্যদ্বাণীগুলিকে একত্রিত করে কাজ করে। এটি এটির নির্ভুলতা উন্নত করতে এবং একটি নির্দিষ্ট গাছে ওভারফিটিং কমাতে দেয়, এইভাবে উচ্চতর ফলাফল তৈরি করে। র্যান্ডম ফরেস্ট রিগ্রেশন অ্যালগরিদমের একটি পরিসংখ্যানগতভাবে উল্লেখযোগ্য R2 পারস্পরিক সম্পর্ক ছিল 26.1% (p-মান <0.05), এবং এটির 13.4% কম MAAE ছিল। এই ফলাফলগুলি ডেটার অন্যান্য উত্স ব্যবহার করে করা অনুরূপ কাজের সাথে সারিবদ্ধ (ক্র্যাপেল এট আল।, 2021)। উদাহরণস্বরূপ, Krappel এট আল দ্বারা একটি কাগজ. মেশিন-লার্নিং অ্যালগরিদমগুলিতে মৌলিক ডেটা (অর্থাৎ, আর্থিক ডেটা এবং কোম্পানির আশেপাশের সাধারণ তথ্য) খাওয়ানোর মাধ্যমে একটি ESG পূর্বাভাস সিস্টেম তৈরি করেছে। তাদের সবচেয়ে নির্ভুল মডেলটি 54% এর R2 পারস্পরিক সম্পর্ক এবং 11.3% এর MAAE পেয়েছে। যদিও প্রস্তাবিত অ্যালগরিদমটি ক্র্যাপেল এট আল-এর মডেলের সাথে সম্পর্কযুক্ত নয়, সম্ভবত এটি গুণগত ডেটার সুবিধা দেয়, এটি এখনও ESG-এর জন্য একটি প্রক্সি হিসাবে সামাজিক অনুভূতি ব্যবহার করার কার্যকারিতা হাইলাইট করে।
প্রস্তাবিত অ্যালগরিদমটি উত্সাহজনক ফলাফল প্রদর্শন করেছে, ESG রেটিং পূর্বাভাসে এর কার্যকারিতা তুলে ধরেছে। বর্তমান ইএসজি রেটারদের বিপরীতে যারা স্ব-প্রকাশিত স্থায়িত্ব প্রতিবেদন ব্যবহার করে ইএসজি নির্ধারণ করে, প্রস্তাবিত অ্যালগরিদমের ডেটা-চালিত পদ্ধতি আরও সামগ্রিক এবং সুষম মূল্যায়নের অনুমতি দেয়। সামাজিক অনুভূতিকে কাজে লাগানো এক্সিকিউটিভদেরকে পরিমাপ করতে দেয় যে লোকেরা কোন কোম্পানীর উন্নতি করতে চায়, পরিবর্তনের উপর ক্রিয়াকলাপে ফোকাস করতে সাহায্য করে উপরন্তু, সিস্টেমের আর্কিটেকচার স্বল্প সময়ের মধ্যে স্কোর আপডেট করার অনুমতি দেয়। অবশেষে, এক্সিকিউটিভরা অতিরিক্ত কীওয়ার্ডগুলিকে অ্যালগরিদমে ইনপুট করে পরীক্ষা করতে পারেন। এই বৈশিষ্ট্যগুলি সিস্টেমের নমনীয়তার পাশাপাশি প্রচলিত পদ্ধতির উপর সুবিধাগুলি প্রদর্শন করে।
ফলাফলের একটি সীমাবদ্ধতা, তবে, এটি S&P 500 কোম্পানিতে পরীক্ষা করা হয়েছিল। অতএব, এই সূচকের নীচে ছোট কোম্পানিগুলির জন্য ফলাফলগুলি বহন করতে পারে না। আরেকটি সীমাবদ্ধতা সামাজিক নেটওয়ার্ক ডেটার মধ্যে ভুল তথ্য হতে পারে। যদিও এটি অন্যান্য মন্তব্য দ্বারা পাতলা করা উচিত, এটি সম্ভাব্যভাবে অ্যালগরিদমের রেটিং পরিবর্তন করতে পারে। অতিরিক্তভাবে, ফ্লেয়ার সেন্টিমেন্ট বিশ্লেষণ অ্যালগরিদম কখনও কখনও পোস্ট/নিবন্ধের অনুভূতিকে ভুল শ্রেণিবদ্ধ করে, বিশেষ করে যদি পোস্ট/নিবন্ধের একটি ব্যঙ্গাত্মক মনোভাব থাকে। অবশেষে, এই গবেষণার জন্য, নির্দিষ্ট প্রদত্ত নেটিভ এপিআইগুলিতে অ্যাক্সেস উপলব্ধ ছিল না। ফলস্বরূপ, সংগৃহীত ডেটা হার সীমাবদ্ধতার কারণে একটি কীওয়ার্ডের জন্য উপলব্ধ সমস্ত ডেটা অন্তর্ভুক্ত নাও করতে পারে।
যদিও অ্যালগরিদম পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ ফলাফল প্রদর্শন করেছে, সেখানে উন্নতির জন্য জায়গা রয়েছে যা ভবিষ্যতে গবেষণায় করা যেতে পারে। এর মধ্যে কিছু আরও তথ্য সংগ্রহ অন্তর্ভুক্ত করতে পারে। এটি S&P 500 এর বাইরে আরও কোম্পানি বিশ্লেষণ করে বা আরও কীওয়ার্ড এবং ESG উপ-বিষয়গুলির জন্য ডেটা সংগ্রহ করে করা যেতে পারে। এটি স্বতন্ত্র কীওয়ার্ড প্রতি আরও ডেটাপয়েন্ট সংগ্রহ করতে নেটিভ API ব্যবহার করেও করা যেতে পারে। অতিরিক্তভাবে, মডেলটিতে আরও ডেটা উত্স অন্তর্ভুক্ত করা যেতে পারে। এটি অন্যান্য সামাজিক নেটওয়ার্ক (যেমন, রেডডিট, গ্লাসডোর) অন্তর্ভুক্ত করে বা কোম্পানির রিপোর্ট এবং সরকারি ডাটাবেস থেকে পরিমাণগত ডেটা/পরিসংখ্যান (অর্থাৎ, বোর্ড সদস্য হিসাবে % মহিলা, স্কোপ 1 কার্বন নির্গমনের সংখ্যা, ইত্যাদি) অন্তর্ভুক্ত করে করা যেতে পারে।
তদ্ব্যতীত, হাতের কাজটি আরও ভালভাবে ফিট করার জন্য, এনএলপি অ্যালগরিদমগুলি বিশেষভাবে ESG-এর জন্য তৈরি করা যেতে পারে। উদাহরণস্বরূপ, যদিও বর্তমান পদ্ধতিটি অনেক অপ্রাসঙ্গিক ডেটা ফিল্টার করে, কিছু অসংলগ্ন ডেটা এখনও যায়। সুতরাং, এটি সমাধান করার জন্য, একটি নতুন তত্ত্বাবধানে শেখার অ্যালগরিদম টিএফ-আইডিএফ ভেক্টরাইজেশন ব্যবহার করে পাঠ্যের সম্পর্কিত সংস্থাগুলি সনাক্ত করতে প্রশিক্ষণ দেওয়া যেতে পারে। ইতিমধ্যে সংগৃহীত ডেটা হ্যান্ডলেবেল করে অ্যালগরিদমকে প্রশিক্ষণ দেওয়া যেতে পারে। যোগ করার জন্য, দীর্ঘ-নিবন্ধ/শর্ট-পোস্ট এনএলপি অ্যালগরিদমগুলিকে আরও অপ্টিমাইজ করা যেতে পারে। যদিও ফ্লেয়ার ইতিমধ্যেই সন্তোষজনক ফলাফল প্রদান করতে পারে, কিছু নিবন্ধ ভুল শ্রেণীবদ্ধ বলে মনে হচ্ছে, যা অ্যালগরিদমের জন্য ত্রুটির উৎস হতে পারে। বিশেষভাবে ESG শ্রেণীবিভাগের জন্য উপযোগী একটি অনুভূতি বিশ্লেষণ অ্যালগরিদম তৈরি করে, দীর্ঘ-নিবন্ধ এবং সংক্ষিপ্ত-পরবর্তী NLP অ্যালগরিদম নির্ভুলতা আরও উন্নত করা যেতে পারে। এটি ওজন সহ একটি কাস্টম ESG অভিধান তৈরি করে বা শ্রেণিবদ্ধ ESG ডেটার বিরুদ্ধে একটি অভিনব NLP অ্যালগরিদম প্রশিক্ষণের মাধ্যমে করা যেতে পারে।
পরিশেষে, আরও একটি ক্ষেত্র যা উন্নত করতে হবে তা হল পোস্টের বিশ্বাসযোগ্যতা: যদিও অল্প পরিমাণে ভুল তথ্য ফলাফলগুলিকে উল্লেখযোগ্যভাবে পরিবর্তন করতে পারে না, তবুও যতটা সম্ভব এই ঝুঁকি হ্রাস করা সর্বোত্তম। সাহিত্যের একটি ক্রমবর্ধমান সংস্থা রয়েছে যা সামাজিক নেটওয়ার্কগুলিতে জাল সংবাদ সনাক্তকরণের অনুসন্ধান করে৷ সুতরাং, এই পন্থাগুলি সম্ভাব্যভাবে জাল পোস্ট/নিবন্ধ সনাক্ত করতে ব্যবহার করা যেতে পারে (de Beer et al., 2020)। এছাড়াও, কোম্পানি ফাইলিং থেকে অ্যালগরিদমে "কঠিন" পরিমাণগত ডেটা যোগ করা একটি অতিরিক্ত সুরক্ষা হিসাবে ব্যবহার করা যেতে পারে। অবশেষে, অ্যালগরিদম নিরাপদ আউটপুট দেওয়ার জন্য অন্যদের তুলনায় আরও কেন্দ্রীভূত/বিশ্বাসযোগ্য অভিনেতাদের অগ্রাধিকার দিতে পারে।
সামগ্রিকভাবে, এই গবেষণাটি একটি সামাজিক-নেটওয়ার্ক-ভিত্তিক ESG মূল্যায়ন সিস্টেমের জন্য একটি প্রমাণ-অব-ধারণা কাঠামো প্রদান করে। এই কাজটি একটি সামাজিক অনুভূতি ইএসজি পণ্যের জন্য ব্যাকএন্ড যুক্তি হিসাবে পরিবেশন করতে পারে যা অবশেষে নির্বাহীদের দ্বারা ব্যবহার করা যেতে পারে। যদিও প্রাক-প্যাকেজ করা লাইব্রেরিগুলি প্রোটোটাইপিংয়ের উদ্দেশ্যে ব্যবহার করা হয়েছিল, ভবিষ্যতের কাজে, প্রকল্পের এই দিকগুলি অপ্টিমাইজ করা যেতে পারে। বিদ্যমান কাঠামোর বিপরীতে যা স্ব-প্রতিবেদিত কোম্পানি ফাইলিংয়ের উপর নির্ভর করে, প্রস্তাবিত মডেলগুলি কোম্পানির ইএসজি ইতিবাচক এবং নেতিবাচক দিকগুলির আরও ভারসাম্যপূর্ণ দৃষ্টিভঙ্গি গ্রহণ করে। সাধারণভাবে, এটি একটি ESG গ্রাউন্ড ট্রুথের কাছে যেতে সাহায্য করতে পারে যা আরও টেকসই হওয়ার জন্য কোম্পানির অনুশীলনগুলিকে আরও ভালভাবে প্রভাবিত করতে পারে।
এই কাগজটি CC BY-NC-ND 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।