Yazarlar:
(1) Aarav Patel, Amity Bölge Lisesi – e-posta: [email protected];
(2) Peter Gloor, Kolektif Zeka Merkezi, Massachusetts Teknoloji Enstitüsü ve Sorumlu yazar – e-posta: [email protected].
Rastgele Orman Regresyon Modeli muhtemelen en iyi performansı gösterdi çünkü birden fazla karar ağacının tahminlerini birleştirerek çalışıyor. Bu, doğruluğunu artırmasına ve belirli bir ağaca aşırı uyumu azaltmasına ve böylece üstün sonuçlar üretmesine olanak tanır. Rastgele Orman Regresyon algoritması %26,1'lik istatistiksel olarak anlamlı bir R2 Korelasyonuna (p-değeri <0,05) ve %13,4'lük düşük bir MAAE'ye sahipti. Bu sonuçlar, diğer veri kaynakları kullanılarak yapılan benzer çalışmalarla uyumludur (Krappel ve diğerleri, 2021). Örneğin, Krappel ve arkadaşlarının bir makalesi. temel verileri (yani finansal veriler ve şirketi çevreleyen genel bilgiler) toplu makine öğrenimi algoritmalarına besleyerek bir ESG tahmin sistemi oluşturdu. En doğru modelleri %54'lük bir R2 korelasyonu ve %11,3'lük bir MAAE elde etti. Önerilen algoritma, muhtemelen niteliksel verilerden yararlandığı için Krappel ve diğerlerinin modeli kadar iyi korelasyon göstermese de, yine de sosyal duyarlılığın ÇSY için bir vekil olarak kullanılmasının uygulanabilirliğini vurgulamaktadır.
Önerilen algoritma, ESG derecelendirme tahminindeki uygulanabilirliğini vurgulayan cesaret verici sonuçlar sergiledi. Kendi kendine açıklanan sürdürülebilirlik raporlarını kullanarak ESG'yi belirleyen mevcut ESG değerlendiricilerinin aksine, önerilen algoritmanın veriye dayalı yaklaşımı daha bütünsel ve dengeli bir değerlendirmeye olanak tanıyor. Sosyal duyarlılıktan yararlanmak aynı zamanda yöneticilerin insanların bir şirketin hangi alanlarda gelişmesini istediğini ölçmesine olanak tanıyarak, değişime yönelik eylemlere odaklanmaya yardımcı olur. Ayrıca sistemin mimarisi, puanların kısa zaman dilimleri içinde güncellenmesine olanak tanır. Son olarak yöneticiler, algoritmaya girerek ek anahtar kelimeleri test edebilirler. Bu özellikler sistemin esnekliğinin yanı sıra geleneksel metodolojiye göre avantajlarını da ortaya koyuyor.
Ancak sonuçların bir sınırlaması, S&P 500 şirketleri üzerinde test edilmiş olmasıdır. Bu nedenle sonuçlar bu endeksin altındaki daha küçük şirketlere aktarılmayabilir. Diğer bir sınırlama sosyal ağ verilerindeki yanlış bilgiler olabilir. Bunun diğer yorumlarla seyreltilmesi gerekse de algoritmanın derecelendirmelerini potansiyel olarak değiştirebilir. Ek olarak, Flair duygu analizi algoritması bazen, özellikle gönderinin/makalenin alaycı bir tavrı varsa, gönderi/makale duyarlılığını yanlış sınıflandırıyordu. Son olarak bu araştırma için belirli ücretli yerel API'lere erişim mevcut değildi. Sonuç olarak, hız sınırlaması nedeniyle toplanan veriler bir anahtar kelimeye ilişkin mevcut tüm verileri kapsamayabilir.
Algoritma istatistiksel olarak anlamlı sonuçlar gösterse de gelecekteki araştırmalarda yapılabilecek iyileştirmeler vardır. Bunlardan bazıları daha fazla veri toplamayı içerebilir. Bu, S&P 500'ün ötesinde daha fazla şirketi analiz ederek veya daha fazla anahtar kelime ve ESG alt konusu için veri toplayarak yapılabilir. Bu, ayrı anahtar kelime başına daha fazla veri noktası toplamak için yerel API'ler kullanılarak da yapılabilir. Ayrıca modele daha fazla veri kaynağı dahil edilebilir. Bu, diğer sosyal ağların (örn. Reddit, Glassdoor) dahil edilmesiyle veya şirket raporlarından ve devlet veritabanlarından niceliksel verilerin/istatistiklerin (örn. yönetim kurulu üyesi olarak kadınların yüzdesi, kapsam 1 karbon emisyonlarının sayısı vb.) dahil edilmesiyle yapılabilir.
Ayrıca eldeki göreve daha iyi uyum sağlamak için NLP algoritmaları ESG'ye özel olarak oluşturulabilir. Örneğin, mevcut yöntem ilgisiz verilerin çoğunu filtrelerken, bazı ilgisiz veriler yine de içeri giriyor. Dolayısıyla, bunu çözmek için, TF-IDF vektörizasyonunu kullanarak ilgili metin gövdelerini tanımlamak üzere yeni bir denetimli öğrenme algoritması eğitilebilir. Algoritma, önceden toplanmış olan verilerin elle etiketlenmesiyle eğitilebilir. Ek olarak, uzun makale/kısa gönderi NLP algoritmaları da daha da optimize edilebilir. Flair zaten tatmin edici sonuçlar sunabiliyor olsa da bazı makaleler yanlış sınıflandırılmış gibi görünüyor ve bu da algoritma için bir hata kaynağı olabilir. Özellikle ESG sınıflandırmasına göre uyarlanmış bir duyarlılık analizi algoritması oluşturularak, uzun makale ve kısa mesaj NLP algoritmasının doğruluğu daha da geliştirilebilir. Bu, ağırlıklara sahip özel bir ESG sözlüğü oluşturarak veya sınıflandırılmış ESG verilerine karşı yeni bir NLP algoritması eğiterek yapılabilir.
Son olarak, geliştirilmesi gereken bir diğer alan ise post-güvenilirliktir: Az miktardaki yanlış bilgi, sonuçları önemli ölçüde değiştirmese de, yine de bu riski mümkün olduğu kadar azaltmak en iyisidir. Sosyal ağlarda sahte haber tespitini araştıran giderek artan bir literatür var. Dolayısıyla bu yaklaşımlar potansiyel olarak sahte gönderileri/makaleleri tanımlamak için kullanılabilir (de Beer ve diğerleri, 2020). Ayrıca şirket kayıtlarından "sabit" niceliksel verilerin algoritmaya eklenmesi ek bir koruma olarak kullanılabilir. Son olarak, algoritma daha güvenli çıktılar elde etmek için daha merkezi/güvenilir aktörlere diğerlerine göre öncelik verebilir.
Genel olarak bu araştırma, sosyal ağ tabanlı bir ÇSY değerlendirme sistemi için kavram kanıtlama çerçevesi sağlar. Bu çalışma, sonunda yöneticiler tarafından kullanılabilecek bir sosyal duyarlılık ESG ürünü için arka uç mantığı olarak hizmet edebilir. Önceden paketlenmiş kütüphaneler prototip oluşturma amacıyla kullanılmış olsa da gelecekteki çalışmalarda projenin bu yönleri optimize edilebilir. Kendi kendine bildirilen şirket başvurularına dayanan mevcut çerçevelerin aksine, önerilen modeller şirketin ESG olumlu ve olumsuz yönlerine ilişkin daha dengeli bir bakış açısı benimsiyor. Genel olarak bu, şirket uygulamalarını daha sürdürülebilir kılmak için daha iyi etkileyebilecek bir ÇSY temel gerçeğine yaklaşmaya yardımcı olabilir.