tác giả:
(1) Aarav Patel, Trường Trung học Khu vực Amity – email: [email protected];
(2) Peter Gloor, Trung tâm Trí tuệ Tập thể, Viện Công nghệ Massachusetts và tác giả tương ứng – email: [email protected].
Mô hình hồi quy rừng ngẫu nhiên có thể hoạt động tốt nhất vì nó hoạt động bằng cách kết hợp các dự đoán của nhiều cây quyết định. Điều này cho phép nó cải thiện độ chính xác và giảm việc trang bị quá mức cho một cây cụ thể, từ đó tạo ra kết quả vượt trội. Thuật toán hồi quy rừng ngẫu nhiên có Tương quan R2 có ý nghĩa thống kê là 26,1% (giá trị p <0,05) và có MAAE thấp là 13,4%. Những kết quả này phù hợp với công việc tương tự được thực hiện bằng cách sử dụng các nguồn dữ liệu khác (Krappel và cộng sự, 2021). Ví dụ, một bài báo của Krappel et al. đã tạo ra một hệ thống dự đoán ESG bằng cách cung cấp dữ liệu cơ bản (tức là dữ liệu tài chính và thông tin chung xung quanh công ty) vào các thuật toán học máy tổng hợp. Mô hình chính xác nhất của họ nhận được mối tương quan R2 là 54% và MAAE là 11,3%. Mặc dù thuật toán đề xuất không tương quan tốt như mô hình của Krappel và cộng sự, có thể là do nó tận dụng dữ liệu định tính, nhưng nó vẫn nêu bật tính khả thi của việc sử dụng cảm tính xã hội làm đại diện cho ESG.
Thuật toán đề xuất đã hiển thị các kết quả đáng khích lệ, làm nổi bật khả năng tồn tại của nó trong dự đoán xếp hạng ESG. Không giống như những người đánh giá ESG hiện tại xác định ESG bằng cách sử dụng các báo cáo bền vững tự công bố, cách tiếp cận dựa trên dữ liệu của thuật toán được đề xuất cho phép đánh giá toàn diện và cân bằng hơn. Việc sử dụng cảm tính xã hội cũng cho phép các giám đốc điều hành đo lường những lĩnh vực mà mọi người muốn công ty cải thiện, giúp tập trung hành động vào việc thay đổi. Ngoài ra, kiến trúc của hệ thống cho phép cập nhật điểm số trong khung thời gian ngắn. Cuối cùng, giám đốc điều hành có thể kiểm tra các từ khóa bổ sung bằng cách nhập chúng vào thuật toán. Những thuộc tính này thể hiện tính linh hoạt của hệ thống cũng như những ưu điểm so với phương pháp truyền thống.
Tuy nhiên, một hạn chế của kết quả là nó đã được thử nghiệm trên các công ty S&P 500. Do đó, kết quả có thể không được áp dụng cho các công ty nhỏ hơn nằm dưới chỉ số này. Một hạn chế khác có thể là thông tin sai lệch trong dữ liệu mạng xã hội. Mặc dù điều này có thể bị các nhận xét khác làm loãng đi, nhưng nó có khả năng làm thay đổi xếp hạng của thuật toán. Ngoài ra, thuật toán phân tích cảm xúc của Flair đôi khi phân loại sai cảm xúc của bài đăng/bài viết, đặc biệt nếu bài đăng/bài viết đó có thái độ mỉa mai. Cuối cùng, đối với nghiên cứu này, không có quyền truy cập vào một số API gốc trả phí nhất định. Kết quả là dữ liệu được thu thập có thể không bao gồm tất cả dữ liệu có sẵn cho một từ khóa do giới hạn tỷ lệ.
Mặc dù thuật toán đã hiển thị các kết quả có ý nghĩa thống kê nhưng vẫn còn chỗ để cải thiện trong nghiên cứu trong tương lai. Một số điều này có thể bao gồm việc thu thập thêm dữ liệu. Điều này có thể được thực hiện bằng cách phân tích nhiều công ty hơn ngoài S&P 500 hoặc bằng cách thu thập dữ liệu cho nhiều từ khóa và chủ đề phụ ESG hơn. Điều này cũng có thể được thực hiện bằng cách sử dụng API gốc để thu thập thêm điểm dữ liệu cho mỗi từ khóa riêng lẻ. Ngoài ra, nhiều nguồn dữ liệu hơn có thể được tích hợp vào mô hình. Điều này có thể được thực hiện bằng cách kết hợp các mạng xã hội khác (ví dụ Reddit, Glassdoor) hoặc bằng cách đưa vào dữ liệu/thống kê định lượng (ví dụ: % phụ nữ là thành viên hội đồng quản trị, số lượng phát thải carbon phạm vi 1, v.v.) từ các báo cáo của công ty và cơ sở dữ liệu của chính phủ.
Hơn nữa, để phù hợp hơn với nhiệm vụ hiện tại, các thuật toán NLP có thể được tạo riêng cho ESG. Ví dụ: trong khi phương pháp hiện tại lọc phần lớn dữ liệu không liên quan thì một số dữ liệu không liên quan vẫn được xử lý. Vì vậy, để giải quyết vấn đề này, một thuật toán học có giám sát mới có thể được đào tạo để xác định các nội dung văn bản có liên quan bằng cách sử dụng vectơ TF-IDF. Thuật toán có thể được huấn luyện bằng cách dán nhãn thủ công cho dữ liệu đã được thu thập. Ngoài ra, thuật toán NLP bài viết dài/bài ngắn cũng có thể được tối ưu hóa hơn nữa. Mặc dù Flair đã có thể cung cấp kết quả khả quan nhưng một số bài báo dường như bị phân loại sai, đây có thể là nguyên nhân gây ra lỗi cho thuật toán. Bằng cách tạo thuật toán phân tích tình cảm được thiết kế riêng cho phân loại ESG, độ chính xác của thuật toán NLP bài viết dài và bài viết ngắn có thể được cải thiện hơn nữa. Điều này có thể được thực hiện bằng cách tạo từ vựng ESG tùy chỉnh có trọng số hoặc bằng cách huấn luyện thuật toán NLP mới dựa trên dữ liệu ESG đã được phân loại.
Cuối cùng, một lĩnh vực khác cần được cải thiện là độ tin cậy sau: Mặc dù một lượng nhỏ thông tin sai lệch sẽ không làm thay đổi đáng kể kết quả, nhưng tốt nhất vẫn là giảm thiểu rủi ro này càng nhiều càng tốt. Ngày càng có nhiều tài liệu khám phá việc nhận dạng tin tức giả trên mạng xã hội. Vì vậy, những cách tiếp cận này có thể được sử dụng để xác định các bài đăng/bài viết giả mạo (de Beer và cộng sự, 2020). Ngoài ra, việc thêm dữ liệu định lượng “cứng” từ hồ sơ công ty vào thuật toán có thể được sử dụng như một biện pháp bảo vệ bổ sung. Cuối cùng, thuật toán có thể ưu tiên các tác nhân tập trung/đáng tin cậy hơn những tác nhân khác để mang lại kết quả đầu ra an toàn hơn.
Nhìn chung, nghiên cứu này cung cấp khung chứng minh khái niệm cho hệ thống đánh giá ESG dựa trên mạng xã hội. Công việc này có thể đóng vai trò là logic phụ trợ cho một sản phẩm ESG về tình cảm xã hội mà cuối cùng các nhà điều hành có thể sử dụng. Mặc dù các thư viện đóng gói sẵn được sử dụng cho mục đích tạo mẫu nhưng trong các công việc sau này, những khía cạnh này của dự án có thể được tối ưu hóa. Không giống như các khuôn khổ hiện tại dựa vào hồ sơ tự báo cáo của công ty, các mô hình được đề xuất có cái nhìn cân bằng hơn về các mặt tích cực và tiêu cực của ESG của công ty. Nói chung, điều này có thể giúp tiếp cận sự thật cơ bản về ESG có thể tác động tốt hơn đến các hoạt động của công ty để trở nên bền vững hơn.
Bài viết này có sẵn trên arxiv theo giấy phép CC BY-NC-ND 4.0 DEED.