![Search icon](https://hackernoon.imgix.net/search-new.png?w=19&h=19)
Auteurs:
(1) Aarav Patel, lycée régional Amity – email : [email protected] ;
(2) Peter Gloor, Center for Collective Intelligence, Massachusetts Institute of Technology et auteur correspondant – email : [email protected].
Le modèle Random Forest Regression a affiché les résultats globaux les plus solides lorsqu'il a été testé sur un échantillon de 64 entreprises. Le modèle de régression forestière aléatoire présentait la corrélation la plus forte avec les scores ESG actuels de S&P Global, avec un coefficient de corrélation statistiquement significatif de 26,1 % et une erreur moyenne absolue moyenne (MAAE) de 13,4 % (Figure 5, 6). Cela signifie que l'algorithme a une valeur p de 0,0372 (<0,05), ce qui montre qu'il est bien calibré par rapport aux solutions ESG existantes. En revanche, si les autres modèles ont des MAAE similaires, ils ont également des coefficients de corrélation plus faibles qui ne s'avèrent pas statistiquement significatifs (Figure 6). Par exemple, l'algorithme de régression du vecteur de support avait une corrélation de 18,3 % et un MAAE de 13,7 %, ce qui donne une valeur p de 0,148 (Figure 8). Le modèle XGBoost avait une corrélation de 16,0 % et un MAAE de 14,7 %, ce qui donne une valeur p de 0,207 (Figure 7). Enfin, l'algorithme K-Nearest Neighbours avait une corrélation de 13,2 % et un MAAE de 14,0 %, soit une valeur p de 0,298 (Figure 9). Cependant, tous les algorithmes avaient un MAAE similaire, compris entre 13 % et 15 %, le modèle Random Forest ayant le plus bas à 13,4 % (Figure 10). Tous les algorithmes ont dépassé les critères MAAE de 20,0 %.
Cet article est disponible sur arxiv sous licence CC BY-NC-ND 4.0 DEED.