paint-brush
Creación de un sistema sistemático de puntuación ESG: debatepor@carbonization
203 lecturas

Creación de un sistema sistemático de puntuación ESG: debate

Demasiado Largo; Para Leer

Este proyecto tiene como objetivo crear un sistema de evaluación ESG basado en datos que pueda proporcionar una mejor orientación y puntuaciones más sistematizadas incorporando el sentimiento social.
featured image - Creación de un sistema sistemático de puntuación ESG: debate
Carbonization Process Evolution Publication HackerNoon profile picture
0-item

Autores:

(1) Aarav Patel, Escuela Secundaria Regional Amity – correo electrónico: [email protected];

(2) Peter Gloor, Centro de Inteligencia Colectiva, Instituto de Tecnología de Massachusetts y autor correspondiente – correo electrónico: [email protected].

Tabla de enlaces

6. Discusión

El modelo de regresión de bosque aleatorio probablemente obtuvo el mejor rendimiento porque funciona combinando las predicciones de múltiples árboles de decisión. Esto le permite mejorar su precisión y reducir el sobreajuste a un árbol específico, produciendo así resultados superiores. El algoritmo de regresión de bosque aleatorio tuvo una correlación R2 estadísticamente significativa del 26,1 % (valor de p <0,05) y un MAAE bajo del 13,4 %. Estos resultados se alinean con trabajos similares realizados con otras fuentes de datos (Krappel et al., 2021). Por ejemplo, un artículo de Krappel et al. creó un sistema de predicción ESG alimentando datos fundamentales (es decir, datos financieros e información general sobre la empresa) en algoritmos conjuntos de aprendizaje automático. Su modelo más preciso recibió una correlación R2 del 54 % y un MAAE del 11,3 %. Si bien el algoritmo propuesto no se correlaciona tan bien como el modelo de Krappel et al., probablemente porque aprovecha datos cualitativos, aún resalta la viabilidad de utilizar el sentimiento social como indicador de ESG.


El algoritmo propuesto mostró resultados alentadores, destacando su viabilidad en la predicción de calificaciones ESG. A diferencia de los actuales evaluadores de ESG, que determinan los ESG mediante informes de sostenibilidad autodivulgados, el enfoque basado en datos del algoritmo propuesto permite una evaluación más holística y equilibrada. Utilizar el sentimiento social también permite a los ejecutivos medir en qué áreas la gente quiere que mejore una empresa, lo que ayuda a centrar las acciones en el cambio. Además, la arquitectura del sistema permite que las puntuaciones se actualicen en plazos cortos. Finalmente, los ejecutivos pueden probar palabras clave adicionales ingresándolas en el algoritmo. Estos atributos muestran la flexibilidad del sistema, así como las ventajas sobre la metodología convencional.


Sin embargo, una limitación de los resultados es que se probaron en las empresas del S&P 500. Por lo tanto, es posible que los resultados no se trasladen a las empresas más pequeñas por debajo de este índice. Otra limitación podría ser la desinformación dentro de los datos de las redes sociales. Si bien esto debería diluirse con otros comentarios, potencialmente puede alterar las calificaciones del algoritmo. Además, el algoritmo de análisis de sentimiento de Flair a veces clasificaba erróneamente el sentimiento de la publicación/artículo, especialmente si la publicación/artículo tenía una actitud sarcástica. Finalmente, para esta investigación, el acceso a ciertas API nativas pagas no estaba disponible. Como resultado, es posible que los datos recopilados no abarquen todos los datos disponibles para una palabra clave debido a la limitación de la tasa.


Si bien el algoritmo ha mostrado resultados estadísticamente significativos, hay margen de mejora que se puede realizar en futuras investigaciones. Algo de esto puede incluir la recopilación de más datos. Esto se puede hacer analizando más empresas más allá del S&P 500 o recopilando datos para más palabras clave y subtemas ESG. Esto también se puede hacer mediante el uso de API nativas para recopilar más puntos de datos por palabra clave individual. Además, se podrían incorporar más fuentes de datos al modelo. Esto se puede hacer incorporando otras redes sociales (es decir, Reddit, Glassdoor) o incluyendo datos/estadísticas cuantitativas (es decir, % de mujeres como miembros de la junta directiva, número de emisiones de carbono de alcance 1, etc.) de informes de la empresa y bases de datos gubernamentales.


Además, para adaptarse mejor a la tarea en cuestión, se pueden crear algoritmos de PNL específicamente para ESG. Por ejemplo, aunque el método actual filtra gran parte de los datos irrelevantes, algunos datos no relacionados aún pasan. Entonces, para resolver esto, se puede entrenar un nuevo algoritmo de aprendizaje supervisado para identificar cuerpos de texto relacionados mediante la vectorización TF-IDF. El algoritmo se puede entrenar etiquetando manualmente los datos que ya se han recopilado. Además, los algoritmos de PNL para artículos largos y publicaciones cortas también se pueden optimizar aún más. Si bien Flair ya puede proporcionar resultados satisfactorios, algunos artículos parecen estar mal clasificados, lo que podría ser una fuente de error para el algoritmo. Al crear un algoritmo de análisis de sentimiento diseñado específicamente para la clasificación ESG, se puede mejorar aún más la precisión del algoritmo de PNL para artículos largos y publicaciones cortas. Esto se puede hacer creando un léxico ESG personalizado con ponderaciones o entrenando un nuevo algoritmo de PNL con datos ESG clasificados.


Finalmente, otra área que se debe mejorar es la credibilidad posterior: si bien pequeñas cantidades de información errónea no alterarían significativamente los resultados, es mejor mitigar este riesgo tanto como sea posible. Existe un creciente cuerpo de literatura que explora la identificación de noticias falsas en las redes sociales. Por lo tanto, estos enfoques pueden usarse potencialmente para identificar publicaciones/artículos falsos (de Beer et al., 2020). Además, agregar al algoritmo datos cuantitativos “fijos” de las presentaciones de la empresa puede usarse como protección adicional. Finalmente, el algoritmo puede priorizar actores más centralizados/creíbles sobre otros para generar resultados más seguros.


En general, esta investigación proporciona un marco de prueba de concepto para un sistema de evaluación ESG basado en redes sociales. Este trabajo puede servir como lógica de backend para un producto ESG de sentimiento social que eventualmente podrán utilizar los ejecutivos. Si bien se utilizaron bibliotecas preempaquetadas con fines de creación de prototipos, en trabajos futuros estos aspectos del proyecto se pueden optimizar. A diferencia de los marcos existentes que se basan en declaraciones de las propias empresas, los modelos propuestos adoptan una visión más equilibrada de los aspectos positivos y negativos de ESG de la empresa. En general, esto puede ayudar a abordar una verdad fundamental sobre ESG que pueda influir mejor en las prácticas de la empresa para que sean más sostenibles.


Este documento está disponible en arxiv bajo licencia CC BY-NC-ND 4.0 DEED.