Autores:
(1) Aarav Patel, Escuela Secundaria Regional Amity – correo electrónico: aarav.dhp@gmail.com;
(2) Peter Gloor, Centro de Inteligencia Colectiva, Instituto de Tecnología de Massachusetts y autor correspondiente – correo electrónico: pgloor@mit.edu.
El modelo de regresión de bosque aleatorio mostró los resultados generales más sólidos cuando se probó en una muestra de 64 empresas. El modelo de regresión de bosque aleatorio tuvo la correlación más fuerte con las puntuaciones actuales de S&P Global ESG con un coeficiente de correlación estadísticamente significativo del 26,1 % y un error promedio absoluto (MAAE) del 13,4 % (Figura 5, 6). Esto significa que el algoritmo tiene un valor p de 0,0372 (<0,05), lo que demuestra que está bien calibrado para las soluciones ESG existentes. Por otro lado, si bien los otros modelos tienen MAAE similares, también tienen coeficientes de correlación más bajos que no resultan ser estadísticamente significativos (Figura 6). Por ejemplo, el algoritmo de regresión del vector de soporte tuvo una correlación del 18,3 % y MAAE del 13,7 %, lo que da como resultado un valor p de 0,148 (Figura 8). El modelo XGBoost tuvo una correlación del 16,0 % y MAAE del 14,7 %, lo que resulta en un valor p de 0,207 (Figura 7). Finalmente, el algoritmo K-Vecinos más cercanos tuvo una correlación del 13,2% y un MAAE del 14,0%, lo que es un valor p de 0,298 (Figura 9). Sin embargo, todos los algoritmos tuvieron un MAAE similar que cayó entre 13% y 15%, y el modelo Random Forest tuvo el más bajo con 13,4% (Figura 10). Todos los algoritmos superaron el criterio MAAE del 20,0%.
Este documento está disponible en arxiv bajo licencia CC BY-NC-ND 4.0 DEED.