Autores:
(1) Aarav Patel, Amity Regional High School – e-mail: aarav.dhp@gmail.com;
(2) Peter Gloor, Centro de Inteligência Coletiva, Instituto de Tecnologia de Massachusetts e autor correspondente – email: pgloor@mit.edu.
O modelo Random Forest Regression apresentou os resultados gerais mais fortes quando testado em uma amostra de 64 empresas. O modelo Random Forest Regression teve a correlação mais forte com as pontuações ESG atuais da S&P Global, com um coeficiente de correlação estatisticamente significativo de 26,1% e um erro médio absoluto médio (MAAE) de 13,4% (Figura 5, 6). Isso significa que o algoritmo tem um valor p de 0,0372 (<0,05), mostrando que está bem calibrado para as soluções ESG existentes. Por outro lado, embora os restantes modelos tenham MAAE semelhantes, também apresentam coeficientes de correlação mais baixos que não se revelam estatisticamente significativos (Figura 6). Por exemplo, o algoritmo Support Vector Regression teve uma correlação de 18,3% e MAAE de 13,7%, o que resulta em um valor p de 0,148 (Figura 8). O modelo XGBoost apresentou correlação de 16,0% e MAAE de 14,7%, o que resulta em valor p de 0,207 (Figura 7). Por fim, o algoritmo K-Nearest Neighbours apresentou uma correlação de 13,2% e um MAAE de 14,0%, que é um valor p de 0,298 (Figura 9). No entanto, todos os algoritmos tiveram um MAAE semelhante que ficou entre 13% -15%, com o modelo Random Forest tendo o menor valor de 13,4% (Figura 10). Todos os algoritmos superaram o critério MAAE de 20,0%.
Este artigo está disponível no arxiv sob licença CC BY-NC-ND 4.0 DEED.