저자:
(1) Aarav Patel, Amity 지역 고등학교 - 이메일: aarav.dhp@gmail.com;
(2) Peter Gloor, MIT 집단지성센터, 교신저자 – 이메일: pgloor@mit.edu.
Random Forest Regression 모델은 64개 회사의 홀드아웃 샘플에서 테스트했을 때 가장 강력한 전체 결과를 보여주었습니다. Random Forest Regression 모델은 통계적으로 유의미한 상관계수 26.1%, 평균절대평균오차(MAAE) 13.4%로 현재 S&P Global ESG 점수와 가장 강한 상관관계를 보였습니다(그림 5, 6). 이는 알고리즘의 p-값이 0.0372(<0.05)라는 것을 의미하며, 이는 기존 ESG 솔루션에 잘 보정되어 있음을 나타냅니다. 반면, 다른 모델의 MAAE는 유사하지만 통계적으로 유의미한 것으로 입증되지 않는 낮은 상관 계수도 있습니다(그림 6). 예를 들어, 지원 벡터 회귀(Support Vector Regression) 알고리즘의 상관 관계는 18.3%, MAAE는 13.7%였으며, 그 결과 p-값은 0.148이 되었습니다(그림 8). XGBoost 모델의 상관관계는 16.0%, MAAE는 14.7%였으며, 그 결과 p-값은 0.207이었습니다(그림 7). 마지막으로, K-Nearest Neighbors 알고리즘의 상관관계는 13.2%, MAAE는 14.0%였으며, 이는 p-값이 0.298입니다(그림 9). 그러나 모든 알고리즘의 MAAE는 13%~15% 사이로 떨어졌으며 Random Forest 모델이 13.4%로 가장 낮았습니다(그림 10). 모든 알고리즘은 MAAE 기준인 20.0%를 초과했습니다.
이 문서는 CC BY-NC-ND 4.0 DEED 라이센스에 따라 arxiv에서 볼 수 있습니다.