Autoren:
(1) Aarav Patel, Amity Regional High School – E-Mail: aarav.dhp@gmail.com;
(2) Peter Gloor, Center for Collective Intelligence, Massachusetts Institute of Technology und korrespondierender Autor – E-Mail: pgloor@mit.edu.
Das Random-Forest-Regressionsmodell hat wahrscheinlich die beste Leistung erbracht, da es die Vorhersagen mehrerer Entscheidungsbäume kombiniert. Dadurch kann es seine Genauigkeit verbessern und die Überanpassung an einen bestimmten Baum reduzieren, was zu besseren Ergebnissen führt. Der Random-Forest-Regressionsalgorithmus hatte eine statistisch signifikante R2-Korrelation von 26,1 % (p-Wert < 0,05) und einen niedrigen MAAE von 13,4 %. Diese Ergebnisse stimmen mit ähnlichen Arbeiten überein, die mit anderen Datenquellen durchgeführt wurden (Krappel et al., 2021). Beispielsweise wurde in einem Artikel von Krappel et al. ein ESG-Vorhersagesystem erstellt, indem grundlegende Daten (d. h. Finanzdaten und allgemeine Informationen zum Unternehmen) in Ensemble-Maschinenlernalgorithmen eingespeist wurden. Ihr genauestes Modell erhielt eine R2-Korrelation von 54 % und einen MAAE von 11,3 %. Obwohl der vorgeschlagene Algorithmus nicht so gut korreliert wie das Modell von Krappel et al., wahrscheinlich weil er qualitative Daten nutzt, unterstreicht er dennoch die Durchführbarkeit der Verwendung sozialer Stimmungen als Proxy für ESG.
Der vorgeschlagene Algorithmus zeigte ermutigende Ergebnisse und unterstrich damit seine Eignung für die Vorhersage von ESG-Bewertungen. Anders als aktuelle ESG-Bewerter, die ESG anhand von selbst offengelegten Nachhaltigkeitsberichten bestimmen, ermöglicht der datengesteuerte Ansatz des vorgeschlagenen Algorithmus eine ganzheitlichere und ausgewogenere Bewertung. Durch die Nutzung sozialer Stimmungen können Führungskräfte außerdem messen, in welchen Bereichen sich die Menschen Verbesserungen von einem Unternehmen wünschen, was dazu beiträgt, Maßnahmen auf Veränderungen zu konzentrieren. Darüber hinaus ermöglicht die Architektur des Systems eine Aktualisierung der Bewertungen innerhalb kurzer Zeiträume. Schließlich können Führungskräfte zusätzliche Schlüsselwörter testen, indem sie diese in den Algorithmus eingeben. Diese Eigenschaften zeigen die Flexibilität des Systems sowie seine Vorteile gegenüber der herkömmlichen Methodik.
Eine Einschränkung der Ergebnisse besteht jedoch darin, dass sie an Unternehmen des S&P 500 getestet wurden. Daher sind die Ergebnisse möglicherweise nicht auf kleinere Unternehmen unterhalb dieses Index übertragbar. Eine weitere Einschränkung könnten Fehlinformationen in den Daten des sozialen Netzwerks sein. Diese sollten zwar durch andere Kommentare verwässert werden, können aber möglicherweise die Bewertungen des Algorithmus verändern. Darüber hinaus klassifizierte der Sentimentanalysealgorithmus von Flair die Stimmung von Posts/Artikeln manchmal falsch, insbesondere wenn der Post/Artikel eine sarkastische Haltung hatte. Schließlich war für diese Untersuchung der Zugriff auf bestimmte kostenpflichtige native APIs nicht verfügbar. Daher umfassen die gesammelten Daten aufgrund von Ratenbegrenzungen möglicherweise nicht alle für ein Schlüsselwort verfügbaren Daten.
Obwohl der Algorithmus statistisch signifikante Ergebnisse gezeigt hat, besteht in zukünftigen Untersuchungen noch Verbesserungspotenzial. Dazu kann beispielsweise die Erfassung weiterer Daten gehören. Dies kann durch die Analyse weiterer Unternehmen über den S&P 500 hinaus oder durch die Erfassung von Daten für weitere Schlüsselwörter und ESG-Unterthemen erreicht werden. Dies kann auch durch die Verwendung nativer APIs erreicht werden, um mehr Datenpunkte pro einzelnem Schlüsselwort zu erfassen. Darüber hinaus könnten weitere Datenquellen in das Modell integriert werden. Dies kann durch die Einbindung anderer sozialer Netzwerke (z. B. Reddit, Glassdoor) oder durch die Aufnahme quantitativer Daten/Statistiken (z. B. Prozentsatz Frauen in Vorstandsmitgliedern, Anzahl der CO2-Emissionen des Geltungsbereichs 1 usw.) aus Unternehmensberichten und staatlichen Datenbanken erreicht werden.
Darüber hinaus können NLP-Algorithmen speziell für ESG erstellt werden, um die jeweilige Aufgabe besser zu erfüllen. Während beispielsweise die aktuelle Methode viele der irrelevanten Daten filtert, kommen dennoch einige nicht verwandte Daten durch. Um dieses Problem zu lösen, kann ein neuer überwachter Lernalgorithmus trainiert werden, um verwandte Textkörper mithilfe der TF-IDF-Vektorisierung zu identifizieren. Der Algorithmus kann trainiert werden, indem die bereits gesammelten Daten manuell beschriftet werden. Darüber hinaus können die NLP-Algorithmen für lange Artikel/kurze Beiträge auch weiter optimiert werden. Während Flair bereits zufriedenstellende Ergebnisse liefern kann, scheinen einige Artikel falsch klassifiziert zu sein, was eine Fehlerquelle für den Algorithmus sein könnte. Durch die Erstellung eines speziell auf die ESG-Klassifizierung zugeschnittenen Sentimentanalyse-Algorithmus kann die Genauigkeit des NLP-Algorithmus für lange Artikel und kurze Beiträge weiter verbessert werden. Dies kann entweder durch die Erstellung eines benutzerdefinierten ESG-Lexikons mit Gewichten oder durch das Trainieren eines neuen NLP-Algorithmus anhand klassifizierter ESG-Daten erreicht werden.
Ein weiterer Bereich, der verbessert werden muss, ist die Glaubwürdigkeit von Posts: Kleine Mengen an Falschinformationen würden die Ergebnisse zwar nicht wesentlich verändern, dennoch ist es am besten, dieses Risiko so weit wie möglich zu minimieren. Es gibt immer mehr Literatur, die sich mit der Identifizierung von Fake News in sozialen Netzwerken beschäftigt. Diese Ansätze können also potenziell zur Identifizierung gefälschter Posts/Artikel verwendet werden (de Beer et al., 2020). Als zusätzliche Sicherheitsmaßnahme kann auch das Hinzufügen „harter“ quantitativer Daten aus Unternehmensanmeldungen zum Algorithmus dienen. Schließlich kann der Algorithmus zentralere/glaubwürdigere Akteure gegenüber anderen priorisieren, um sicherere Ergebnisse zu erzielen.
Insgesamt liefert diese Forschung einen Proof-of-Concept-Rahmen für ein auf sozialen Netzwerken basierendes ESG-Bewertungssystem. Diese Arbeit kann als Backend-Logik für ein ESG-Produkt zur sozialen Stimmung dienen, das letztendlich von Führungskräften verwendet werden kann. Während vorgefertigte Bibliotheken zu Prototyping-Zwecken verwendet wurden, können diese Aspekte des Projekts in zukünftigen Arbeiten optimiert werden. Im Gegensatz zu bestehenden Rahmenwerken, die auf selbst gemeldeten Unternehmensunterlagen basieren, bieten die vorgeschlagenen Modelle eine ausgewogenere Sicht auf die positiven und negativen ESG-Faktoren des Unternehmens. Im Allgemeinen kann dies dazu beitragen, eine ESG-Grundwahrheit zu erreichen, die die Unternehmenspraktiken besser beeinflussen kann, um nachhaltiger zu werden.
Dieses Dokument ist auf arxiv unter der Lizenz CC BY-NC-ND 4.0 DEED verfügbar .