Detailseite
Projekt Druckansicht

Integration von Text Mining Verfahren mit multivariater Zeitreihenanalyse

Fachliche Zuordnung Statistik und Ökonometrie
Förderung Förderung von 2019 bis 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 426470111
 
Sammlungen von Texten werden zunehmend als wertvolle Informationsquelle für die angewandte Wirtschaftsforschung aufgefasst. Dazu trägt die in jüngerer Zeit zunehmende Verfügbarkeit großer Datensätze in digitaler Form bei, etwa von Abstracts und Volltexten wissenschaftlicher Beiträge, Nachrichtenmeldungen, Beiträgen in sozialen Medien oder institutionellen Mitteilungen. Außerdem gab es eine rasante Entwicklung der Methoden zur Textanalyse. Das Wissen um die Eigenschaften dieser Methoden, insbesondere in Kombination mit den üblichen ökonometrischen Verfahren ist aber begrenzt.Deshalb besteht das Ziel von TEXTMOD darin, einen Beitrag zur Weiterentwicklung der Methoden und zum besseren Verständnis der Kombination von Information aus der Textanalyse mit ökonometrischen Modellen zu leisten. Dabei liegt der Fokus auf multivariaten Zeitreihenmodellen. Mittels der automatischen Textanalyseverfahren werden neue Indikatoren gewonnen. Ein Beispiel für solche, für die angewandte Wirtschaftsforschung relevante Indikatoren, sind Thementrends, die beschreiben, wie die Relevanz eines Themas (z.B. Inflation) im Zeitablauf variiert. Während in den letzten Jahren eine Reihe von Methoden entwickelt wurden, um Themen und deren Trends zu bestimmen, gibt es vergleichsweise wenig Analysen zu den statistischen Eigenschaften dieser Methoden, zu ihrer relativen Leistungsfähigkeit und zu ihrer Integration in übliche Modellierungsansätze. Daher besteht eine zentrale Absicht des Projektes darin, die Sensitivität der Methoden im Hinblick auf Parameterwerte, die Robustheit bezüglich von Variationen der Textquellen und die Unsicherheit, die aus den Methoden selbst stammt, zu untersuchen. Im Projekt sollen auch weitere Verfahren zum Vergleich der Ergebnisse über Textsammlungen hinweg vorgeschlagen werden. In einem weiteren zentralen Schritt werden alternative Verfahren zur Bestimmung der Thementrends und schließlich die Auswirkungen vom Einsatz solcher Thementrends in Zeitreihenmodellen wie den gebräuchlichen vektor-autoregressiven Modellen untersucht. Dabei wird ein spezielles Augenmerk auf die Interpretation der Ergebnisse, die Bewertung des Erkenntnisgewinns durch den Einsatz der zusätzlichen textbasierten Indikatoren und eine sorgfältige Messung der Unsicherheit, die durch gemeinsame Konfidenzbänder ausgedrückt wird, gelegt. Die Methoden werden angewandt, um die Beziehungen zwischen realen Wirtschaftsindikatoren und Thementrends aus wirtschaftswissenschaftlichen Publikationen in Polen und Deutschland zu untersuchen.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Polen
Partnerorganisation Narodowe Centrum Nauki (NCN)
Kooperationspartnerinnen / Kooperationspartner Dr. Victor Bystrov; Dr. Anna Staszewska-Bystrova
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung