Detailseite
Integration von Text Mining Verfahren mit multivariater Zeitreihenanalyse
Antragsteller
Professor Dr. Peter Winker
Fachliche Zuordnung
Statistik und Ökonometrie
Förderung
Förderung von 2019 bis 2023
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 426470111
Sammlungen von Texten werden zunehmend als wertvolle Informationsquelle für die angewandte Wirtschaftsforschung aufgefasst. Dazu trägt die in jüngerer Zeit zunehmende Verfügbarkeit großer Datensätze in digitaler Form bei, etwa von Abstracts und Volltexten wissenschaftlicher Beiträge, Nachrichtenmeldungen, Beiträgen in sozialen Medien oder institutionellen Mitteilungen. Außerdem gab es eine rasante Entwicklung der Methoden zur Textanalyse. Das Wissen um die Eigenschaften dieser Methoden, insbesondere in Kombination mit den üblichen ökonometrischen Verfahren ist aber begrenzt.Deshalb besteht das Ziel von TEXTMOD darin, einen Beitrag zur Weiterentwicklung der Methoden und zum besseren Verständnis der Kombination von Information aus der Textanalyse mit ökonometrischen Modellen zu leisten. Dabei liegt der Fokus auf multivariaten Zeitreihenmodellen. Mittels der automatischen Textanalyseverfahren werden neue Indikatoren gewonnen. Ein Beispiel für solche, für die angewandte Wirtschaftsforschung relevante Indikatoren, sind Thementrends, die beschreiben, wie die Relevanz eines Themas (z.B. Inflation) im Zeitablauf variiert. Während in den letzten Jahren eine Reihe von Methoden entwickelt wurden, um Themen und deren Trends zu bestimmen, gibt es vergleichsweise wenig Analysen zu den statistischen Eigenschaften dieser Methoden, zu ihrer relativen Leistungsfähigkeit und zu ihrer Integration in übliche Modellierungsansätze. Daher besteht eine zentrale Absicht des Projektes darin, die Sensitivität der Methoden im Hinblick auf Parameterwerte, die Robustheit bezüglich von Variationen der Textquellen und die Unsicherheit, die aus den Methoden selbst stammt, zu untersuchen. Im Projekt sollen auch weitere Verfahren zum Vergleich der Ergebnisse über Textsammlungen hinweg vorgeschlagen werden. In einem weiteren zentralen Schritt werden alternative Verfahren zur Bestimmung der Thementrends und schließlich die Auswirkungen vom Einsatz solcher Thementrends in Zeitreihenmodellen wie den gebräuchlichen vektor-autoregressiven Modellen untersucht. Dabei wird ein spezielles Augenmerk auf die Interpretation der Ergebnisse, die Bewertung des Erkenntnisgewinns durch den Einsatz der zusätzlichen textbasierten Indikatoren und eine sorgfältige Messung der Unsicherheit, die durch gemeinsame Konfidenzbänder ausgedrückt wird, gelegt. Die Methoden werden angewandt, um die Beziehungen zwischen realen Wirtschaftsindikatoren und Thementrends aus wirtschaftswissenschaftlichen Publikationen in Polen und Deutschland zu untersuchen.
DFG-Verfahren
Sachbeihilfen
Internationaler Bezug
Polen
Partnerorganisation
Narodowe Centrum Nauki (NCN)
Kooperationspartnerinnen / Kooperationspartner
Dr. Victor Bystrov; Dr. Anna Staszewska-Bystrova