Detailseite
Lokale Abhängigkeiten im Kontext großer Eventdaten
Antragsteller
Dr. Cornelius Fritz
Fachliche Zuordnung
Statistik und Ökonometrie
Förderung
Förderung von 2023 bis 2024
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 520770522
Daten von Online-Applikationen, Webseiten und Sociometric Badges ermöglichen die automatische Erfassung großer Eventdaten, die wertvolle Informationen über soziale Interaktionen und Verhaltensmuster enthalten. Diese Daten können als ein dynamisches Netzwerk zwischen einer festen Anzahl von Akteuren betrachtet werden, deren Analyse anhand von innovativen and skalierbaren Methoden zunehmend wichtiger wird. Events werden hier als dyadische Interaktionen zwischen zwei Akteuren verstanden. Aktuell verfügbare Methoden zur Untersuchung von Eventdaten nehmen typischerweise an, dass jeder Akteur alle anderen Akteure im Netzwerk sowie die Events zwischen ihnen kennt. Mit diesem Projekt wird versucht, die sich daraus ergebende methodische Lücke zu schließen. Da diese Annahme von global verfügabere Information für große Eventnetzwerke nicht sinnvoll ist, lockern wir sie, indem wir lokale Abhängigkeiten einführen. Bei dieser Form von Abhängigkeit nehmen wir an, dass diese auf Events in bestimmten Nachbarschaften beschränkt ist, woraus sich mehrere Vorteile ergeben: Die Modelle sind skalierbar, indem sie auch für große Netzwerke ein sinnhaftes Verhalten aufweisen. Des Weiteren sind die Methoden skalierbar, was deren Schätzung im Kontext größerer Netzwerke ermöglicht. Außerdem begünstigen lokale Abhängigkeiten parallelisiertes Rechnen, was die Schätzung mit großen Datenmengen erleichtert. Zuletzt können wir theoretische Eigenschaften herleiten, die datengestütze Schlussfolgerungen ermöglichen. Es werden Methoden entwickelt, um unterschiedliche Formen von lokalen Abhängigkeiten für Eventdaten zu nützen, welche sich durch drei Arten von Nachbarschaften unterscheiden. Zuerst gehen wir davon aus, dass die Nachbarschaften nicht überlappend und latent sind. Als zweites schlagen wir Modelle mit überlappenden Abhängigkeitsstrukturen vor, die durch domänenspezifische Mechanismen aus der Sicht der einzelnen Akteure in dem Netzwerk bestimmt werden. Ein Beispiel für diesen Mechanismus könnte sein, dass Akteure die Events anderer Akteure kennen, wenn sie zuvor interagiert haben oder gemeinsame Partner haben. Zuletzt können latente Variablenmodelle verwendet werden, um hierarchisch verschachtelte Nachbarschaftsstrukturen abzubilden. Insgesamt trägt dieses Projekt zur strukturellen Theoriebildung und Hypothesenprüfung anhand von Eventdaten unter realistischen Annahmen bei und stellt darüber hinaus praktische Instrumente wie Recommender-Systeme zur Vorhersage des nächsten Events und frei verfügbare Softwareimplementierungen bereit.
DFG-Verfahren
WBP Stipendium
Internationaler Bezug
Schweiz, USA