Detailseite
Verbesserung der Qualität und Erweiterung der Anwendungsmöglichkeiten von Längsschnittdaten zur Bildungsforschung
Antragsteller
Dr. Jörg Drechsler; Professor Dr. Joseph Sakshaug
Fachliche Zuordnung
Empirische Sozialforschung
Statistik und Ökonometrie
Statistik und Ökonometrie
Förderung
Förderung von 2012 bis 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 215633518
Hohe Teilnahme- und Antwortverweigerungsquoten (Unit und Item Non-Response) und steigende Kosten der Datenerhebung bedrohen die Datenqualität und reduzieren Anwendungsmöglichkeiten von longitudinalen Umfragen. Im Rahmen unseres Forschungsprojekts arbeiten wir deshalb zum einen an der Entwicklung neuer Verfahren zur Korrektur von Verzerrungen durch Verweigerung der Zustimmung zur Verknüpfung unterschiedlicher Datenquellen (Non-Consent). Zum anderen entwickeln wir Methoden, Verzerrungen durch Non-Response in longitudinalen Untersuchungen zu messen und zu korrigieren. Alle Teilprojekte werden Daten des Nationalen Bildungspanels (NEPS) nutzen, um Empfehlungen zu erarbeiten, wie diese Probleme im NEPS reduziert werden können.Das NEPS und viele andere Erhebungen verknüpfen ihre Daten mit großen administrativen Datensätzen, um Erhebungskosten zu reduzieren und das Analysepotenzial zu erweitern. Unterschiede zwischen Personen, die der Datenverknüpfung zustimmen (Consentern) und Personen, die dies ablehnen (Non-Consentern) können dabei zu verzerrten Analysen auf Basis der verknüpften Daten führen. Im Rahmen des Forschungsvorhabens werden wir Methoden entwickeln, um die Verzerrungen durch Non-Consent in den verknüpften Daten abzuschätzen. Außerdem sollen zwei Verfahren zur Reduktion der Verzerrungen evaluiert werden. Die erste Methode ermöglicht die gemeinsame Analyse nicht verknüpfter, vertikal partitionierter Datensätze. Eine Zustimmung zur Verknüpfung ist in diesem Fall nicht erforderlich, da die Informationen nicht auf Individualebene zusammengespielt werden müssen. Die zweite Methode basiert auf dem Ansatz, die Umfragedaten der Non-Consenter mit statistisch ähnlichen Personen aus den administrativen Daten zu verbinden (Statistical Matching). Wir schlagen eine innovative Prozedur vor, die es erlaubt, die Annahme der bedingten Unabhängigkeit, die bei Statistical Matching meist implizit getroffen wird, zu schwächen.Mit Hilfe der administrativen Daten der Vorgängerstudie (ALWA) der NEPS Startkohorte 6, sollen zudem die negativen Effekte von Panel Attrition - dem Ausfall von Befragten bei longitudinalen Studien - evaluiert werden. Die administrativen Daten späterer Jahre sind auch für ALWA Teilnehmer verfügbar, die nicht bereit waren am NEPS teilzunehmen. Diese Daten können genutzt werden, um potentielle Panel Attrition Faktoren zu identifizieren und das Ausmaß der Verzerrung durch Attrition abzuschätzen. Darüber hinaus werden die verknüpften administrativen Daten genutzt, um Methoden zur Korrektur von Non-Response Verzerrung (zum Beispiel Gewichtung) zu verbessern. Außerdem wird das Problem von Item Non-Response in longitudinalen Umfragen mit hierarchischen Datenstrukturen behandelt. Dafür werden neue Imputationsmethoden entwickelt, die mehrere Hierarchieebenen (zum Beispiel wiederholte Messungen von Schüler innerhalb der Schulen) berücksichtigen können. Diese werden dann mit existierenden Imputationsansätzen im longitudinalen Kontext verglichen.
DFG-Verfahren
Infrastruktur-Schwerpunktprogramme
Teilprojekt zu
SPP 1646:
Bildung als lebenslanger Prozess