Detailseite
Projekt Druckansicht

Projektive Item-Response-Theorie-Modelle für Zähldaten und ihre Anwendung als interpretierbare Approximationen an Black-Box-Modelle des maschinellen Lernens

Fachliche Zuordnung Persönlichkeitspsychologie, Klinische und Medizinische Psychologie, Methoden
Allgemeine, Kognitive und Mathematische Psychologie
Förderung Förderung seit 2021
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 463078117
 
Die Item-Response-Theorie (IRT) stellt Messmodelle für latente Variablen bereit und liefert in einer Vielzahl von Erhebungssituationen personenspezifische Messungen samt zugehöriger Messfehler. Die IRT bildet damit die ausgereifteste statistische Grundlage für den operativen Einsatz und die Evaluation von diagnostischen Verfahren in Psychologie und empirischer Bildungsforschung. Im Vergleich zu IRT-Methoden für binäre Daten sind Zähldaten-IRT-Modelle unterentwickelt. Viele Zähldaten-IRT-Modelle nutzen die Poisson-Verteilung, aber die daraus resultierende bedingte Equidispersionsannahme ist empirisch nur selten haltbar. Aktuelle Ansätze, die etwa auf der Conway-Maxwell-Poisson-Verteilung beruhen, lösen dieses Problem, können aber bislang keine Faktorladungen berücksichtigen. In Anwendungen, insbesondere wenn unstrukturiert erhobene Indikatoren verwendet werden sollen, sind mehrdimensionale latente Variablenkonstellationen plausibel. Mittels projektiver IRT kann zu einem empirisch ununterscheidbaren eindimensionalen IRT-Modell mit lokaler Itemabhängigkeit übergegangen werden, was günstig für die Interpretation und weitere Verwendung ist. Deswegen werden projektive IRT-Modelle auf den Zähldatenfall verallgemeinert. Insbesondere kann auf Hauptdimensionen gängiger existierender Modelle projiziert werden. Verfahren des maschinellen Lernens haben sich als mächtige datenanalytische Werkzeuge in vielen Bereichen der Psychologie etabliert, aber auch im Bereich des Educational Data Mining. Ergebnisse vieler Verfahren des maschinellen Lernens sind schwer zu interpretieren. Die in diesem Forschungsprojekt entiwckelten projektiven IRT-Modelle finden als gut interpretierbare Surrogatmodelle Verwendung in Situationen, in denen ein Black-Box-Modell des maschinellen Lernens wegen seiner Vorhersage- oder Klassifikationsgüte eingesetzt wird. So entsteht eine interpretierbare Approximation an ein Black-Box-Modell, die hilft, dieses besser zu verstehen. Da mehr- und sogar hochdimensionale latente Variablenkonstellationen numerisch aufwändig sind, wird ein EM-Algorithmus für ein generelles Zähldaten-IRT-Modell mit Faktorladungen entwickelt. Dabei werden alle gängigen Zähldatenverteilungen mit Über- und Unterdispersion berücksichtigt, genauso wie Kovariaten auf dem Personen- und Item-Level, sowie deren Interaktionen.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Australien
Kooperationspartner Alan Huang, Ph.D.
Mitverantwortlich Dr. Boris Forthmann
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung