Detailseite
Projekt Druckansicht

Differential Item Functioning in Item Response Modellen - neue Schätzverfahren und Diagnoseinstrumente

Fachliche Zuordnung Allgemeine, Kognitive und Mathematische Psychologie
Statistik und Ökonometrie
Förderung Förderung von 2014 bis 2019
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 262767932
 
Erstellungsjahr 2018

Zusammenfassung der Projektergebnisse

Das Projekt behandelte das Problem des Differential Item Functioning (DIF), ein Phänomen, das in der Entwicklung von fairen Tests eine tragende Rolle spielt. Differential Item Functioning tritt dann auf, wenn einzelne Items eines Tests in unterschiedlichen Gruppen bzw. Populationen unterschiedliche Eigenschaften besitzen. So können Items beispielsweise gender- oder altersspezifisch sein. Um Verzerrungen zu vermeiden, ist es wichtig DIF-Items zu erkennen. Die entwickelten Verfahren haben den großen Vorteil, dass sie nicht nur eine einzelne Eigenschaft von Personen wie männlich/weiblich berücksichtigen können, sie sind vielmehr in der Lage eine Vielzahl von Personencharakteristika simultan zu berücksichtigen und zu bestimmen, welche Items von diesen Personeneigenschaften modifiziert werden. Insbesondere sind sie auch in der Lage die Personeneigenschaften zu identifizieren, die in einzelnen Items wirksam werden. Die vorgeschlagenen Verfahren nutzen das Instrumentarium moderner Machine Learning Tools, insbesondere das der regularisierten Schätzer. Es wurden unterschiedliche Verfahren entwickelt, die dem hochdimensionalen Schätzproblem gerecht werden. Neben Boosting Verfahren und penalisierten Schätzern wurde ein baumbasiertes Verfahren entwickelt, mit dem sich die DIF-Struktur von Items einfach und übersichtlich als Baumstruktur darstellen lässt. Die entwickelten Verfahren beziehen sich nicht nur auf einfache Tests mit binären Kategorien wie richtig/falsch sondern auch auf Tests, in denen die Antworten auf Ratingskalen erfolgen, die ein Antwortspektrum von voller Zustimmung bis zu völliger Ablehnung zulassen. In derartigen Ratingskalen spielen personenspezifische Antwortstile, wie die Tendenz zu extremen oder moderaten Urteilen eine itemmodifizierende Rolle, die zu Verzerrungen führen kann.

Projektbezogene Publikationen (Auswahl)

  • (2020) A regularization approach for the detection of differential item functioning in generalized partial credit models. Behavior research methods 52 (1) 279–294
    Schauberger, Gunther; Mair, Patrick
    (Siehe online unter https://doi.org/10.3758/s13428-019-01224-2)
  • (2016): Detection of Differential Item Functioning in Rasch Models by Boosting Techniques. British Journal of Mathematical and Statistical Psychology, 69, 80-103
    Schauberger G. and Tutz, G.
    (Siehe online unter https://doi.org/10.1111/bmsp.12060)
  • (2016): Item focussed Trees for the Identification of Items in Differential Item Functioning. Psychometrika, 81, 727-750
    Tutz, G. and Berger, M.
    (Siehe online unter https://doi.org/10.1007/s11336-015-9488-3)
  • (2018): Response Styles in the Partial Credit Model. Applied Psychological Measurement, 42, 407–-427
    Tutz, G., Schauberger, G. and Berger, M.
    (Siehe online unter https://doi.org/10.1177/0146621617748322)
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung