Detailseite
Kontinuierliche Qualitätskontrolle von Forschungsdaten zur Sicherung ihrer Reproduzierbarkeit an Hochschulen (CONQUAIRE)
Antragstellerinnen / Antragsteller
Professor Dr. Philipp Cimiano; Barbara Knorn
Fachliche Zuordnung
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Theoretische Informatik
Theoretische Informatik
Förderung
Förderung von 2015 bis 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 277747081
Reproduzierbarkeit bildet ein Fundament der Wissenschaft. Während sich die Reproduzierbarkeit eines Experiments als äußerst schwierig erweisen kann, sollte die Reproduktion computergestützter Analysen, die eine bestimmte Schlussfolgerung erlaubt haben, eine Grundanforderung an alle publizierten Forschungsergebnisse darstellen. Wir bezeichnen diese Art der Reproduzierbarkeit als "analytische Reproduzierbarkeit".Um computergestützte Ergebnisse zu reproduzieren, müssen folgende Bedingungen erfüllt sein: i) die primären oder sekundären Daten liegen vor, ii) die Daten sind syntaktisch valide und einsatzbereit, iii) die Daten sind hinreichend dokumentiert, iv) die analytischen Prozeduren, mit denen die Daten ausgewertet wurden, stehen zur Verfügung und v) können auf den Daten ausgeführt werden, um die veröffentlichten Ergebnisse zu reproduzieren. Analytische Reproduzierbarkeit wird oft dadurch beeinträchtigt, dass eine oder mehrere der oben genannten Anforderungen nicht erfüllt sind.Das Ziel dieses Projektes ist es, am Beispiel der Universität Bielefeld hochschulweite Informationsinfrastrukturen so zu erweitern, dass Forschende dabei unterstützt werden, die oben genannten Eckpunkte einzuhalten. Dadurch sollen Daten möglichst früh im Forschungsprozess über eine institutionelle Infrastruktur gehostet werden. Inspiriert durch Continuous Integration streben wir die Entwicklung eines Frameworks an, das Forschungsdaten einer kontinuierlichen Qualitätskontrolle unterzieht, so dass sie jederzeit wiederverwendet und verifiziert werden können. Wir verstehen im Kontext dieses Projektes unter Datenqualität die (Wieder-)Verwendbarkeit und Verifizierbarkeit der Daten.In enger Kooperation mit Forschenden an der Universität Bielefeld sollen Anforderungen erhoben und definiert werden, um hochschulweite Informationsinfrastrukturen so zu erweitern, dass sie Forschende bei der Erreichung der analytischen Reproduzierbarkeit unterstützt. Die beteiligten Forschenden stammen aus unterschiedlichen Disziplinen, so z.B. aus der Psychologie, Sportwissenschaften, Biologie, Chemie, Kognitiven Linguistik, Computerlinguistik, Robotik und Wirtschaftswissenschaften. Durch die Einbeziehung sehr verschiedener Disziplinen soll es möglich werden, diszplinübergreifende Anforderungen an eine Infrastruktur zu identifizieren, die Datenqualität als fortwährenden Prozess unterstützt sowie das Teilen und die externe Validierung von Forschungsergebnissen ermöglicht.Die beispielhafte Erweiterung einer hochschulweiten Infrastruktur für das Forschungsdatenmanagement an der Universität Bielefeld wird weit über Bielefeld hinaus eine positive Wirkung haben. Unsere Erfahrungen mit der kontinuierlichen Qualitätskontrolle für Forschungsdaten sollen Entscheidungsträger dabei unterstützen, die gegenläufige Relation zwischen Kosten und Nutzen der Qualitätskontrolle von Forschungsdaten einzuschätzen.
DFG-Verfahren
Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)