Detailseite
Algorithmische Qualitätssicherung: Theorie und Praxis
Antragsteller
Dr. Thomas Christian van Dijk
Fachliche Zuordnung
Geodäsie, Photogrammetrie, Fernerkundung, Geoinformatik, Kartographie
Theoretische Informatik
Theoretische Informatik
Förderung
Förderung von 2016 bis 2023
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 314719097
Crowdsourcing bietet große Möglichkeiten für viele Disziplinen, wie etwa GIScience und Digital Humanities. Eine besondere Anwendung, bei der es einen Boom von Crowdprojekten gegeben hat, ist die Extraktion von Information aus historischen Dokumenten. Der Grund für diesen Boom ist die Tatsache, dass es auf diesem Gebiet viele Probleme gibt, die bislang keine vollautomatische Lösung zulassen. Zahlreiche Projekte sind entstanden, manche mit beachtlichem Erfolg (wie etwa GB1900, Transkribus und Maps-in-the-Crowd). Die Arbeit von Freiwilligen führt jedoch immer zu Bedenken bezüglich der Datenqualität. In diesem Projekt untersuchen wir neuartige Methoden für Qualitätssicherung in Crowdsourcing-Projekten: wir untersuchen die Qualität nicht nur am Ende eines Prozesses, sondern betrachten den gesamten Crowdsourcing-Prozess als eine Berechnung, bei der wir die Qualität an vielen Stellen sicherstellen müssen. Dafür bringen wir eine Reihe mathematischer und algorithmischer Techniken in Stellung, inklusive Bayesscher Modellierung, optimaler Aufgabenauswahl mittels aktivem Lernen sowie Sensitivitätsanalyse. Unsere bisherige Erfahrung zeigt, dass dieser Ansatz nicht nur von theoretischem Interesse ist, sondern praktisch funktionierende Systeme liefert, die Adhoc-Ansätze übertreffen.Aufbauend auf unser Projekt über intelligentes Crowdsourcing für die Extraktion von Information aus alten Landkarten benutzen wir wieder historisches Material als wichtige Datenquelle für unsere Experimente. Wir werden diesmal jedoch auch modernere Daten verwenden. Erstens, weil uns dies näher an die anderen Projekte im Schwerpunktprogramm bringt. Zweitens ist der Ansatz, den wir entwickelt haben (und weiter entwickeln werden), allgemein anwendbar. Dies werden wir nachweisen, indem wir den Ansatz breiter anwenden, etwa auf Bilderkennungsprobleme (wie in den Projekte ENAP und COVMAP) oder auf die Extraktion von Information aus Micro-Blogs (EVA-VGI).In diesem Projekt werden wir ein feineres Verständnis dafür entwickeln, wie man sich die Kraft von Crowdsourcing nutzbar machen kann - indem wir unsere besondere Aufmerksamkeit auf die Qualität der Daten richten, während sie ein Projekt durchlaufen, und indem wir algorithmisch unterstützte Prozesse entwerfen, die diese Qualität garantieren.
DFG-Verfahren
Schwerpunktprogramme