Detailseite
Projekt Druckansicht

Konzepte, Werkzeuge und Unterstützung für die Verwaltung, Archivierung, Mobilisierung und Integration taxonomischer Daten

Fachliche Zuordnung Evolution, Anthropologie
Förderung Förderung seit 2020
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 447018505
 
Taxonomie kann angesichts von geschätzten drei Milliarden Sammlungsexemplaren, die zunehmend in Hochdurchsatzverfahren digitalisiert werden, sowie Millionen von online publizierten DNA Sequenzen, Bildern und morphologischen Datensätzen, als "Big Data" Wissenschaft verstanden werden. In der ersten Periode des Taxon-Omics Schwerpunktprogramms wurde deutlich, dass Datenmanagement und Datenintegration zentrale Aspekte dieses Konsortiums sein müssen, was auch vom DFG-Senat angemerkt wurde. In einem zentralen Projekt von Renner und Vences wurde daher erfasst und in zwei Workshops diskutiert, welche Daten in den Einzelprojekten generiert werden und welche Archivierungsstrategien verfolgt werden; sowie Unterstützung bei dem konkreten Datenmanagement der Einzelprojekte angeboten. In einem ersten Positionspapier wurde auf die Bedeutung von Datenarchivierung Daten-Wiedernutzung für die Taxonomie hingewiesen, und in einer umfangreichen Literaturanalyse die Erfordernisse an Datenmanagement in der alpha-Taxonomie ermittelt. Basierend auf den Erfahrungen der ersten SPP-Periode ist das hier beantragte Projekt darauf ausgerichtet, den Einzelprojekten der zweiten Periode von Anfang an gezielt konzeptionelle ebenso wie praktische Unterstützung in Management und Archivierung der generierten Daten bereitzustellen. Dies wird in Form von Workshops als auch durch direkter Unterstützung durch einen Datenmanager erfolgen, sowohl zur Verbsserung der Datenmanagement-Pläne als auch bei der Unterstützung der Einreichung von Datenpaketen in Repositorien, bevorzugt über das GFBio-Portal. Daneben werden wir an der Implementierung von Front-End Lösungen arbeiten, um Belegexemplar (= Specimen)-basierte Datenpakete in benutzerfreundlicher Weise in Repositorien archivieren zu können, sowie eine effiziente Belegexemplar-basierte Suche in Portalen zu ermöglichen. Für die verbesserte Archivierung werden wir Belegexemplar-basierte Tabellenvorlagen für die Metadateneingabe weiterentwickeln und implementieren, sowie ein Portal entwickeln, welche diese automatisch einliest und zusammen mit den Datenpaketen einem Plausibilitäts-Check unterzieht, um beispielsweise falsch geschriebene wissenschaftliche Namen oder Dateinamen zu erkennen und zu korrigieren. Weiterhin werden wir die Arbeit mit dem weiterlaufenden Daten-Projekt aus der ersten Phase des SPP koordinieren, in dem benutzerfreundliche Software auf der Basis von "Machine Learning" entwickelt werden soll, welche den tatsächlichen Arbeitsablauf der integrativen Taxonomie unterstützt. Als Teil der Netzwerkaktivitäten dieses zentralen Projekts werden wir zudem Verfahrensprotokolle aus den verschiedenen Einzelprojekten kompilieren und - in Kooperation mit den Einzelprojekten - open-access publizieren, um moderne Methoden in der Taxonomie weiter zu etablieren.
DFG-Verfahren Schwerpunktprogramme
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung