Evolution von Ontologien und Mappings
Final Report Abstract
Im Vorhaben wurden neuartige Methoden zur Analyse und Unterstützung der Evolution von Ontologien insbesondere in den Lebenswissenschaften untersucht. Die konzipierten Methoden erlauben einen Umgang mit sich ständig ändernden Ontologien und den Folgen für abhängige Daten (u.a. Mappings) sowie nutzende Anwendungen. Ein wesentlicher Bestandteil ist ein flexibler Diff-Algorithmus COnto-Diff mit dessen Hilfe Anwender und Entwickler Unterschiede zwischen Ontologieversionen berechnen können. Das Ergebnis besteht aus einem ausdrucksstarkem Evolution-Mapping, welches mittels komplexen Änderungsoperationen (z.B. merge, split, addSubGraph) übersichtlich Versionsunterschiede darstellen kann. Darauf aufbauend erlaubt ein neu konzipierter Regionenalgorithmus die Inspektion von Trends in der Entwicklung großer Ontologien. Entwickler bzw. Projektkoordinatoren können stark veränderliche bzw. stabile Ontologieregionen errechnen und damit weitere Entwicklungsschritte planen bzw. den Fortgang der Entwicklungen übersichtlich überwachen. Änderungen in Ontologien haben wiederum Einfluss auf abhängige Daten wie Ontologie- und Annotationsmappings sowie Ontologie-nutzende Anwendungen. Die Ergebnisse von COnto-Diff konnten in einem neuartigen Algorithmus zur (semi-)automatischen Mappingadaptierung verwendet werden. Veraltete Mappings zwischen Ontologien können somit unkompliziert und mit geringem manuellem Aufwand angepasst und aktualisiert werden. Zudem wurde Evolution Ontologie-basierter Annotationen sowie die Auswirkungen der Ontologieevolution auf funktionale Analysen großer biologischer Datensätze untersucht. Alle konzipierten Methoden und Algorithmen wurden prototypisch implementiert sowie evaluiert und basieren auf dem generischen Evolutions- und Matching-Framework GOMMA (Generic Ontology Matching and Mapping Management). GOMMA bietet die Möglichkeit einer effizienten Versionierung großer Ontologien und Mappings. Somit können Nutzer Ontologieversionen in das Repository von GOMMA einspielen, um entsprechende Analysen durchzuführen. Über die online verfügbaren Tools OnEX, CODEX sowie REX stehen die entwickelten Algorithmen einer großen Community zur Verfügung. Neben der Mächtigkeit die Evolution von Ontologien wie auch Mappings zu untersuchen, besitzt das Framework ein umfassendes Match-System mit dem effizient Mappings zwischen großen Ontologien automatisch erstellt werden können. Verfahren zum Matching von Ontologien werden u.a. für eine (semi-) automatische Adaptierung von Ontologiemappings benötigt. Das System bietet die Möglichkeit bereits bestehende Mappings zu nutzen (wiederzuverwenden, reuse), um mittels Komposition schnell und einfach weitere Mappings zu erzeugen. Darüber hinaus wurden Parallelisierungstechniken für die verteilte Berechnung von Ontologie-Mappings in GOMMA integriert. Eine sehr gute Performance des Match-Systems bzgl. Qualität und Effizienz konnte durch die Teilnahme an zwei Auflagen der jährlich stattfindenden Ontology Alignment Evaluation Initiative (OAEI) nachgewiesen werden.
Publications
- Discovering Evolving Regions in Life Science Ontologies. Proc. 7th Intl. Conference on Data Integration in the Life Sciences (DILS), 2010
Hartung, M.; Groß, A.; Kirsten, T.; Rahm, E.
- GOMMA: A Component-based Infrastructure for managing and analyzing Life Science Ontologies and their Evolution. Journal of Biomedical Semantics 2:6, 2011
Kirsten, T.; Groß, A.; Hartung, M.; Rahm, E.
- Mapping Composition for Matching Large Life Science Ontologies. Proc. Int. Conf. on Bio-Ontologies (ICBO), 2011
Groß, A., Hartung, M.; Kirsten, T., Rahm, E.
- Impact of Ontology Evolution on Functional Analyses. Bioinformatics 28(20), 2012
Groß, A.; Hartung, M.; Prüfer, K.; Kelso, J.; Rahm, E.
(See online at https://doi.org/10.1093/bioinformatics/bts498) - COnto-Diff: Generation of Complex Evolution Mappings for Life Science Ontologies. Journal of Biomedical Informatics 46(1), 2013
Hartung, M.; Groß, A.; Rahm, E.
(See online at https://doi.org/10.1016/j.jbi.2012.04.009) - Semi-Automatic Adaptation of Mappings between Life Science Ontologies. Proc. 9th Intl. Conference on Data Integration in the Life Sciences (DILS), 2013
Groß, A.; Dos Reis, J.C.; Hartung, M.; Pruski, C.; Rahm, E.