Project Details
Relationale Datenbanksysteme als hocheffiziente XQuery-Prozessoren: Compilationstechniken und Laufzeitsysteme
Applicant
Professor Dr. Torsten Grust
Subject Area
Security and Dependability, Operating-, Communication- and Distributed Systems
Term
from 2006 to 2011
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 27645166
Ursprünglich als markup language für elektronische Dokumente entworfen, hat das flexible und erweiterbare Datenformat XML in bemerkenswert kurzer Zeit eine Vielzahl weiterer daten-intensiver Domänen für sich erobert. Längst haben die generierten, kommunizierten und zu analysierenden XML-Daten in Unternehmen, Laboratorien und Netzwerken ein Volumen erreicht, das nach effizienter Datenbankunterstützung verlangt. Im Rahmen dieses Projektes entwickeln und implementieren wir auf der Basis etablierter relationaler Datenbanktechnologie neue Techniken, um skalierbare und hocheffiziente XML- und XQuery-Prozessoren zu realisieren. Heute besitzen relationale Datenbanksysteme die am besten verstandenen (und am sorgfältigsten entwickelten) Anfrageprozessoren. Obwohl diese darauf getrimmt sind, Relationen¿also strikt tabellenstrukturierte Daten¿zu verarbeiten, kann man relationale Prozessoren sehr erfolgreich einsetzen, die inhärent baumstrukturierten XML-Daten zu speichern und via XQuery anzufragen und zu transformieren. Die Antragsteller haben in Zusammenarbeit mit niederländischen Kollegen bereits einen mockup eines derartigen Relationalen XML- und XQuery-Prozessors erstellt, dessen Performanz und Skalierbarkeit zur Zeit den globalen state-of-the-art der XQuery-Technologie mit definiert. Diese Vorarbeiten stellen eine ideale Arbeitsumgebung zur Verfügung, innerhalb der wir neue tabellenstrukturierte Speicherformate für baumförmige Daten untersuchen werden, die geeignet sind, auf allen Ebenen der Speicherhierarchie, von CPU-Cache bis Externspeicher, eingesetzt zu werden (hier werden wir besonders auf die Suche nach fragmentierten, komprimierten, und effizient änderbaren Strukturen gehen), neue algebraische Compilations- und Optimierungstechniken entwickeln werden, die den gesamten Sprachumfang sowie das gesamte Typsystem der vom World-Wide Web Consortium (W3C) standardisierten XML-Anfragesprache XQuery unterstützen, und (möglichst geringe) Änderungen an relationalen Datenbankkernen identifizieren, um diese in effiziente Laufzeitsysteme für Sprachen der XML-Standardfamilie (XQuery, XPath, gegen XML Schema validierende Parser) zu verwandeln. Das Ziel ist, Anfragen auch für XMLDokumentgrößen von mehreren Gigabyte in interaktiver Zeit beantworten zu können.
DFG Programme
Research Grants