Detailseite
NoSQL-Schema-Evolution und skalierbare Big Data Datenmigration II
Antragstellerinnen
Professorin Dr.-Ing. Meike Klettke; Professorin Dr. Stefanie Scherzinger; Professorin Dr. Uta Störl
Fachliche Zuordnung
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung
Förderung von 2017 bis 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 385808805
Dieser Projektantrag ist der Fortsetzungsantrag zum DFG-Projekt mit Förderkennzeichen (GZ entfernt). Im Mittelpunkt jenes Antrags steht die Schema-Evolution für Datenbankanwendungen, welche NoSQL-DBMS einsetzen. Auch wenn viele NoSQL-DBMS kein festes Datenbank-Schema definieren, ergeben sich doch aus dem Anwendungscode bestimmte Anforderungen an die Struktur der Daten; der Anwendungscode setzt also ein bestimmtes Schema voraus. Mit der Weiterentwicklung des Anwendungscodes muss auch das Schema kontinuierlich angepasst werden. Wir haben seit Dezember 2017 im Rahmen des DFG Projekts (GZ entfernt) erfolgreich an der Entwicklung von theoretisch-fundierten Werkzeugen zur Schema-Evolution und Datenmigration für NoSQL-Datenbanken gemeinsam geforscht. Auch wenn unsere Arbeiten noch nicht abgeschlossen sind, sind bereits jetzt eine Reihe von vielbeachteten Publikationen und insbesondere auch einsatzfähigen Prototypen aus unserer Kooperation hervorgegangen. Bisher konzentrierte sich unsere Forschung auf die Schema-Evolution von logischen NoSQL Schemata in einzelnen NoSQL-DBMS. Mit diesem Nachfolgeantrag wollen wir diese Arbeiten für Polystores verallgemeinern. Obwohl Polystores insbesondere für sich ständig weiterentwickelnde agile Anwendungen, die große Datenmengen verwalten müssen, eingesetzt werden, steckt die Forschung im Bereich Schema-Evolution für Polystores in den Anfängen: - Bis heute gibt es kein systematisches Verfahren zur Schema-Evolution für Polystores, die aus mehreren DBMS mit unterschiedlichen Datenmodellen bestehen. - Bis heute gibt es keine “best practices” für die automatisierbare Optimierung des logischen Schemaentwurfs. Darüber hinaus muss dieser Schemaentwurf adaptiv bzgl. Schema-Evolution sein. - Bis heute gibt es keine fundierten Strategien zur physischen Schema-Optimierung in NoSQL-Datenbanken, die adaptiv bzgl. der Schema-Evolution sind. In diesem Fortsetzungsantrag werden wir die hier dargestellten Probleme durch einen ganzheitlichen Ansatz lösen: auf der Ebene des globalen Polystore-Schemas, der logischen Schemata der einzelnen DBMS des Polystores sowie ihrer physischen Schemas. Wir geben einen Überblick über den gegenwärtigen Stand der Forschung, identifizieren die bestehenden offenen Probleme und werden im Rahmen des Forschungsprojektes systematisch Lösungen dafür entwickeln. Als einen nachhaltigen Beitrag werden wir den ersten Schema-Evolutions-Benchmark für Polystores entwickeln und diesen der wissenschaftlichen Gemeinschaft zur Verfügung stellen.
DFG-Verfahren
Sachbeihilfen