Project Details
Projekt Print View

Hybrid OLTP/OLAP Main Memory Database System Based on Virtual Memory Snapshots

Subject Area Security and Dependability, Operating-, Communication- and Distributed Systems
Term from 2011 to 2019
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 194871756
 
Final Report Year 2020

Final Report Abstract

Alle in dem Projektantrag beabsichtigten Arbeitspunkte wurden umfassend in unser HyPer-Datenbanksystem integriert, dessen Zielsetzung und Entwicklungsstand wir im Folgenden beschreiben. HyPer ist die neue Datenbankmaschine, die die Datenexploration in bislang nicht gekannter Effizienz unterstützt. In dieser Hinsicht ist HyPer die „enabling technology“ für bislang nicht mögliche, interaktive Anwendungen, mithilfe derer Menschen in Echtzeit die reale Welt anhand eines virtuellen Datenbankmodells in der digitalen Welt analysieren können. HyPer wird schon in hunderttausenden Anwendungen genutzt, um Kunden zu helfen, ihre Daten zu sehen und zu verstehen (Marketing-Slogan: „We help people see and understand their data.“). Beispiele hierfür sind neben den vielfältigen betriebswirtschaftlichen Fragestellungen (Analyse des Kundenverhaltens, Erfolgskontrolle von Marketingaktionen, Überwachung der Logistik, etc) auch politische Entscheidungsgrundlagen beispielsweise zum Klimawandel oder epidemiologische Datenauswertungen als Beleg für die Auswirkung von Impfungskampagnen auf Krankheitsfälle. Die Big Data-Auswertung führt zu objektiven Entscheidungen. HyPer wurde im Jahre 2010 an der TUM mit der Idee begonnen, ein (sogenanntes „all-inone“) Hauptspeicher-Datenbanksystem für heterogene Arbeitslasten aus Transaktionen und Analyseanfragen zu entwickeln. Diese neuartigen Systeme werden heute – gemäß Gartner – vielfach unter dem Begriff HTAP (Hybrid Transactional/Analytical Processing) klassifiziert. Die damalige Zielsetzung sollte mit zwei grundlegenden (damals disruptiven) Designentscheidungen erzielt werden: (1) Auswertung der Daten auf dem neuesten transaktionalen Zustand des Datenmodells und (2) effiziente Ausführung unter Ausnutzung moderner Rechner durch die Übersetzung der Anfragen in Maschinencode. Für den heterogenen Workload von transaktionalen und analytischen Anfragen wurden im HyPer-Projekt zwei komplementäre Verfahren entwickelt: Snapshotting des virtuellen Speichers durch „fork-ing“ eines Prozesses für die Analyse-Anfrage; Multi-Versionenen Synchronisation (MVCC) Die effiziente Anfragebearbeitung im Wesentlichen basiert auf zwei innovativen Beiträgen des HyPer-Projekts: Compilierung der SQL-Anfrage in Maschinencode; Hochparallele Ausführung durch kleinteilige Arbeitspakete (Morsel).

Publications

  • Efficiently compiling efficient query plans for modern hardware. PVLDB, 4(9):539-550, 2011
    T. Neumann
    (See online at https://doi.org/10.14778/2002938.2002940)
  • HyPer – A hybrid OLTP&OLAP main memory database system based on virtual memory snapshots. Proc. IEEE Int’l. Conf. Data Engineering (ICDE), Hannover, 2011
    A. Kemper and T. Neumann
    (See online at https://doi.org/10.1109/ICDE.2011.5767867)
  • Massively parallel sort-merge joins in main memory multi-core database systems. PVLDB, 5(10):1064-1075, 2012
    M.-C. Albutiu, A. Kemper, and T. Neumann
    (See online at https://doi.org/10.14778/2336664.2336678)
  • The adaptive radix tree: ARTful indexing for main-memory databases. Proc. ICDE ’13, 38-49, 2013
    V. Leis, A. Kemper, and T. Neumann
    (See online at https://doi.org/10.1109/ICDE.2013.6544812)
  • Exploiting hardware transactional memory in main-memory databases. Proc. IEEE Int’l. Conf. Data Engineering (ICDE) , 2014
    V. Leis, A. Kemper, and T. Neumann
    (See online at https://doi.org/10.1109/ICDE.2014.6816683)
  • Morsel-driven parallelism: A NUMA- aware query evaluation framework for the many-core age. Proc. ACM SIGMOD Conf. Management of Data, 2014
    V. Leis, P. Boncz, A. Kemper, and T. Neumann
    (See online at https://doi.org/10.1145/2588555.2610507)
  • Fast Serializable Multi-Version Concurrency Control for Main-Memory Database Systems. ACM SIGMOD International Conference on Management of Data (SIGMOD 2015) May 31 - June 4, 2015, Melbourne, Australia
    Thomas Neumann, Tobias Mühlbauer, Alfons Kemper
    (See online at https://doi.org/10.1145/2723372.2749436)
  • Data Blocks: Hybrid OLTP and OLAP on compressed storage using both vectorization and compilation. Proc. ACM SIGMOD Int’l. Conf. Management of Data (SIGMOD 2016), San Francisco, June 26 – July 1st, 2016
    H. H. Lang, T. Mühlbauer, F. Funke, P. Boncz, T. Neumann, and A. Kemper
    (See online at https://doi.org/10.1145/2882903.2882925)
  • High-speed query processing over high-speed networks. Proc. 42nd Int’l. Conf. Very Large Databases (VLDB 2016), Delhi, September 5 – 9, 2016
    W. Rödiger, T. Mühlbauer, A. Kemper, and T. Neumann
    (See online at https://doi.org/10.14778/2856318.2856319)
  • Adaptive Execution of Compiled Queries. 34th IEEE International Conference on Data Engineering (ICDE 2018) April 16 – 19, 2018, Paris
    J. André Kohn, Viktor Leis, Thomas Neumann
    (See online at https://doi.org/10.1109/ICDE.2018.00027)
 
 

Additional Information

Textvergrößerung und Kontrastanpassung