Detailseite
Projekt Druckansicht

ExtraPeak - Automatische Leistungsmodellierung von HPC-Anwendungen mit multiplen Modellparametern

Antragsteller Professor Dr. Felix Wolf
Fachliche Zuordnung Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Förderung Förderung von 2017 bis 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 323299120
 
Zusammen mit rasant anschwellenden Datenmengen sorgt die wachsende Komplexität von Anwendungen für einen enormen Bedarf an Rechenzeit. Die Anschaffungs- und Betriebskosten der dafür benötigten Supercomputer sind jedoch immens. Laufzeit und Energieverbrauch eines Codes müssen daher so gering wie möglich gehalten werden.Die Optimierung komplexer HPC-Anwendungen erfordert die intelligente Auslotung aller Design- und Konfigurationsmöglichkeiten. Insbesondere auf Supercomputern ist der Raum aller Kombinationen jedoch so groß, dass sich allenfalls ein geringer Teil davon experimentell testen lässt. Leistungsmodelle, die Zielmetriken wie die Ausführungszeit als Funktion von Parametern wie der Anzahl der Kerne oder der Größe des Eingabeproblems in Form einer Gleichung darstellen, erlauben eine deutlich effizientere Exploration dieses Raumes.Leider ist die manuelle Erstellung solcher Modelle für große reale Anwendungen extrem arbeitsintensiv. Um Leistungsengpässe zu vermeiden, ist es zudem oft nicht ausreichend, sich nur auf einen einzigen Aspekt wie die Anzahl der Kerne oder die Problemgröße zu konzentrieren. Der Effekt eines einzelnen Parameters muss nicht nur für sich allein, sondern im Kontext anderer relevanter Parameter untersucht werden, einschließlich algorithmischer Varianten, Charakteristika der Eingabe oder Tuningparametern wie Blockgrößen. Jüngste Fortschritte der automatischen empirischen Leistungsmodellierung, d.h. der Generierung von Leistungsmodellen basierend auf einer begrenzten Anzahl von Messungen, streben diese Lücke zu schließen. Während Modelle mit einem Parameter methodisch gut beherrscht werden, steht die Leistungsmodellierung mit mehreren Parametern immer noch vor großen Herausforderungen, darunter insbesondere (i) die Identifikation leistungsrelevanter Parameter, (ii) die ökonomische Planung der benötigten Messungen, (iii) die Vielfalt der möglichen Modellfunktionen und (iv) die effiziente Suche in einem komplexen hochdimensionalen Funktionsraum.Ziel dieses Projekts ist die Entwicklung einer automatischen empirischen Methode zur Modellierung beliebiger Kombinationen von Ausführungsparametern. Den obigen Herausforderungen begegnen wir dabei u.a. mit einer vorgeschalteten Quellcodeanalyse und einer Feedback-gesteuerten Erhebung von Laufzeitdaten und Modellgenerierung. Das Produkt sind aussagekräftige Leistungsmodelle mit einem breiten Anwendungsspektrum - von ausgewogenem Hardwaredesign bis zu feingranularem Performancetuning. Die Modelle sollen Anwendungsentwicklern helfen, Leistungsziele gegeneinander abzuwägen und dadurch die Leistung ihrer Codes zu verbessern.Es ist geplant, unsere Methode in das Open Source-Werkzeug Extra-P zu integrieren, das aktuell auf Modelle mit einem Parameter beschränkt ist. Als spezifische Anwendung unseres Ansatzes wollen wir schließlich eine neue Co-Designmethodik entwickeln, um die Anforderungen an künftige HPC-Systeme präziser und mit weniger Aufwand als bisher ermitteln zu können.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Schweiz
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung