Detailseite
Schnellere und kostengünstigere kosmologische Datenanalyse basierend auf einer physikalisch motivierten Machine-Learning- Strategie
Antragsteller
Professor Dr. Julien Lesgourgues
Fachliche Zuordnung
Astrophysik und Astronomie
Förderung
Förderung seit 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 456132154
Kosmologen führen im großen Maßstab Einstein-Boltzmann-Löser auf Rechenclustern zur kosmologischen Parameterschätzung aus. Hierfür werden Daten von Large Scale Structure Beobachtungen und Messungen der kosmischen Hintergrundstrahlung verwendet. Jede signifikante Beschleunigung dieser Codes würde die Effizienz enorm steigern und wertvolle Rechenzeit einsparen. Trotz laufender Bemühungen Teile dieser Programme zu optimieren gibt es einen fundamentalen Engpass: die Integration der Differentialgleichungen von kosmologischen Störungen für die größten Wellenzahlen. Da dies ein inherent sequentielles Problem darstellt, kann es nicht durch geschickte Parallelisierung beschleunigt werden. Wir schlagen vor, diese Limitierung durch trainierte neuronale Netzwerke zu umgehen. Unsere Strategie ist dabei universeller als die bisherigen Versuche, da die neuronalen Netzwerke lediglich einen Zwischenschritt in der Rechnung ersetzen, welcher nur von einer reduzierten Anzahl an freien Modellparametern abhängt. Im Besonderen wird eine Abhängigkeit von Parametern vermieden, die sich nur auf spezielle Observablen beziehen. Wir werden eine physikalisch motivierte Strategie verfolgen, welche semianalytische Ergebnisse der kosmologischen Störungstheorie verwendet, um ein effizientes System zu entwerfen, durch das eine gute Präzision unter Verwendung von kleinen Trainingssets erreicht werden kann. Wir werden ein Modul veröffentlichen, welches sich an jeden Einstein- Boltzmann-Löser koppeln lässt. Zudem werden wir die Struktur der Parameterschätzungsprogramme verändern, sodass sie die Beschleunigung voll ausnutzen können, selbst wenn Modelle betrachtet werden, die im ursprünglichen Trainingsset nicht vorhanden sind. Schließlich werden wir eine globale Strategie entwerfen, die verhindert, dass die selben Rechnungen mehrfach von Kosmologen in verschiedenen Arbeitsgruppen ausgeführt werden müssen. Durch öffentlich zugängliche Repositorien und das Hinzufügen von neuen Kommunikationsmodulen in den Parameterschätzungsprogrammen werden wir sichergehen, dass der Validitätsbereich des Trainingssets und des neuronalen Netzwerks mit der Zeit wächst. Dies geschieht, ohne dass zusätzliche Rechenzeit entsteht, nicht einmal für die Arbeitsgruppe, die das zentrale Repositorium zur Verfügung stellt. Dieses Schema kann zu massiven Effizienzsteigerungen und Geldeinsparungen weltweit führen. Nach unseren Schätzungen könnten in der Gemeinschaft der Kosmologie jährlich CPU-Stunden im Milliardenbereich durch dieses Projekt eingespart werden. Des Weiteren könnte unsere Strategie auch auf andere Bereiche der Wissenschaft übertragen werden. Wir werden die Leistungsfähigkeit dieser neuen Vorgehensweise in verschiedenen Bereichen der kosmologischen Datenanalyse (Parameterschätzung und Sensitivitätsvorhersagen) demonstrieren und wollen vorschlagen, sie in Kollaborationen wie Euclid zu verwenden.
DFG-Verfahren
Sachbeihilfen