Detailseite
Optimale Stochastische Regelung basierend auf Regression mittels Gauß-Prozessen
Antragsteller
Professor Dr.-Ing. Uwe D. Hanebeck
Fachliche Zuordnung
Automatisierungstechnik, Mechatronik, Regelungssysteme, Intelligente Technische Systeme, Robotik
Förderung
Förderung von 2017 bis 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 349395379
In der stochastischen Regelung wird das Problem der Entscheidungsfindung unter statistisch modellierten Unsicherheiten meist mittels Dynamischer Programmierung (DP) behandelt. Das Ziel besteht darin, Regelgesetze zu finden, welche die dem Regler verfügbaren Informationen auf Stellwerte so abbilden, dass ein Gütekriterium optimiert wird. In der Regel werden diese Informationen in eine Zustandsschätzung in Form einer Wahrscheinlichkeitsverteilung kondensiert, welche den Systemzustand repräsentiert, und das Regelgesetz bildet dann die Schätzungen auf Stellwerte ab.Allerdings ist DP nur in wenigen, sehr speziellen Fällen berechenbar, weshalb approximative Methoden von Interesse sind. Eine solche Methode ist der sog. Point-based Value Iteration Algorithmus, bei dem die optimalen Kosten, welche für die Berechnung der Stellwerte notwendig sind, für eine endliche Menge an Zustandsschätzungen vorgehalten werden, anstatt diese für den gesamten unendlich dimensionalen Raum der Wahrscheinlichkeitsverteilungen über Systemzuständen zu speichern. Um den optimalen Stellwert für eine konkrete Zustandsschätzung zu berechnen, müssen die Kosten, basierend auf der Menge der gespeicherten optimalen Kosten, approximiert werden. Hierfür benötigt ein Point-based Value Iteration Algorithmus eine Approximationsmethode für Funktionen, die über dem Raum der Wahrscheinlichkeitsverteilungen definiert sind. Deshalb treffen Methoden, die dem Stand der Technik entsprechen, in der Regel Einschränkungen bezüglich der Klasse der möglichen Zustandsschätzungen oder nehmen endliche Räume der Stell- und Messwerte an.Aus diesem Grund soll im Rahmen dieses Antrags eine neue Methode zur stochastischen Regelung von nichtlinearen Systemen mit kontinuierlichen Zuständen und Stell- und Messwerten entwickelt werden, welche auf Regression mittels Gaußprozessen (GP) basiert. Klassische GP-Regression ist nur für deterministische vektorwertige Eingänge definiert. Deshalb schlagen wir eine neuartige Definition von GP über Wahrscheinlichkeitsverteilungen vor, d.h. über dem Raum von unendlich dimensionalen Eingängen. Die Grundidee unseres Ansatzes besteht darin, die Kovarianzfunktion, die den GP bestimmt, über dem Abstand zwischen den Wahrscheinlichkeitsverteilungen zu definieren, welche als Eingänge dem GP übergeben werden.Im Rahmen dieses Projekts planen wir zunächst ein fundiertes mathematisches Konzept für GP über allgemeinen Wahrscheinlichkeitsverteilungen zu entwickeln. Dieses Konzept wird anschließend benutzt, um Algorithmen für stochastische Regelung herzuleiten, welche GP zur Berechnung der Regelgesetze verwenden. Das vorgeschlagene Projekt trägt nicht nur zur stochastischen Regelung von nichtlinearen Systemen sondern auch zur Theorie des maschinellen Lernens bei. Außerdem kann die vorgestellte Grundidee verwendet werden, um andere nichtparametrische Bayes'sche Regressions- und Klassifikationsmethoden für Wahrscheinlichkeitsverteilungen als Eingangsdaten zu entwickeln.
DFG-Verfahren
Sachbeihilfen