Detailseite
Lernen von Stoppregeln und Stoppumgebungen
Antragsteller
Professor Dr. Stefan Ankirchner; Professor Dr. Sören Christensen
Fachliche Zuordnung
Mathematik
Förderung
Förderung seit 2024
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 547236699
Das Projekt hat zum Ziel, Methoden zu entwickeln zur Analyse von Lernstrategien für Stopp-Probleme. Ein Stopp-Problem liegt vor, wenn ein ökonomischer Agent einen stochastischen Prozess so stoppen will, dass der Prozesswert zu der Stoppzeit in Erwartung maximiert wird. Ausgangspunkt des Projektes sind nun Situationen, in denen, erstens, der Agent dasselbe Stopp-Problem in vielen aufeinanderfolgenden Runden lösen muss, wobei die zu stoppenden Prozesse unabhängig, aber identisch verteilt sind; und zweitens, der Agent die Verteilung der zu stoppenden Prozesse am Anfang nicht kennt. Durch die Beobachtungen der einzelnen gestoppten Prozessrealisierungen kann der Agent die Prozessverteilung lernen, und folglich auch die optimale Stopp-Regel immer besser approximieren. In dem Projekt werden Strategien zum Erlernen optimaler Stopp-Regeln untersucht und verglichen mit Hilfe des sogenannten regrets. Ein regret entsteht, falls der Agent aufgrund eines Schätzfehlers eine suboptimale Stopp-Regel wählt. Formal wird der regret in einer Runde definiert als die Differenz der erwarteten Auszahlung unter der optimalen Stoppzeit und der erwarteten Auszahlung unter der tatsächlich gewählten Stoppzeit. Ein Projektfokus ist die asymptotische Rate, mit der der regret bei steigender Rundenzahl gegen Null konvergiert. Ein Ziel ist es, scharfe untere Schranken für die Rate zu bestimmen, die keine Strategie unterschreiten kann. Eine weiteres Ziel ist es, konkrete Strategien zu entwickeln, die die minimale regret Rate erreichen und in diesem Sinne optimal sind. Diese Ziele werden auch gesteckt für die erweiterte Problemstellung, bei der der Agent in jeder Runde zunächst eine Stoppumgebung auswählen muss und dann in dieser eine Stoppzeit.
DFG-Verfahren
Sachbeihilfen