Additive fractional models for large random fields applied to high-frequency financial data
Final Report Abstract
Das SEMIFAR (semiparametric fractional AR) ist ein bekanntes Modell zur semiparametrischen Modellierung von Long-Memory-Zeitreihen. In diesem Projekt wurde zunächst der originelle SEMIFAR-Algorithmus mit verschiedenen Verbesserungen und einem entsprechenden Paket „esemifar“ zur Durchführung dieser Ideen in R weiterentwickelt. Dieses Paket ist einerseits gemeinnützig. Andererseits bietet es ein grundlegendes Werkzeug zur Schätzung einiger vorgeschlagener Modelle in diesem Projekt. Im nächsten Abschnitt wurde die semiparametrische Modellierung nichtnegativer long-memory Zeitreihen mittels einer geeigneten Transformation intensiv untersucht. Dabei soll insbesondere der long-memory Parameter d nicht von dieser Transformation betroffen sein, damit dieser aus den transformierten Daten leicht geschätzt werden kann. Zuerst wurden die Eigenschaften von log-linearen Prozessen berücksichtigt. In diesem Fall wurde gezeigt, dass d nicht von der Log- Transformation betroffen ist. Als ein Beispiel wurde ein originelles FI-Log-GARCH (fractionally integrated Log-GARCH) mit semiparametrischer Erweiterung zur Modellierung von Long-Memory in der Volatilität der Renditen vorgeschlagen und genau untersucht. Wenn eine Zufallsvariable oder ein Prozess nach der Log-Transformation noch nicht linear ist, wurde vorgeschlagen, die s. g. SAN-(Sinh- Arcsinh-Normal-)Transformation zur Modellierung der Schiefe und Heavy-Tails oder Light-Tails in den Log-Daten zu verwenden. Dadurch wurde eine originelle Log-SAN-Transformation definiert. Dieser Vorschlag bietet eine breite Erweiterung der Log-Transformation an und spielt eine wichtige Rolle in der Theorie und Praxis. Die Eigenschaften dieser Transformation und der verbundenen Verteilungen, einschließlich der Log-Normalverteilungen als Spezialfälle wurden genau erforscht. Auf dieser Grundlage sind Subordinated-Gaussian-Prozesse, SAN-FARIMA- und Log-SAN-FARIMA sowie ihre semiparametrischen Erweiterungen definiert und untersucht worden. Eine Maximum-Likelihood- Schätzprozedur der unbekannten Parameter und ein datengesteuerter Algorithmus zur Durchführung der nichtparametrischen Regression wurden entwickelt. In einem weiteren Schwerpunkt wurde die semiparametrische Schätzung eines großen räumlichen Modells untersucht. Ein wichtiges Thema dabei ist die Entwicklung von sehr schnellen Algorithmen zur Schätzung der Regressionsfläche, damit die vorgeschlagenen Ansätze auch zur Modellierung großer räumlicher Daten anwendbar sind. Zur Lösung dieses Problems wurde in der Literatur ein äquivalentes, aber sehr schnelles DCS-(Double-Conditional-Smoothing-)Verfahren vorgeschlagen. In diesem Vorhaben wurde eine funktionelle Version dieses Verfahrens (FDCS) entwickelt, das ebenfalls äquivalent zur bivariaten Kernregression ist, jedoch läuft das FDCS-Verfahren deutlich schneller. Die Eigenschaften von FDCS und seine Erweiterung zur lokal polynomialen Regression wurden unter einem unabhängigen bzw. einem short-memory Störungsterm untersucht. Dann wurden diese Ergebnisse weiter zu einem Semi-SFARIMA-(Semiparametric-Spatial-FARIMA-)Modell, unter der Annahme, dass der Störterm einem SFARIMA-Modell folgt, erweitert. Exakte und asymptotische Eigenschaften sowie parametrische und nichtparametrische Schätzung dieses Modells wurden genau diskutiert. Es wurde festgestellt, dass die parametrische Schätzung eines großen SFARIMA-Modells auch sehr lang dauern kann. Ein entsprechendes, schnelles Schätzverfahren dafür ist daher vorgeschlagen worden. Die praktische Relevanz der vorgeschlagenen Modelle wurde mit Simulationen und Datenbeispielen gezeigt. Alle vorgeschlagenen Modelle können auf geeignete Querschnittsdaten und univariate oder räumliche Zeitreihen aus jedem Forschungsgebiet angewandt werden. Die meisten entwickelten Algorithmen sind schon in gemeinnützigen R-Paketen, einschließlich eines zur datengesteuerten semiparametrischen Modellierung von short-memory Zeitreihen, auf dem CRAN-Network publiziert. Es ist festgestellt worden, dass die Box-Cox-Transformation zur Analyse von long-memory Zeitreihen ungeeignet ist. Darüber hinaus hat sich die Suche nach einer geeigneten Transformation entgegen der Erwartung als ein schwieriges Thema herausgestellt. Eine im engen Zusammenhang stehende Alternative zu der Log-SAN-Transformation ist z.B. die Birnbaum-Saunders-Transformation, die jedoch nur zur Modellierung von extremen Light-Tails in den Log-Daten angewandt werden sollte. Es gibt einige interessante offene Fragen, die in der Zukunft weiter untersucht werden könnten.
Publications
- (2020). Data-driven Local Polynomial Estimation for the Trend and its Derivatives in Economic Time Series. Journal of Nonparametric Statistics, 32(2), 510-533
Feng, Y., Gries, T. and Fritz, M.
(See online at https://doi.org/10.1080/10485252.2020.1759598) - (2020). Fractionally integrated Log-GARCH with application to value at risk and expected shortfall. CIE Working Paper, WP 2020-11
Feng, Y., Beran, J., Ghosh, S., Letmathe, S.
- (2021). Fast Computation and Bandwidth Selection Algorithms for Smoothing Functional Time Series. CIE Working Paper, WP 2021-08
Schäfer, B., Feng, Y.
- (2021). Uni- and multivariate extensions of the sinh-arcsinh normal distribution applied to distributional regression. CIE Working Paper, WP 2021-05
Feng, Y., Härdle, W.