Methodik
Wie unsere Spritpreis-Prognosen entstehen
Datenquellen
Unsere Prognosen basieren auf mehreren Datenquellen, die taeglich und woechentlich aktualisiert werden:
- Tankerkoenig MTS-K: Preisdaten aller 14.000+ Tankstellen in Deutschland, alle 5 Minuten aktualisiert. Daten werden gemaess CC-BY-4.0-Lizenz verwendet.
- Historische Preise: Lueckenlose Preishistorie seit Juni 2014, umfasst ueber 30 GB an Preisaenderungen aus den offiziellen PostgreSQL-Dumps der Markttransparenzstelle fuer Kraftstoffe (MTS-K).
- Brent-Rohoelpreis: Taeglicher Referenzpreis des Nordseeoel-Benchmarks als externer Einflussfaktor. Rohoel bestimmt den Hauptteil der Kraftstoffkosten und verschiebt die Preisniveaus aller Stationen gleichzeitig.
- Feiertage und Schulferien: Bundeslandspezifische Kalender fuer saisonale Muster -- Tanknachfrage steigt typischerweise vor Feiertagen und Ferienbeginn.
Prophet-Modell
Fuer mittelfristige Prognosen (1 bis 7 Tage) setzen wir auf Facebook Prophet, ein Zeitreihenmodell, das speziell fuer saisonale Daten mit mehreren Periodenebenen entwickelt wurde.
- Erkennt automatisch Wochentags-, Wochen- und Jahreszeitmuster in den Kraftstoffpreisen.
- Beruecksichtigt bekannte Strukturbrueche, die das Preisniveau dauerhaft veraendert haben: COVID-19-Lockdowns (2020), Ukraine-Krise (2022), Tankrabatt (Juni/Juli 2022), Einfuehrung des Tankgesetzes (Mai 2023).
- Hyperparameter-Optimierung mit Optuna (30 Versuche pro Modell, TPE-Algorithmus) -- so wird jedes Modell auf seine spezifische Station oder Region abgestimmt.
- Getrennte Modelle auf drei Ebenen: nationale Ebene (Deutschlanddurchschnitt), Bundeslaender und Top-500 Tankstellen (ausgewaehlt nach Haeufigkeit der Preisaenderungen).
SARIMAX-Modell
Fuer kurzfristige Prognosen (6 bis 24 Stunden) verwenden wir SARIMAX (Seasonal AutoRegressive Integrated Moving Average with eXogenous regressors), ein statistisches Zeitreihenmodell, das externe Einflussfaktoren direkt einbezieht.
- Nutzt exogene Variablen: den aktuellen Brent-Rohoelpreis, die Wettbewerbsdichte (Anzahl konkurrierender Tankstellen im Umkreis) und Feiertagsstatus.
- Tankgesetz (seit Mai 2023): Das Gesetz ueber die Markttransparenz bei Kraftstoffen verpflichtet Tankstellen, Preiserhoehungen der Bundesnetzagentur eine Stunde im Voraus zu melden, und erlaubt nur eine Erhoehung pro Tag. Das erzeugt ein vorhersehbares Tagesmuster -- Preisspitzen konzentrieren sich typischerweise auf den Morgen. SARIMAX erkennt und nutzt dieses Muster besonders effektiv, da es genau auf saisonale Tagesstrukturen ausgelegt ist.
- Hyperparameter (ARIMA-Ordnung und saisonale Ordnung) werden ebenfalls per Optuna optimiert.
Ensemble
Prophet und SARIMAX haben unterschiedliche Staerken. Das Ensemble-Verfahren kombiniert beide Modelle mit einem zeithorizontabhaengigen Gewichtungsschema:
- Kurzfristig (bis 24 Stunden): SARIMAX dominiert mit Gewicht 0,6 -- es erfasst tagesstrukturelle Muster (inkl. Tankgesetz-Effekt) praeziser.
- Mittelfristig (24 bis 48 Stunden): Gleichgewichtete Kombination (0,5 / 0,5) -- beide Modelle tragen gleich viel bei.
- Langfristig (ueber 48 Stunden): Prophet dominiert mit Gewicht 0,7 -- saisonale Muster und Trendprojektionen sind auf laengere Sicht zuverlaessiger.
Das Konfidenzband wird konservativ berechnet: Das breiteste Band beider Einzelmodelle wird verwendet, um die Unsicherheit nicht zu unterschaetzen.
Genauigkeit
Wir messen die Prognosequalitaet anhand von vier Metriken, die in der Kraftstoffpreis-Forschung gaengig sind:
- MAE < 0,03 EUR (Mean Absolute Error): Mittlere absolute Abweichung zwischen Prognose und tatsaechlichem Preis -- unser Ziel sind weniger als 3 Cent Fehler im Durchschnitt.
- RMSE < 0,05 EUR (Root Mean Squared Error): Aehnlich wie MAE, bestraft aber grosse Einzelabweichungen staerker -- weniger als 5 Cent ist unser Zielwert.
- MAPE < 2 % (Mean Absolute Percentage Error): Prozentuale Abweichung -- weniger als 2 % Fehler relativ zum tatsaechlichen Preis.
- Richtungsgenauigkeit > 75 %: In mehr als drei von vier Faellen sagt das Modell korrekt vorher, ob der Preis steigt oder faellt.
Die aktuelle Prognosegenauigkeit koennen Sie auf unserer Genauigkeitsseite live verfolgen.
Aktualisierung
Unsere Modelle werden regelmaessig neu trainiert, um aktuelle Marktveraenderungen zu beruecksichtigen:
- Woechentliches Neutraining jeden Sonntagabend -- alle Prophet- und SARIMAX-Modelle werden mit den juengsten Preisdaten neu kalibriert.
- Nach jedem Training werden Prognosen fuer alle Stationen und Regionen neu berechnet: stuendliche Vorhersagen fuer 48 Stunden, alle 3 Stunden fuer 7 Tage.
- Top-500 Stationen (nach Preisaenderungshaeufigkeit ausgewaehlt) erhalten individuelle Modelle. Die uebrigen rund 13.500 Stationen werden nach Marke und Bundesland gruppiert und mit Cluster-Modellen prognostiziert.
Aktuelle Prognoseguete im Vergleich zu gemessenen Preisen: Zur Genauigkeitsseite