Ähnlich wie große Sprachmodelle im Bereich Text ermöglichen Time Series Foundation Models (TSFM) es, bereits vortrainierte Modelle direkt einzusetzen – ohne eigenes Training auf große Mengen historischer Daten. Besonders spannend wird dieser Ansatz dort, wo Prognosen nicht zentral in der Cloud oder lokalen Servern berechnet, sondern möglichst direkt vor Ort benötigt werden.
Inhalt:
Warum Edge Devices für Zeitreihenprognosen interessant sind
Der Betrieb von KI-Modellen direkt auf Edge Devices bringt eine Reihe praktischer Vorteile mit sich:
- Daten verlassen das Gerät nicht
- Betrieb auch in vollständig isolierten („air-gapped“) Umgebungen möglich
- Keine Cloud-Abhängigkeit
- Keine zentrale Infrastruktur notwendig
- Hardware ist häufig bereits zur Datenerhebung vorhanden
Gerade in regulierten Branchen oder im Umfeld kritischer Infrastrukturen können lokale KI-Lösungen (edge) deshalb besonders attraktiv sein.
Hinzu kommt: Time Series Foundation Models sind – verglichen mit großen Sprachmodellen – deutlich kompakter. Die spannende Frage lautet also: „Wie klein darf die Zielhardware sein, um verlässliche Zeitreihen-Prognosen zu erstellen?
Das Test-Setup
Für unseren Praxistest haben wir zwei typische und weit verbreitete Edge-Devices verwendet.
Raspberry Pi 4
- 4 GB RAM
- Raspberry Pi OS Lite
- 64-Bit Architektur
- Abmessungen: 85 mm x 56 mm x 17 mm
Wichtig: Ältere 32-Bit-Betriebssysteme sind für dieses Szenario nicht geeignet.
Raspberry Pi Zero 2 W
- 500 MB RAM
- Raspberry Pi OS Lite
- ebenfalls 64-Bit Architektur
- Abmessungen: 65 mm x 30 mm x 5mm
Die spannende Frage: Reicht selbst diese sehr begrenzte Hardware noch aus, um moderne Time Series Foundation Models produktiv einzusetzen?
Die verwendeten Foundation Models
Als Time Series Foundation Model haben wir Chronos 2 gewählt.
Die Modelle bietet mehrere Vorteile:
- frei einsetzbar unter Apache-2.0-Lizenz
- produktionsreife Implementierung
- sehr gute Prognosequalität
- verfügbar in unterschiedlichen Modellgrößen
Neben dem großen Modell mit 200 Millionen Parametern existiert zusätzlich eine deutlich kleinere Variante: Chronos 2 Small mit lediglich 28 Millionen Parametern.
Die Modellgrößen liegen bei:
- ca. 480 MB (Chronos 2)
- ca. 110 MB (Chronos 2 Small)
TSFM auf Edge Devices ist möglich!
Zeitreihenprognosen mit Foundation Models auf Raspberry Pi sind gut möglich. Wir konnten jeweils 50 Zeitreihen mit 192 Prognosewerten zuverlässig in unter einer Minute vorhersagen.
Auf dem größeren Raspberry Pi laufen beiden Chronos 2 Versionen; auf dem kleineren lediglich das kleinere Modell. Dies ist verständlich, da die Modellgewichte des größeren Modells bereits nahezu den gesamten verfügbaren Arbeitsspeicher des Zero 2 W belegen würden.
| Gerät | Modell | Laufzeit |
|---|---|---|
| Raspberry Pi 4 | Chronos 2 (200M) | 44 Sekunden |
| Raspberry Pi 4 | Chronos 2 Small (28M) | 9 Sekunden |
| Raspberry Pi Zero 2 W | Chronos 2 Small (28M) | 38 Sekunden |
Technische Implementierungsdetails
Den vollständigen lauffähigen Code haben wir auf Github https://github.com/eoda-dev/tsfm-edge als open source veröffentlicht, sodass sich das Setup bequem klonen und reproduzieren lässt.
Herausforderung: PyTorch auf ARM-Architektur
Die größte technische Hürde war weniger das Modell selbst, sondern die Installation von PyTorch auf ARM-basierten Raspberry-Pi-Systemen.
Die Herausforderungen:
- Torch benötigt architekturspezifische Builds passend zur CPU
- Raspberry Pis nutzen ARM-CPUs statt x86
- aktuelle Torch-Versionen verwenden CPU-Instruktionen, die ältere Pis nicht unterstützen
- die benötigten Pytorch Wheels liegen nicht direkt auf PyPI
Mittels moderner Paketmanager wie uv (aus unserer Sicht einfacher als bspw. pip) lassen sich die benötigten Anforderungen (bspw. Pytorch zwischen 2.0 und 2.10 ) gut in der pyproject.toml konfigurieren:
Auszug pyproject.toml:
[project]
dependencies = [
"chronos-forecasting==2.2.2",
"polars==1.40.1",
"torch>=2.0,<2.10",
]
[tool.uv.sources]
torch = [ # required by chronos-forecasting
{ index = "pytorch-cpu", marker = "platform_machine == 'aarch64'" }
]
[[tool.uv.index]]
name = "pytorch-cpu"
url = "https://download.pytorch.org/whl/cpu"
explicit = true
Download und Laden des Modells
Die Modelle werden beim ersten Durchlauf automatisch vom Hugging Face Model Hub geladen und lokal zwischengespeichert.
Auszug: src/forecast.py
from chronos import Chronos2Pipeline # Zero shot model (will be cached at ~\.cache\huggingface\hub) model = Chronos2Pipeline.from_pretrained("autogluon/chronos-2-small", device_map="cpu", dtype=torch.float32)
Dadurch entstehen beim ersten Start zusätzliche Downloadzeiten, spätere Durchläufe profitieren jedoch vom lokalen Cache.
Der Datensatz
Für einen realistischen Test haben wir 50 Zeitreihen aus einem praktischen Anwendungsfall verwendet: Prognosen des Stromverbrauchs.
Die Vorhersage basiert auf:
-
- 7 Tagen Historie
- Prognosehorizont von 2 Tagen
- 15-Minuten-Intervallen
Die verwendeten Parameter sahen folgendermaßen aus:
# 7 days of context, 2 days of forecast context_length = 7 * 24 * 4 forecast_length = 2 * 24 * 4
Effiziente Prognoseerstellung mit Batch-Verarbeitung
Die Prognose durch das Modell wird auf Basis der Pytorch-Bibliothek ausgeführt. Für eine schnelle Verarbeitung durch Pytorch werden die 50 Zeitreihen in einen Input-Tensor zusammengefasst und dem Modell zur Vorhersage übergeben. Die ground_truth ist hier lediglich für die spätere Evaluation mittels Mean Average Error (MAE) Metrik nötig.
# build context + ground truth for processing with torch for values in groups["value"]: context_tensors.append(torch.tensor(values[:context_length], dtype=torch.float32)) ground_truth.append(torch.tensor(values[context_length : context_length + forecast_length])) batch_context = torch.stack(context_tensors).unsqueeze(1)
Gerade auf kleineren Geräten wie dem Raspberry Pi Zero 2 W empfiehlt es sich, die batch_size zu reduzieren, um Speicherprobleme zu vermeiden.
# run forecast forecasts = model.predict(inputs=batch_context, prediction_length=forecast_length, batch_size=32)
Besonderheit Raspberry Pi Zero 2 W: Stromversorgung
Für die Erstellung einer Prognose (Modellinferenz) benötigt der Raspberry Pi Zero 2 W eine zuverlässige Stromversorgung. Während einfache Anwendungen oft problemlos über einen USB-Port betrieben werden können, führte die höhere Last während der Modellinferenz teilweise zu Instabilitäten und Abstürzen. Mit einem externen Netzteil lief das System dagegen stabil.
Fazit
Zero-Shot-Time-Series-Forecasting auf Edge Devices funktioniert gut, ist aber mit einem gewissen zusätzlichen Aufwand verbunden – der aber durch die Vorteile wettgemacht wird:
- schnelles Prototyping
- dezentrale KI-Anwendungen
- datenschutzfreundliche Prognosesysteme
- KI-Lösungen ohne Cloud-Abhängigkeit
- lokale Analytik in kritischen Infrastrukturen
Das bedeutet, dass Zero-Shot-Time-Series-Forecasting heute nicht mehr ausschließlich ein Thema für leistungsfähige Server oder GPU-Infrastrukturen ist. Moderne Time Series Foundation Models lassen sich bereits auf sehr kleiner Hardware sinnvoll einsetzen – selbst auf günstigen Edge Devices wie Raspberry Pis.
Besonders spannend ist dabei, dass bereits die kleineren Modellvarianten in vielen Fällen erstaunlich gute Ergebnisse liefern und gleichzeitig deutlich geringere Hardwareanforderungen besitzen.
Data-Science-Umsetzung:
Wir sind Ihr Partner bei der Identifikation und Umsetzung von Use Cases für Time Series Foundation Models
Weiterführende Inhalte
- Time Series Foundation Models Mit Zero Shot zu (besseren) Zeitreihenprognosen
- Technischer Deep Dive: Zeitreihenprognosen mit Foundation Models
- eoda Online Session: Zero-Shot Time-Series Forecasting: Prognosen von Zeitreihen ohne Trainingsdaten (PDF)
- Fachartikel von Matthias Henneke : Zero-Shot Time Series Forecasting: Prognosen von Zeitreihen ohne Trainingsdaten (externer Link, IT Daily)
Veröffentlicht: 21. Mai 2026
AutorIn
Starten Sie jetzt durch:
Wir freuen uns auf den Austausch mit Ihnen.