Sind Zeitreihenprognosen
mit Foundation Models auf Edge Devices möglich?

Ein Praxisbericht

Prognosemodelle werden häufig zentral in der Cloud oder auf leistungsfähigen Server-Systemen betrieben.

Die Frage, die wir uns gestellt haben: Lassen sich Prognosen mit Time Series Foundation Models (TSFM) auch auf kleinen Edge Devices betreiben?

Genau dieser Frage sind wir in einem Praxisversuch nachgegangen.

Ähnlich wie große Sprachmodelle im Bereich Text ermöglichen Time Series Foundation Models (TSFM) es, bereits vortrainierte Modelle direkt einzusetzen – ohne eigenes Training auf große Mengen historischer Daten. Besonders spannend wird dieser Ansatz dort, wo Prognosen nicht zentral in der Cloud oder lokalen Servern berechnet, sondern möglichst direkt vor Ort benötigt werden.

Inhalt:

Setup
TSFM auf Edge Devices ist möglich!
Technische Implementierungsdetails
Fazit

Warum Edge Devices für Zeitreihenprognosen interessant sind

Der Betrieb von KI-Modellen direkt auf Edge Devices bringt eine Reihe praktischer Vorteile mit sich:

Daten verlassen das Gerät nicht
Betrieb auch in vollständig isolierten („air-gapped“) Umgebungen möglich
Keine Cloud-Abhängigkeit
Keine zentrale Infrastruktur notwendig
Hardware ist häufig bereits zur Datenerhebung vorhanden

Gerade in regulierten Branchen oder im Umfeld kritischer Infrastrukturen können lokale KI-Lösungen (edge) deshalb besonders attraktiv sein.

Hinzu kommt: Time Series Foundation Models sind – verglichen mit großen Sprachmodellen – deutlich kompakter. Die spannende Frage lautet also: „Wie klein darf die Zielhardware sein, um verlässliche Zeitreihen-Prognosen zu erstellen?

Das Test-Setup

Für unseren Praxistest haben wir zwei typische und weit verbreitete Edge-Devices verwendet.

Raspberry Pi 4

4 GB RAM
Raspberry Pi OS Lite
64-Bit Architektur
Abmessungen: 85 mm x 56 mm x 17 mm

Wichtig: Ältere 32-Bit-Betriebssysteme sind für dieses Szenario nicht geeignet.

Raspberry Pi 4 für Zero Shot Time Series Forecasting

Raspberry Pi Zero 2 W

500 MB RAM
Raspberry Pi OS Lite
ebenfalls 64-Bit Architektur
Abmessungen: 65 mm x 30 mm x 5mm

Die spannende Frage: Reicht selbst diese sehr begrenzte Hardware noch aus, um moderne Time Series Foundation Models produktiv einzusetzen?

Die verwendeten Foundation Models

Als Time Series Foundation Model haben wir Chronos 2 gewählt.

Die Modelle bietet mehrere Vorteile:

frei einsetzbar unter Apache-2.0-Lizenz
produktionsreife Implementierung
sehr gute Prognosequalität
verfügbar in unterschiedlichen Modellgrößen

Neben dem großen Modell mit 200 Millionen Parametern existiert zusätzlich eine deutlich kleinere Variante: Chronos 2 Small mit lediglich 28 Millionen Parametern.

Die Modellgrößen liegen bei:

ca. 480 MB (Chronos 2)
ca. 110 MB (Chronos 2 Small)

TSFM auf Edge Devices ist möglich!

Zeitreihenprognosen mit Foundation Models auf Raspberry Pi sind gut möglich. Wir konnten jeweils 50 Zeitreihen mit 192 Prognosewerten zuverlässig in unter einer Minute vorhersagen.

Auf dem größeren Raspberry Pi laufen beiden Chronos 2 Versionen; auf dem kleineren lediglich das kleinere Modell. Dies ist verständlich, da die Modellgewichte des größeren Modells bereits nahezu den gesamten verfügbaren Arbeitsspeicher des Zero 2 W belegen würden.

Gerät	Modell	Laufzeit
Raspberry Pi 4	Chronos 2 (200M)	44 Sekunden
Raspberry Pi 4	Chronos 2 Small (28M)	9 Sekunden
Raspberry Pi Zero 2 W	Chronos 2 Small (28M)	38 Sekunden

Technische Implementierungsdetails

Den vollständigen lauffähigen Code haben wir auf Github https://github.com/eoda-dev/tsfm-edge als open source veröffentlicht, sodass sich das Setup bequem klonen und reproduzieren lässt.

Herausforderung: PyTorch auf ARM-Architektur

Die größte technische Hürde war weniger das Modell selbst, sondern die Installation von PyTorch auf ARM-basierten Raspberry-Pi-Systemen.

Die Herausforderungen:

Torch benötigt architekturspezifische Builds passend zur CPU
Raspberry Pis nutzen ARM-CPUs statt x86
aktuelle Torch-Versionen verwenden CPU-Instruktionen, die ältere Pis nicht unterstützen
die benötigten Pytorch Wheels liegen nicht direkt auf PyPI

Mittels moderner Paketmanager wie uv (aus unserer Sicht einfacher als bspw. pip) lassen sich die benötigten Anforderungen (bspw. Pytorch zwischen 2.0 und 2.10 ) gut in der pyproject.toml konfigurieren:

Auszug pyproject.toml:

[project]
dependencies = [
    "chronos-forecasting==2.2.2",
    "polars==1.40.1",
    "torch>=2.0,<2.10",
]


[tool.uv.sources]
torch = [ # required by chronos-forecasting
    { index = "pytorch-cpu", marker = "platform_machine == 'aarch64'" }
]

[[tool.uv.index]]
name = "pytorch-cpu"
url = "https://download.pytorch.org/whl/cpu"
explicit = true

Download und Laden des Modells

Die Modelle werden beim ersten Durchlauf automatisch vom Hugging Face Model Hub geladen und lokal zwischengespeichert.

Auszug: src/forecast.py

from chronos import Chronos2Pipeline

# Zero shot model (will be cached at ~\.cache\huggingface\hub)
model = Chronos2Pipeline.from_pretrained("autogluon/chronos-2-small", device_map="cpu", dtype=torch.float32)

Dadurch entstehen beim ersten Start zusätzliche Downloadzeiten, spätere Durchläufe profitieren jedoch vom lokalen Cache.

Der Datensatz

Für einen realistischen Test haben wir 50 Zeitreihen aus einem praktischen Anwendungsfall verwendet: Prognosen des Stromverbrauchs.

Die Vorhersage basiert auf:

- 7 Tagen Historie
- Prognosehorizont von 2 Tagen

15-Minuten-Intervallen

Die verwendeten Parameter sahen folgendermaßen aus:

# 7 days of context, 2 days of forecast
context_length = 7 * 24 * 4
forecast_length = 2 * 24 * 4

Effiziente Prognoseerstellung mit Batch-Verarbeitung

Die Prognose durch das Modell wird auf Basis der Pytorch-Bibliothek ausgeführt. Für eine schnelle Verarbeitung durch Pytorch werden die 50 Zeitreihen in einen Input-Tensor zusammengefasst und dem Modell zur Vorhersage übergeben. Die ground_truth ist hier lediglich für die spätere Evaluation mittels Mean Average Error (MAE) Metrik nötig.

# build context + ground truth for processing with torch

for values in groups["value"]:
    context_tensors.append(torch.tensor(values[:context_length], dtype=torch.float32))
    ground_truth.append(torch.tensor(values[context_length : context_length + forecast_length]))

batch_context = torch.stack(context_tensors).unsqueeze(1)

Gerade auf kleineren Geräten wie dem Raspberry Pi Zero 2 W empfiehlt es sich, die batch_size zu reduzieren, um Speicherprobleme zu vermeiden.

# run forecast
forecasts = model.predict(inputs=batch_context, prediction_length=forecast_length, batch_size=32)

Besonderheit Raspberry Pi Zero 2 W: Stromversorgung

Für die Erstellung einer Prognose (Modellinferenz) benötigt der Raspberry Pi Zero 2 W eine zuverlässige Stromversorgung. Während einfache Anwendungen oft problemlos über einen USB-Port betrieben werden können, führte die höhere Last während der Modellinferenz teilweise zu Instabilitäten und Abstürzen. Mit einem externen Netzteil lief das System dagegen stabil.

Fazit

Zero-Shot-Time-Series-Forecasting auf Edge Devices funktioniert gut, ist aber mit einem gewissen zusätzlichen Aufwand verbunden – der aber durch die Vorteile wettgemacht wird:

schnelles Prototyping
dezentrale KI-Anwendungen
datenschutzfreundliche Prognosesysteme
KI-Lösungen ohne Cloud-Abhängigkeit
lokale Analytik in kritischen Infrastrukturen

Das bedeutet, dass Zero-Shot-Time-Series-Forecasting heute nicht mehr ausschließlich ein Thema für leistungsfähige Server oder GPU-Infrastrukturen ist. Moderne Time Series Foundation Models lassen sich bereits auf sehr kleiner Hardware sinnvoll einsetzen – selbst auf günstigen Edge Devices wie Raspberry Pis.

Besonders spannend ist dabei, dass bereits die kleineren Modellvarianten in vielen Fällen erstaunlich gute Ergebnisse liefern und gleichzeitig deutlich geringere Hardwareanforderungen besitzen.

Data-Science-Umsetzung:

Wir sind Ihr Partner bei der Identifikation und Umsetzung von Use Cases für Time Series Foundation Models

Mehr erfahren

Weiterführende Inhalte

Time Series Foundation Models Mit Zero Shot zu (besseren) Zeitreihenprognosen
Technischer Deep Dive: Zeitreihenprognosen mit Foundation Models
eoda Online Session: Zero-Shot Time-Series Forecasting: Prognosen von Zeitreihen ohne Trainingsdaten (PDF)
Fachartikel von Matthias Henneke : Zero-Shot Time Series Forecasting: Prognosen von Zeitreihen ohne Trainingsdaten (externer Link, IT Daily)

Veröffentlicht: 21. Mai 2026

AutorIn

Matthias Henneke

Matthias Henneke ist Senior Data Scientist und kam nach Stationen in Wirtschaft und Wissenschaft zu eoda. In seinen Kundenprojekten realisiert er Data-Science-Lösungen vom Agentensystem bis zu klassischen Ansätzen des Machine Learning. Im Rahmen von Trainings gibt er seine Praxiserfahrung regelmäßig an Teilnehmende weiter.

Sind Zeitreihenprognosen mit Foundation Models auf Edge Devices möglich?