Modelle
Jedes Modell, eine effiziente API
Open-Weight-Modelle für Sprache, Reasoning, Programmieren, Bilder, Embeddings und Spracherkennung, alle von uns mit 100% Ökostrom gehostet und auf Effizienz getrimmt. Ein Katalog, ein Schlüssel, der niedrigste Energieverbrauch, der die Aufgabe noch erledigt.
Der Katalog
Jedes Modell, nach Kategorie
Open-Weight-Modelle laufen mit 100% Ökostrom und führender Effizienz, erreichbar über eine OpenAI-kompatible API und einen einzigen Schlüssel.
Chat & Sprache
Open-Weight-Modelle unter der Marke GreenPT für alltäglichen Chat, Reasoning und Schreiben, abgestimmt auf europäische Sprachen.
- Google Gemma 4
gemma4
Multimodales Reasoning mit langem Kontextfenster für Dokumente und umfangreiche Prompts.
- Bilder
- Reasoning
- Langer Kontext
- Eingabe
- €0,50
- Ausgabe
- €1,50
pro 1M Tokens
- GPT-OSS
green-r
Fortgeschrittenes Reasoning, Schreiben und multimodales Verständnis, mit den Leitplanken von GreenPT.
- Reasoning
- Bilder
- Eingabe
- €0,35
- Ausgabe
- €0,95
pro 1M Tokens
- Mistral Small 3.2 24B
green-l
Schnelles mehrsprachiges Modell mit niederländischen Grammatik-Leitplanken für europäische Workloads.
- Mehrsprachig
- Funktionen
- Eingabe
- €0,25
- Ausgabe
- €0,80
pro 1M Tokens
Foundation-Modelle
Open-Weight-Foundation-Modelle, die wir selbst hosten, abgestimmt auf den geringsten Energieverbrauch je Aufgabe.
- Qwen
qwen3.5-397b-a17b
Großes Mixture-of-Experts-Modell für Codegenerierung und agentische Aufgaben.
- Code
- Agentic
- Funktionen
- Eingabe
- €0,70
- Ausgabe
- €4,35
pro 1M Tokens
- OpenAI
gpt-oss-120b
Open-Weight-Modell mit 120B, Bildverständnis und Reasoning über lange Kontexte.
- Bilder
- Reasoning
- Eingabe
- €0,20
- Ausgabe
- €0,70
pro 1M Tokens
- Mistral
mistral-small-3.2-24b-instruct-2506
Effizientes Instruct-Modell mit Function Calling und Bildverständnis.
- Funktionen
- Bilder
- Eingabe
- €0,20
- Ausgabe
- €0,40
pro 1M Tokens
- Google
gemma-3-27b-it
Kompaktes multimodales Modell für allgemeines Reasoning und das Befolgen von Anweisungen.
- Bilder
- Reasoning
- Eingabe
- €0,30
- Ausgabe
- €0,60
pro 1M Tokens
- Meta
llama-3.3-70b-instruct
Mehrsprachiges Instruct-Modell mit 70B für breiten allgemeinen Einsatz.
- Mehrsprachig
- Eingabe
- €1,10
- Ausgabe
- €1,10
pro 1M Tokens
- Mistral
mistral-medium-3.5-128b
Reasoning, Programmieren und Bildverständnis auf Spitzenniveau, mit langem Kontextfenster.
- Reasoning
- Code
- Bilder
- Eingabe
- €1,80
- Ausgabe
- €9,00
pro 1M Tokens
Programmieren
Modelle, die auf Codegenerierung, Vervollständigung und agentische Entwickler-Workflows abgestimmt sind.
- Qwen
qwen3-coder-30b-a3b-instruct
Auf Code spezialisiertes Modell für Generierung und Vervollständigung über mehrere Sprachen.
- Code
- Funktionen
- Eingabe
- €0,25
- Ausgabe
- €0,95
pro 1M Tokens
- Mistral
devstral-2-123b-instruct-2512
Großes Coding-Modell für agentische Softwareaufgaben und Tool-Nutzung.
- Code
- Agentic
- Funktionen
- Eingabe
- €0,50
- Ausgabe
- €2,40
pro 1M Tokens
Audio & Sprache
Transkription und Sprachverständnis, mehrsprachig und präzise.
- Mistral
voxtral-small-24b-2507
Audiotranskription und Sprachverständnis in einem Modell.
- Audio
- Eingabe
- €0,20
- Ausgabe
- €0,45
pro 1M Tokens
- GreenPT
green-s
Aufgezeichnete und Live-Sprache-zu-Text für allgemeine Transkription.
- Audio
- Aufnahme
- €0,52
- Live
- €0,65
pro Stunde
- GreenPT
green-s-pro
Höhere Genauigkeit bei der Transkription mit mehrsprachigen Optionen.
- Audio
- Mehrsprachig
- Aufnahme
- €0,52
- Live
- €0,78
pro Stunde
Embeddings & Retrieval
Vektoren und Reranking für semantische Suche und RAG-Pipelines.
- Qwen3-Embedding-4B
green-embedding
Mehrsprachige Embeddings mit bis zu 2560 Dimensionen für semantische Suche und RAG.
- Embeddings
- Mehrsprachig
- Preis
- €0,20
pro 1M Tokens
- Qwen3-Reranker-4B
green-rerank
Ordnet abgerufene Dokumente nach echter Relevanz neu, die letzte Meile der Suche.
- Reranking
- Preis
- €0,12
pro 1M Tokens
In Arbeit
Demnächst
Neue Open-Weight-Modelle, die in den Katalog kommen. Preise und Benchmark-Werte sind vorläufig und können zum Start abweichen.
Demnächst
Neue Open-Weight-Modelle, die in den Katalog kommen. Preise und Benchmarks sind vorläufig und können zum Start abweichen.
- z-ai
z-ai/glm-5.2
Hochintelligentes Reasoning-Modell mit einem Kontextfenster von 1M Tokens.
- Intel
- 51.1
- Coding
- 50.7
- Funktionen
- Tool Choice
- Reasoning
- Eingabe
- $1.50
- Cache
- $0.38
- Ausgabe
- $4.50
pro 1M Tokens
- minimax
minimax/minimax-m3
Agentisches multimodales Modell mit starker Tool-Nutzung und 1M-Token-Kontext.
- Intel
- 44.4
- Coding
- 43.4
- Agentic
- 89%
- Funktionen
- Tool Choice
- Reasoning
- Bilder
- Eingabe
- $0.40
- Cache
- $0.10
- Ausgabe
- $2.00
pro 1M Tokens
- deepseek
deepseek/deepseek-v4-pro
Flaggschiff von DeepSeek für Programmieren und agentische Aufgaben, mit 1M-Token-Kontext.
- Intel
- 44.3
- Coding
- 47.5
- Agentic
- 96%
- Funktionen
- Tool Choice
- Reasoning
- Eingabe
- $1.75
- Cache
- $0.44
- Ausgabe
- $3.50
pro 1M Tokens
- moonshotai
moonshotai/kimi-k2.6
Agentisches multimodales Modell mit Bildverständnis und 256K-Token-Kontext.
- Intel
- 42.8
- Coding
- 47.1
- Agentic
- 96%
- Funktionen
- Tool Choice
- Reasoning
- Bilder
- Eingabe
- $1.00
- Cache
- $0.25
- Ausgabe
- $4.00
pro 1M Tokens
- moonshotai
moonshotai/kimi-k2.7-code
Auf Code ausgerichtete Kimi-Variante mit Bildverständnis und 256K-Token-Kontext.
- Intel
- 41.9
- Coding
- 45.8
- Funktionen
- Tool Choice
- Reasoning
- Bilder
- Eingabe
- $1.25
- Cache
- $0.31
- Ausgabe
- $4.50
pro 1M Tokens
- deepseek
deepseek/deepseek-v4-flash
Günstiges DeepSeek-Modell mit hohem Durchsatz und 1M-Token-Kontext.
- Intel
- 40.3
- Coding
- 38.7
- Agentic
- 95%
- Funktionen
- Tool Choice
- Reasoning
- Eingabe
- $0.15
- Cache
- $0.04
- Ausgabe
- $0.30
pro 1M Tokens
Modelle, kurz erklärt
Wie wähle ich ein Modell?
Wähle nach Leistung und Budget. Jedes Modell ist Open-Weight und wird von uns gehostet, sodass du das kleinste Modell nimmst, das deine Aufgabe bewältigt, und starke Ergebnisse bei geringstem Energieverbrauch und niedrigsten Kosten erzielst.
Warum sind diese Modelle effizienter?
Sie sind Open-Weight und laufen mit 100% Ökostrom in Rechenzentren mit einem PUE von 1,25 und einem WUE von 0,25, deutlich unter den Branchenschnitten von 1,55 und 1,8. Leichtere, quantisierte Modelle und automatisches Routing sorgen dafür, dass jede Anfrage nur so viel Rechenleistung nutzt, wie die Aufgabe wirklich braucht.
Wie wird der Preis berechnet?
Die meisten Modelle werden pro Million Eingabe- und Ausgabe-Tokens berechnet; Sprachmodelle pro Stunde Audio. Die Preise stehen auf jeder Karte und in der API-Dokumentation.
Gesamten Katalog ansehen →Welche Modelle kommen demnächst?
Neue Open-Weight-Modelle, die in den Katalog aufgenommen werden. Ihre Preise und Benchmark-Werte sind vorläufig und können zum Start abweichen.
Wie rufe ich ein Modell auf?
Über die OpenAI-kompatible API: Base-URL und Schlüssel setzen, dann die Modell-ID übergeben. Ein Schlüssel deckt jedes Modell ab, dazu Embeddings, Reranking, OCR, Sprache, Scraping und Suche.
API-Dokumentation lesen →Der Unterschied
Ein Schlüssel für jedes Modell.
Starte 14 Tage kostenlos, ohne Kreditkarte. Rufe jedes Modell über eine OpenAI-kompatible API auf, von uns mit 100% Ökostrom gehostet und ab der ersten Anfrage auf geringsten Energieverbrauch getrimmt.
Keine Kreditkarte nötig.
- 100% Ökostrom
- PUE 1,25
- Open-Weight