Luftaufnahme eines stillen Sees, umgeben von dichtem grünem Wald.

Modelle

Jedes Modell, eine effiziente API

Open-Weight-Modelle für Sprache, Reasoning, Programmieren, Bilder, Embeddings und Spracherkennung, alle von uns mit 100% Ökostrom gehostet und auf Effizienz getrimmt. Ein Katalog, ein Schlüssel, der niedrigste Energieverbrauch, der die Aufgabe noch erledigt.

Konto erstellen 14 Tage kostenlos testen (opens in a new tab) Gesamten Katalog ansehen (opens in a new tab)

Der Katalog

Jedes Modell, nach Kategorie

Open-Weight-Modelle laufen mit 100% Ökostrom und führender Effizienz, erreichbar über eine OpenAI-kompatible API und einen einzigen Schlüssel.

Chat & Sprache

Open-Weight-Modelle unter der Marke GreenPT für alltäglichen Chat, Reasoning und Schreiben, abgestimmt auf europäische Sprachen.

Google Gemma 4 256K

gemma4

Multimodales Reasoning mit langem Kontextfenster für Dokumente und umfangreiche Prompts.
- Bilder
- Reasoning
- Langer Kontext
Eingabe

€0,50

Ausgabe

€1,50

pro 1M Tokens

Jetzt verfügbar
GPT-OSS

green-r

Fortgeschrittenes Reasoning, Schreiben und multimodales Verständnis, mit den Leitplanken von GreenPT.
- Reasoning
- Bilder
Eingabe

€0,35

Ausgabe

€0,95

pro 1M Tokens

Jetzt verfügbar
Mistral Small 3.2 24B

green-l

Schnelles mehrsprachiges Modell mit niederländischen Grammatik-Leitplanken für europäische Workloads.
- Mehrsprachig
- Funktionen
Eingabe

€0,25

Ausgabe

€0,80

pro 1M Tokens

Jetzt verfügbar

Foundation-Modelle

Open-Weight-Foundation-Modelle, die wir selbst hosten, abgestimmt auf den geringsten Energieverbrauch je Aufgabe.

Qwen 250K

qwen3.5-397b-a17b

Großes Mixture-of-Experts-Modell für Codegenerierung und agentische Aufgaben.
- Code
- Agentic
- Funktionen
Eingabe

€0,70

Ausgabe

€4,35

pro 1M Tokens

Jetzt verfügbar
OpenAI 128K

gpt-oss-120b

Open-Weight-Modell mit 120B, Bildverständnis und Reasoning über lange Kontexte.
- Bilder
- Reasoning
Eingabe

€0,20

Ausgabe

€0,70

pro 1M Tokens

Jetzt verfügbar
Mistral 128K

mistral-small-3.2-24b-instruct-2506

Effizientes Instruct-Modell mit Function Calling und Bildverständnis.
- Funktionen
- Bilder
Eingabe

€0,20

Ausgabe

€0,40

pro 1M Tokens

Jetzt verfügbar
Google 40K

gemma-3-27b-it

Kompaktes multimodales Modell für allgemeines Reasoning und das Befolgen von Anweisungen.
- Bilder
- Reasoning
Eingabe

€0,30

Ausgabe

€0,60

pro 1M Tokens

Jetzt verfügbar
Meta 100K

llama-3.3-70b-instruct

Mehrsprachiges Instruct-Modell mit 70B für breiten allgemeinen Einsatz.
- Mehrsprachig
Eingabe

€1,10

Ausgabe

€1,10

pro 1M Tokens

Jetzt verfügbar
Mistral 256K

mistral-medium-3.5-128b

Reasoning, Programmieren und Bildverständnis auf Spitzenniveau, mit langem Kontextfenster.
- Reasoning
- Code
- Bilder
Eingabe

€1,80

Ausgabe

€9,00

pro 1M Tokens

Jetzt verfügbar

Programmieren

Modelle, die auf Codegenerierung, Vervollständigung und agentische Entwickler-Workflows abgestimmt sind.

Qwen 128K

qwen3-coder-30b-a3b-instruct

Auf Code spezialisiertes Modell für Generierung und Vervollständigung über mehrere Sprachen.
- Code
- Funktionen
Eingabe

€0,25

Ausgabe

€0,95

pro 1M Tokens

Jetzt verfügbar
Mistral 200K

devstral-2-123b-instruct-2512

Großes Coding-Modell für agentische Softwareaufgaben und Tool-Nutzung.
- Code
- Agentic
- Funktionen
Eingabe

€0,50

Ausgabe

€2,40

pro 1M Tokens

Jetzt verfügbar

Audio & Sprache

Transkription und Sprachverständnis, mehrsprachig und präzise.

Mistral 32K

voxtral-small-24b-2507

Audiotranskription und Sprachverständnis in einem Modell.
- Audio
Eingabe

€0,20

Ausgabe

€0,45

pro 1M Tokens

Jetzt verfügbar
GreenPT

green-s

Aufgezeichnete und Live-Sprache-zu-Text für allgemeine Transkription.
- Audio
Aufnahme

€0,52

Live

€0,65

pro Stunde

Jetzt verfügbar
GreenPT

green-s-pro

Höhere Genauigkeit bei der Transkription mit mehrsprachigen Optionen.
- Audio
- Mehrsprachig
Aufnahme

€0,52

Live

€0,78

pro Stunde

Jetzt verfügbar

Embeddings & Retrieval

Vektoren und Reranking für semantische Suche und RAG-Pipelines.

Qwen3-Embedding-4B

green-embedding

Mehrsprachige Embeddings mit bis zu 2560 Dimensionen für semantische Suche und RAG.
- Embeddings
- Mehrsprachig
Preis

€0,20

pro 1M Tokens

Jetzt verfügbar
Qwen3-Reranker-4B

green-rerank

Ordnet abgerufene Dokumente nach echter Relevanz neu, die letzte Meile der Suche.
- Reranking
Preis

€0,12

pro 1M Tokens

Jetzt verfügbar

In Arbeit

Demnächst

Neue Open-Weight-Modelle, die in den Katalog kommen. Preise und Benchmark-Werte sind vorläufig und können zum Start abweichen.

Demnächst

Neue Open-Weight-Modelle, die in den Katalog kommen. Preise und Benchmarks sind vorläufig und können zum Start abweichen.

z-ai Neu 1M

z-ai/glm-5.2

Hochintelligentes Reasoning-Modell mit einem Kontextfenster von 1M Tokens.

Intel

51.1

Coding

50.7
- Funktionen
- Tool Choice
- Reasoning
Eingabe

$1.50

Cache

$0.38

Ausgabe

$4.50

pro 1M Tokens

Demnächst
minimax Neu 1M

minimax/minimax-m3

Agentisches multimodales Modell mit starker Tool-Nutzung und 1M-Token-Kontext.

Intel

44.4

Coding

43.4

Agentic

89%
- Funktionen
- Tool Choice
- Reasoning
- Bilder
Eingabe

$0.40

Cache

$0.10

Ausgabe

$2.00

pro 1M Tokens

Demnächst
deepseek Neu 1M

deepseek/deepseek-v4-pro

Flaggschiff von DeepSeek für Programmieren und agentische Aufgaben, mit 1M-Token-Kontext.

Intel

44.3

Coding

47.5

Agentic

96%
- Funktionen
- Tool Choice
- Reasoning
Eingabe

$1.75

Cache

$0.44

Ausgabe

$3.50

pro 1M Tokens

Demnächst
moonshotai Neu 256K

moonshotai/kimi-k2.6

Agentisches multimodales Modell mit Bildverständnis und 256K-Token-Kontext.

Intel

42.8

Coding

47.1

Agentic

96%
- Funktionen
- Tool Choice
- Reasoning
- Bilder
Eingabe

$1.00

Cache

$0.25

Ausgabe

$4.00

pro 1M Tokens

Demnächst
moonshotai Neu 256K

moonshotai/kimi-k2.7-code

Auf Code ausgerichtete Kimi-Variante mit Bildverständnis und 256K-Token-Kontext.

Intel

41.9

Coding

45.8
- Funktionen
- Tool Choice
- Reasoning
- Bilder
Eingabe

$1.25

Cache

$0.31

Ausgabe

$4.50

pro 1M Tokens

Demnächst
deepseek Neu 1M

deepseek/deepseek-v4-flash

Günstiges DeepSeek-Modell mit hohem Durchsatz und 1M-Token-Kontext.

Intel

40.3

Coding

38.7

Agentic

95%
- Funktionen
- Tool Choice
- Reasoning
Eingabe

$0.15

Cache

$0.04

Ausgabe

$0.30

pro 1M Tokens

Demnächst

Modelle, kurz erklärt

Wie wähle ich ein Modell?

Wähle nach Leistung und Budget. Jedes Modell ist Open-Weight und wird von uns gehostet, sodass du das kleinste Modell nimmst, das deine Aufgabe bewältigt, und starke Ergebnisse bei geringstem Energieverbrauch und niedrigsten Kosten erzielst.

Warum sind diese Modelle effizienter?

Sie sind Open-Weight und laufen mit 100% Ökostrom in Rechenzentren mit einem PUE von 1,25 und einem WUE von 0,25, deutlich unter den Branchenschnitten von 1,55 und 1,8. Leichtere, quantisierte Modelle und automatisches Routing sorgen dafür, dass jede Anfrage nur so viel Rechenleistung nutzt, wie die Aufgabe wirklich braucht.

Wie wird der Preis berechnet?

Die meisten Modelle werden pro Million Eingabe- und Ausgabe-Tokens berechnet; Sprachmodelle pro Stunde Audio. Die Preise stehen auf jeder Karte und in der API-Dokumentation.

Gesamten Katalog ansehen →

Welche Modelle kommen demnächst?

Neue Open-Weight-Modelle, die in den Katalog aufgenommen werden. Ihre Preise und Benchmark-Werte sind vorläufig und können zum Start abweichen.

Wie rufe ich ein Modell auf?

Über die OpenAI-kompatible API: Base-URL und Schlüssel setzen, dann die Modell-ID übergeben. Ein Schlüssel deckt jedes Modell ab, dazu Embeddings, Reranking, OCR, Sprache, Scraping und Suche.

API-Dokumentation lesen →

Der Unterschied

Ein Schlüssel für jedes Modell.

Starte 14 Tage kostenlos, ohne Kreditkarte. Rufe jedes Modell über eine OpenAI-kompatible API auf, von uns mit 100% Ökostrom gehostet und ab der ersten Anfrage auf geringsten Energieverbrauch getrimmt.

Konto erstellen 14 Tage kostenlos (opens in a new tab) Gesamten Katalog ansehen

Keine Kreditkarte nötig.

100% Ökostrom
PUE 1,25
Open-Weight