Skip to content
Luftaufnahme eines stillen Sees, umgeben von dichtem grünem Wald.

Modelle

Jedes Modell, eine effiziente API

Open-Weight-Modelle für Sprache, Reasoning, Programmieren, Bilder, Embeddings und Spracherkennung, alle von uns mit 100% Ökostrom gehostet und auf Effizienz getrimmt. Ein Katalog, ein Schlüssel, der niedrigste Energieverbrauch, der die Aufgabe noch erledigt.

Der Katalog

Jedes Modell, nach Kategorie

Open-Weight-Modelle laufen mit 100% Ökostrom und führender Effizienz, erreichbar über eine OpenAI-kompatible API und einen einzigen Schlüssel.

Chat & Sprache

Open-Weight-Modelle unter der Marke GreenPT für alltäglichen Chat, Reasoning und Schreiben, abgestimmt auf europäische Sprachen.

  • Google Gemma 4 256K

    gemma4

    Multimodales Reasoning mit langem Kontextfenster für Dokumente und umfangreiche Prompts.

    • Bilder
    • Reasoning
    • Langer Kontext
    Eingabe
    €0,50
    Ausgabe
    €1,50

    pro 1M Tokens

  • GPT-OSS

    green-r

    Fortgeschrittenes Reasoning, Schreiben und multimodales Verständnis, mit den Leitplanken von GreenPT.

    • Reasoning
    • Bilder
    Eingabe
    €0,35
    Ausgabe
    €0,95

    pro 1M Tokens

  • Mistral Small 3.2 24B

    green-l

    Schnelles mehrsprachiges Modell mit niederländischen Grammatik-Leitplanken für europäische Workloads.

    • Mehrsprachig
    • Funktionen
    Eingabe
    €0,25
    Ausgabe
    €0,80

    pro 1M Tokens

Foundation-Modelle

Open-Weight-Foundation-Modelle, die wir selbst hosten, abgestimmt auf den geringsten Energieverbrauch je Aufgabe.

  • Qwen 250K

    qwen3.5-397b-a17b

    Großes Mixture-of-Experts-Modell für Codegenerierung und agentische Aufgaben.

    • Code
    • Agentic
    • Funktionen
    Eingabe
    €0,70
    Ausgabe
    €4,35

    pro 1M Tokens

  • OpenAI 128K

    gpt-oss-120b

    Open-Weight-Modell mit 120B, Bildverständnis und Reasoning über lange Kontexte.

    • Bilder
    • Reasoning
    Eingabe
    €0,20
    Ausgabe
    €0,70

    pro 1M Tokens

  • Mistral 128K

    mistral-small-3.2-24b-instruct-2506

    Effizientes Instruct-Modell mit Function Calling und Bildverständnis.

    • Funktionen
    • Bilder
    Eingabe
    €0,20
    Ausgabe
    €0,40

    pro 1M Tokens

  • Google 40K

    gemma-3-27b-it

    Kompaktes multimodales Modell für allgemeines Reasoning und das Befolgen von Anweisungen.

    • Bilder
    • Reasoning
    Eingabe
    €0,30
    Ausgabe
    €0,60

    pro 1M Tokens

  • Meta 100K

    llama-3.3-70b-instruct

    Mehrsprachiges Instruct-Modell mit 70B für breiten allgemeinen Einsatz.

    • Mehrsprachig
    Eingabe
    €1,10
    Ausgabe
    €1,10

    pro 1M Tokens

  • Mistral 256K

    mistral-medium-3.5-128b

    Reasoning, Programmieren und Bildverständnis auf Spitzenniveau, mit langem Kontextfenster.

    • Reasoning
    • Code
    • Bilder
    Eingabe
    €1,80
    Ausgabe
    €9,00

    pro 1M Tokens

Programmieren

Modelle, die auf Codegenerierung, Vervollständigung und agentische Entwickler-Workflows abgestimmt sind.

  • Qwen 128K

    qwen3-coder-30b-a3b-instruct

    Auf Code spezialisiertes Modell für Generierung und Vervollständigung über mehrere Sprachen.

    • Code
    • Funktionen
    Eingabe
    €0,25
    Ausgabe
    €0,95

    pro 1M Tokens

  • Mistral 200K

    devstral-2-123b-instruct-2512

    Großes Coding-Modell für agentische Softwareaufgaben und Tool-Nutzung.

    • Code
    • Agentic
    • Funktionen
    Eingabe
    €0,50
    Ausgabe
    €2,40

    pro 1M Tokens

Audio & Sprache

Transkription und Sprachverständnis, mehrsprachig und präzise.

  • Mistral 32K

    voxtral-small-24b-2507

    Audiotranskription und Sprachverständnis in einem Modell.

    • Audio
    Eingabe
    €0,20
    Ausgabe
    €0,45

    pro 1M Tokens

  • GreenPT

    green-s

    Aufgezeichnete und Live-Sprache-zu-Text für allgemeine Transkription.

    • Audio
    Aufnahme
    €0,52
    Live
    €0,65

    pro Stunde

  • GreenPT

    green-s-pro

    Höhere Genauigkeit bei der Transkription mit mehrsprachigen Optionen.

    • Audio
    • Mehrsprachig
    Aufnahme
    €0,52
    Live
    €0,78

    pro Stunde

Embeddings & Retrieval

Vektoren und Reranking für semantische Suche und RAG-Pipelines.

  • Qwen3-Embedding-4B

    green-embedding

    Mehrsprachige Embeddings mit bis zu 2560 Dimensionen für semantische Suche und RAG.

    • Embeddings
    • Mehrsprachig
    Preis
    €0,20

    pro 1M Tokens

  • Qwen3-Reranker-4B

    green-rerank

    Ordnet abgerufene Dokumente nach echter Relevanz neu, die letzte Meile der Suche.

    • Reranking
    Preis
    €0,12

    pro 1M Tokens

In Arbeit

Demnächst

Neue Open-Weight-Modelle, die in den Katalog kommen. Preise und Benchmark-Werte sind vorläufig und können zum Start abweichen.

Demnächst

Neue Open-Weight-Modelle, die in den Katalog kommen. Preise und Benchmarks sind vorläufig und können zum Start abweichen.

  • z-ai Neu 1M

    z-ai/glm-5.2

    Hochintelligentes Reasoning-Modell mit einem Kontextfenster von 1M Tokens.

    Intel
    51.1
    Coding
    50.7
    • Funktionen
    • Tool Choice
    • Reasoning
    Eingabe
    $1.50
    Cache
    $0.38
    Ausgabe
    $4.50

    pro 1M Tokens

  • minimax Neu 1M

    minimax/minimax-m3

    Agentisches multimodales Modell mit starker Tool-Nutzung und 1M-Token-Kontext.

    Intel
    44.4
    Coding
    43.4
    Agentic
    89%
    • Funktionen
    • Tool Choice
    • Reasoning
    • Bilder
    Eingabe
    $0.40
    Cache
    $0.10
    Ausgabe
    $2.00

    pro 1M Tokens

  • deepseek Neu 1M

    deepseek/deepseek-v4-pro

    Flaggschiff von DeepSeek für Programmieren und agentische Aufgaben, mit 1M-Token-Kontext.

    Intel
    44.3
    Coding
    47.5
    Agentic
    96%
    • Funktionen
    • Tool Choice
    • Reasoning
    Eingabe
    $1.75
    Cache
    $0.44
    Ausgabe
    $3.50

    pro 1M Tokens

  • moonshotai Neu 256K

    moonshotai/kimi-k2.6

    Agentisches multimodales Modell mit Bildverständnis und 256K-Token-Kontext.

    Intel
    42.8
    Coding
    47.1
    Agentic
    96%
    • Funktionen
    • Tool Choice
    • Reasoning
    • Bilder
    Eingabe
    $1.00
    Cache
    $0.25
    Ausgabe
    $4.00

    pro 1M Tokens

  • moonshotai Neu 256K

    moonshotai/kimi-k2.7-code

    Auf Code ausgerichtete Kimi-Variante mit Bildverständnis und 256K-Token-Kontext.

    Intel
    41.9
    Coding
    45.8
    • Funktionen
    • Tool Choice
    • Reasoning
    • Bilder
    Eingabe
    $1.25
    Cache
    $0.31
    Ausgabe
    $4.50

    pro 1M Tokens

  • deepseek Neu 1M

    deepseek/deepseek-v4-flash

    Günstiges DeepSeek-Modell mit hohem Durchsatz und 1M-Token-Kontext.

    Intel
    40.3
    Coding
    38.7
    Agentic
    95%
    • Funktionen
    • Tool Choice
    • Reasoning
    Eingabe
    $0.15
    Cache
    $0.04
    Ausgabe
    $0.30

    pro 1M Tokens

Modelle, kurz erklärt

Wie wähle ich ein Modell?

Wähle nach Leistung und Budget. Jedes Modell ist Open-Weight und wird von uns gehostet, sodass du das kleinste Modell nimmst, das deine Aufgabe bewältigt, und starke Ergebnisse bei geringstem Energieverbrauch und niedrigsten Kosten erzielst.

Warum sind diese Modelle effizienter?

Sie sind Open-Weight und laufen mit 100% Ökostrom in Rechenzentren mit einem PUE von 1,25 und einem WUE von 0,25, deutlich unter den Branchenschnitten von 1,55 und 1,8. Leichtere, quantisierte Modelle und automatisches Routing sorgen dafür, dass jede Anfrage nur so viel Rechenleistung nutzt, wie die Aufgabe wirklich braucht.

Wie wird der Preis berechnet?

Die meisten Modelle werden pro Million Eingabe- und Ausgabe-Tokens berechnet; Sprachmodelle pro Stunde Audio. Die Preise stehen auf jeder Karte und in der API-Dokumentation.

Gesamten Katalog ansehen →
Welche Modelle kommen demnächst?

Neue Open-Weight-Modelle, die in den Katalog aufgenommen werden. Ihre Preise und Benchmark-Werte sind vorläufig und können zum Start abweichen.

Wie rufe ich ein Modell auf?

Über die OpenAI-kompatible API: Base-URL und Schlüssel setzen, dann die Modell-ID übergeben. Ein Schlüssel deckt jedes Modell ab, dazu Embeddings, Reranking, OCR, Sprache, Scraping und Suche.

API-Dokumentation lesen →

Der Unterschied

Ein Schlüssel für jedes Modell.

Starte 14 Tage kostenlos, ohne Kreditkarte. Rufe jedes Modell über eine OpenAI-kompatible API auf, von uns mit 100% Ökostrom gehostet und ab der ersten Anfrage auf geringsten Energieverbrauch getrimmt.

Keine Kreditkarte nötig.

  • 100% Ökostrom
  • PUE 1,25
  • Open-Weight