Hauptfunktionen (Kurzliste)

Zwei Modellvarianten: grok-4-fast-reasoning und grok-4-fast-non-reasoning (für Tiefe bzw. Geschwindigkeit abstimmbar).
Sehr großes Kontextfenster: bis zu 2.000.000 Token, wodurch extrem lange Dokumente / mehrstündige Transkripte / Multi-Dokument-Workflows ermöglicht werden.
Fokus auf Token-Effizienz / Kosten: xAI berichtet im Vergleich zu Grok-4 durchschnittlich über ~40 % weniger Thinking-Token sowie eine behauptete ~98%ige Kostenreduktion bei gleicher Benchmark-Leistung (gemäß den von xAI berichteten Metriken).
Native Tool- / Browsing-Integration: Ende-zu-Ende mit Tool-Use-RL für Web-/X-Browsing, Codeausführung und agentische Suchverhalten trainiert.
Multimodalität & Function Calling: unterstützt Bilder und strukturierte Ausgaben; Function Calling und strukturierte Antwortformate werden in der API unterstützt.

Technische Details

Einheitliche Reasoning-Architektur: Grok-4-Fast verwendet eine einheitliche Modell-Gewichtsbasis, die über System-Prompts oder Variantenauswahl auf Reasoning (lange Chain-of-Thought) oder Non-Reasoning (schnelle Antworten) gesteuert werden kann, anstatt zwei vollständig separate Backbone-Modelle bereitzustellen. Dies reduziert Umschaltlatenz und Token-Kosten bei gemischten Workloads.

Reinforcement Learning für Intelligenzdichte: xAI berichtet von großskaligem Reinforcement Learning mit Fokus auf Intelligenzdichte (Maximierung der Leistung pro Token), was die Grundlage für die angegebenen Gewinne bei der Token-Effizienz bildet.

Tool-Konditionierung und agentische Suche: Grok-4-Fast wurde für Aufgaben trainiert und evaluiert, die den Aufruf von Tools erfordern (Web-Browsing, X-Suche, Codeausführung). Das Modell wird als besonders geeignet dargestellt, zu entscheiden, wann Tools aufgerufen werden sollten und wie Browsing-Belege in Antworten integriert werden.

Benchmark-Leistung

Verbesserungen bei BrowseComp (44,9 % pass\@1 vs. 43,0 % für Grok-4), SimpleQA (95,0 % vs. 94,0 %) sowie große Fortschritte in bestimmten chinesischsprachigen Browsing-/Suchbereichen. xAI berichtet außerdem über einen Spitzenplatz in LMArenas Search Arena für eine grok-4-fast-search-Variante.

Typische und empfohlene Anwendungsfälle

Suche und Retrieval mit hohem Durchsatz — Suchagenten, die schnelles mehrstufiges Web-Reasoning benötigen.
Agentische Assistenten & Bots — Agenten, die Browsing, Codeausführung und asynchrone Tool-Aufrufe kombinieren (sofern erlaubt).
Kostensensitive Produktions-Deployments — Services, die viele Aufrufe benötigen und eine bessere Token-zu-Nutzen-Ökonomie im Vergleich zu einem schwereren Basismodell anstreben.
Experimentieren für Entwickler — Prototyping multimodaler oder webgestützter Abläufe, die auf schnelle, wiederholte Anfragen angewiesen sind.
Zugriff auf die Grok 4 Fast API

Schritt 1: Für einen API-Schlüssel registrieren

Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer bei uns sind, registrieren Sie sich bitte zuerst. Melden Sie sich in Ihrer CometAPI-Konsole an. Holen Sie sich den API-Schlüssel als Zugriffsdaten für die Schnittstelle. Klicken Sie im persönlichen Bereich beim API-Token auf „Add Token“, erhalten Sie den Token-Schlüssel: sk-xxxxx und senden Sie ihn ab.

Schritt 2: Anfragen an die Grok 4 Fast API senden

Wählen Sie den Endpunkt „\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\“ aus, um die API-Anfrage zu senden, und legen Sie den Request-Body fest. Die Request-Methode und den Request-Body finden Sie in der API-Dokumentation auf unserer Website. Unsere Website bietet zu Ihrer Bequemlichkeit auch Apifox-Tests an. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto. Die Base-URL hat das Chat-Format(https://api.cometapi.com/v1/chat/completions).

Fügen Sie Ihre Frage oder Anfrage in das Feld „content“ ein — darauf wird das Modell antworten. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.

Schritt 3: Ergebnisse abrufen und überprüfen

Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten. Nach der Verarbeitung antwortet die API mit dem Aufgabenstatus und den Ausgabedaten.

Preise für Grok 4 Fast

Entdecken Sie wettbewerbsfähige Preise für Grok 4 Fast, die für verschiedene Budgets und Nutzungsanforderungen konzipiert sind. Unsere flexiblen Tarife stellen sicher, dass Sie nur für das bezahlen, was Sie nutzen, und erleichtern die Skalierung entsprechend Ihren wachsenden Anforderungen. Erfahren Sie, wie Grok 4 Fast Ihre Projekte verbessern kann, während die Kosten überschaubar bleiben.

Comet-Preis (USD / M Tokens)	Offizieller Preis (USD / M Tokens)	Rabatt
Eingabe:$0.16/M Ausgabe:$0.4/M	Eingabe:$0.2/M Ausgabe:$0.5/M	-20%

Versionen von Grok 4 Fast

Der Grund, warum Grok 4 Fast mehrere Snapshots hat, kann potenzielle Faktoren wie Änderungen der Ausgabe nach Updates umfassen, die ältere Snapshots für Konsistenz erfordern, Entwicklern eine Übergangszeit für Anpassung und Migration bieten und verschiedene Snapshots, die globalen oder regionalen Endpunkten entsprechen, um das Benutzererlebnis zu optimieren. Für detaillierte Unterschiede zwischen den Versionen lesen Sie bitte die offizielle Dokumentation.

Von xAI angekündigte öffentliche Namen: grok-4-fast-reasoning und grok-4-fast-non-reasoning. Jede Variante weist dasselbe Kontextlimit von 2M Token auf. Die Plattform hostet außerdem weiterhin das frühere Grok-4-Flaggschiff (z. B. die zuvor verwendeten Varianten grok-4-0709).

Hauptfunktionen (Kurzliste)

Zwei Modellvarianten: grok-4-fast-reasoning und grok-4-fast-non-reasoning (für Tiefe bzw. Geschwindigkeit abstimmbar).
Sehr großes Kontextfenster: bis zu 2.000.000 Token, wodurch extrem lange Dokumente / mehrstündige Transkripte / Multi-Dokument-Workflows ermöglicht werden.
Fokus auf Token-Effizienz / Kosten: xAI berichtet im Vergleich zu Grok-4 durchschnittlich über ~40 % weniger Thinking-Token sowie eine behauptete ~98%ige Kostenreduktion bei gleicher Benchmark-Leistung (gemäß den von xAI berichteten Metriken).
Native Tool- / Browsing-Integration: Ende-zu-Ende mit Tool-Use-RL für Web-/X-Browsing, Codeausführung und agentische Suchverhalten trainiert.
Multimodalität & Function Calling: unterstützt Bilder und strukturierte Ausgaben; Function Calling und strukturierte Antwortformate werden in der API unterstützt.

Technische Details

Benchmark-Leistung

Typische und empfohlene Anwendungsfälle

Suche und Retrieval mit hohem Durchsatz — Suchagenten, die schnelles mehrstufiges Web-Reasoning benötigen.
Agentische Assistenten & Bots — Agenten, die Browsing, Codeausführung und asynchrone Tool-Aufrufe kombinieren (sofern erlaubt).
Kostensensitive Produktions-Deployments — Services, die viele Aufrufe benötigen und eine bessere Token-zu-Nutzen-Ökonomie im Vergleich zu einem schwereren Basismodell anstreben.
Experimentieren für Entwickler — Prototyping multimodaler oder webgestützter Abläufe, die auf schnelle, wiederholte Anfragen angewiesen sind.
Zugriff auf die Grok 4 Fast API

Schritt 1: Für einen API-Schlüssel registrieren

Schritt 2: Anfragen an die Grok 4 Fast API senden

Fügen Sie Ihre Frage oder Anfrage in das Feld „content“ ein — darauf wird das Modell antworten. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.

Schritt 3: Ergebnisse abrufen und überprüfen

Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten. Nach der Verarbeitung antwortet die API mit dem Aufgabenstatus und den Ausgabedaten.

Grok 4 Fast

Weitere Modelle

Claude Opus 4.7

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Grok 4.20

Qwen3.6-Plus

Verwandte Blogs

So verwenden Sie z-image, um NSFW-Inhalte zu erstellen? Der beste Leitfaden, den Sie brauchen.

Grok 4.1 Fast API