ModellePreiseUnternehmen
500+ KI-Modell-APIs, Alles in einer API. Nur bei CometAPI
Modelle-API
Entwickler
SchnellstartDokumentationAPI Dashboard
Unternehmen
Über unsUnternehmen
Ressourcen
KI-ModelleBlogÄnderungsprotokollSupport
NutzungsbedingungenDatenschutzrichtlinie
© 2026 CometAPI · All rights reserved
Home/Models/xAI/Grok 4 Fast
X

Grok 4 Fast

Eingabe:$0.16/M
Ausgabe:$0.4/M
Kontext:2M
Maximale Ausgabe:30K
Grok 4 Fast ist ein neues von xAI veröffentlichtes KI-Modell, das Inferenz- und Nicht-Inferenz-Fähigkeiten in einer einheitlichen Architektur vereint. Dieses Modell verfügt über ein Kontextfenster von 2 Millionen Token und ist für Anwendungen mit hohem Durchsatz wie Suche und Programmierung ausgelegt. Das Modell bietet zwei Versionen: Grok-4-Fast-Reasoning und Grok-4-Fast-Non-Reasoning, die für unterschiedliche Aufgaben optimiert sind.
Neu
Kommerzielle Nutzung
Playground
Überblick
Funktionen
Preisgestaltung
API
Versionen

Hauptfunktionen (Kurzliste)

  • Zwei Modellvarianten: grok-4-fast-reasoning und grok-4-fast-non-reasoning (für Tiefe bzw. Geschwindigkeit abstimmbar).
  • Sehr großes Kontextfenster: bis zu 2.000.000 Token, wodurch extrem lange Dokumente / mehrstündige Transkripte / Multi-Dokument-Workflows ermöglicht werden.
  • Fokus auf Token-Effizienz / Kosten: xAI berichtet im Vergleich zu Grok-4 durchschnittlich über ~40 % weniger Thinking-Token sowie eine behauptete ~98%ige Kostenreduktion bei gleicher Benchmark-Leistung (gemäß den von xAI berichteten Metriken).
  • Native Tool- / Browsing-Integration: Ende-zu-Ende mit Tool-Use-RL für Web-/X-Browsing, Codeausführung und agentische Suchverhalten trainiert.
  • Multimodalität & Function Calling: unterstützt Bilder und strukturierte Ausgaben; Function Calling und strukturierte Antwortformate werden in der API unterstützt.

Technische Details

Einheitliche Reasoning-Architektur: Grok-4-Fast verwendet eine einheitliche Modell-Gewichtsbasis, die über System-Prompts oder Variantenauswahl auf Reasoning (lange Chain-of-Thought) oder Non-Reasoning (schnelle Antworten) gesteuert werden kann, anstatt zwei vollständig separate Backbone-Modelle bereitzustellen. Dies reduziert Umschaltlatenz und Token-Kosten bei gemischten Workloads.

Reinforcement Learning für Intelligenzdichte: xAI berichtet von großskaligem Reinforcement Learning mit Fokus auf Intelligenzdichte (Maximierung der Leistung pro Token), was die Grundlage für die angegebenen Gewinne bei der Token-Effizienz bildet.

Tool-Konditionierung und agentische Suche: Grok-4-Fast wurde für Aufgaben trainiert und evaluiert, die den Aufruf von Tools erfordern (Web-Browsing, X-Suche, Codeausführung). Das Modell wird als besonders geeignet dargestellt, zu entscheiden, wann Tools aufgerufen werden sollten und wie Browsing-Belege in Antworten integriert werden.

Benchmark-Leistung

Verbesserungen bei BrowseComp (44,9 % pass\@1 vs. 43,0 % für Grok-4), SimpleQA (95,0 % vs. 94,0 %) sowie große Fortschritte in bestimmten chinesischsprachigen Browsing-/Suchbereichen. xAI berichtet außerdem über einen Spitzenplatz in LMArenas Search Arena für eine grok-4-fast-search-Variante.

Typische und empfohlene Anwendungsfälle

  • Suche und Retrieval mit hohem Durchsatz — Suchagenten, die schnelles mehrstufiges Web-Reasoning benötigen.
  • Agentische Assistenten & Bots — Agenten, die Browsing, Codeausführung und asynchrone Tool-Aufrufe kombinieren (sofern erlaubt).
  • Kostensensitive Produktions-Deployments — Services, die viele Aufrufe benötigen und eine bessere Token-zu-Nutzen-Ökonomie im Vergleich zu einem schwereren Basismodell anstreben.
  • Experimentieren für Entwickler — Prototyping multimodaler oder webgestützter Abläufe, die auf schnelle, wiederholte Anfragen angewiesen sind.
  • Zugriff auf die Grok 4 Fast API

Schritt 1: Für einen API-Schlüssel registrieren

Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer bei uns sind, registrieren Sie sich bitte zuerst. Melden Sie sich in Ihrer CometAPI-Konsole an. Holen Sie sich den API-Schlüssel als Zugriffsdaten für die Schnittstelle. Klicken Sie im persönlichen Bereich beim API-Token auf „Add Token“, erhalten Sie den Token-Schlüssel: sk-xxxxx und senden Sie ihn ab.

Schritt 2: Anfragen an die Grok 4 Fast API senden

Wählen Sie den Endpunkt „\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\“ aus, um die API-Anfrage zu senden, und legen Sie den Request-Body fest. Die Request-Methode und den Request-Body finden Sie in der API-Dokumentation auf unserer Website. Unsere Website bietet zu Ihrer Bequemlichkeit auch Apifox-Tests an. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto. Die Base-URL hat das Chat-Format(https://api.cometapi.com/v1/chat/completions).

Fügen Sie Ihre Frage oder Anfrage in das Feld „content“ ein — darauf wird das Modell antworten. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.

Schritt 3: Ergebnisse abrufen und überprüfen

Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten. Nach der Verarbeitung antwortet die API mit dem Aufgabenstatus und den Ausgabedaten.

Funktionen für Grok 4 Fast

Entdecken Sie die wichtigsten Funktionen von Grok 4 Fast, die darauf ausgelegt sind, Leistung und Benutzerfreundlichkeit zu verbessern. Erfahren Sie, wie diese Fähigkeiten Ihren Projekten zugutekommen und die Benutzererfahrung verbessern können.

Preise für Grok 4 Fast

Entdecken Sie wettbewerbsfähige Preise für Grok 4 Fast, die für verschiedene Budgets und Nutzungsanforderungen konzipiert sind. Unsere flexiblen Tarife stellen sicher, dass Sie nur für das bezahlen, was Sie nutzen, und erleichtern die Skalierung entsprechend Ihren wachsenden Anforderungen. Erfahren Sie, wie Grok 4 Fast Ihre Projekte verbessern kann, während die Kosten überschaubar bleiben.
Comet-Preis (USD / M Tokens)Offizieller Preis (USD / M Tokens)Rabatt
Eingabe:$0.16/M
Ausgabe:$0.4/M
Eingabe:$0.2/M
Ausgabe:$0.5/M
-20%

Beispielcode und API für Grok 4 Fast

Greifen Sie auf umfassende Beispielcodes und API-Ressourcen für Grok 4 Fast zu, um Ihren Integrationsprozess zu optimieren. Unsere detaillierte Dokumentation bietet schrittweise Anleitungen und hilft Ihnen dabei, das volle Potenzial von Grok 4 Fast in Ihren Projekten zu nutzen.
POST
/v1/chat/completions

Versionen von Grok 4 Fast

Der Grund, warum Grok 4 Fast mehrere Snapshots hat, kann potenzielle Faktoren wie Änderungen der Ausgabe nach Updates umfassen, die ältere Snapshots für Konsistenz erfordern, Entwicklern eine Übergangszeit für Anpassung und Migration bieten und verschiedene Snapshots, die globalen oder regionalen Endpunkten entsprechen, um das Benutzererlebnis zu optimieren. Für detaillierte Unterschiede zwischen den Versionen lesen Sie bitte die offizielle Dokumentation.

Von xAI angekündigte öffentliche Namen: grok-4-fast-reasoning und grok-4-fast-non-reasoning. Jede Variante weist dasselbe Kontextlimit von 2M Token auf. Die Plattform hostet außerdem weiterhin das frühere Grok-4-Flaggschiff (z. B. die zuvor verwendeten Varianten grok-4-0709).

Weitere Modelle

C

Claude Opus 4.7

Eingabe:$3/M
Ausgabe:$15/M
Das intelligenteste Modell für Agenten und Programmierung
A

Claude Sonnet 4.6

Eingabe:$2.4/M
Ausgabe:$12/M
Claude Sonnet 4.6 ist unser bisher leistungsfähigstes Sonnet-Modell. Es ist ein umfassendes Upgrade der Fähigkeiten des Modells in den Bereichen Programmierung, Computernutzung, Schlussfolgern mit langem Kontext, Agentenplanung, Wissensarbeit und Design. Sonnet 4.6 bietet außerdem ein 1M-Token-Kontextfenster in Beta.
O

GPT-5.4 nano

Eingabe:$0.16/M
Ausgabe:$1/M
GPT-5.4 nano ist für Aufgaben konzipiert, bei denen Geschwindigkeit und Kosten am wichtigsten sind, wie Klassifizierung, Datenextraktion, Ranking und Sub-Agenten.
O

GPT-5.4 mini

Eingabe:$0.6/M
Ausgabe:$3.6/M
GPT-5.4 mini bringt die Stärken von GPT-5.4 in ein schnelleres, effizienteres Modell, das für hochvolumige Workloads konzipiert ist.
X

Grok 4.20

Eingabe:$1.6/M
Ausgabe:$4.8/M
Das Release Grok 4.20 führt eine Multi-Agenten-Architektur (mehrere spezialisierte Agenten, die in Echtzeit koordiniert werden), erweiterte Kontextmodi sowie gezielte Verbesserungen beim Befolgen von Anweisungen, bei der Reduzierung von Halluzinationen und bei strukturierten/werkzeuggestützten Ausgaben ein.
Q

Qwen3.6-Plus

Eingabe:$0.32/M
Ausgabe:$1.92/M
Qwen 3.6-Plus ist jetzt verfügbar und bietet erweiterte Fähigkeiten für die Codeentwicklung sowie eine verbesserte Effizienz bei multimodaler Erkennung und Inferenz, wodurch das Erlebnis mit Vibe Coding noch besser wird.

Verwandte Blogs

So verwenden Sie z-image, um NSFW-Inhalte zu erstellen? Der beste Leitfaden, den Sie brauchen.
Jan 7, 2026

So verwenden Sie z-image, um NSFW-Inhalte zu erstellen? Der beste Leitfaden, den Sie brauchen.

Alibabas Tongyi Lab hat Z-Image offiziell veröffentlicht, ein Open-Source-Bildgenerierungsmodell mit 6 Milliarden Parametern, das die KI-Community derzeit im Sturm erobert. Ende 2025 veröffentlicht, hat Z-Image in den Augen vieler lokaler Nutzer frühere Favoriten wie Flux und SDXL schnell entthront.
Grok 4.1 Fast API
Nov 19, 2025
grok-4-1-fast
x-ai

Grok 4.1 Fast API

Grok 4.1 Fast ist das produktionsorientierte Großmodell von xAI, optimiert für agentengesteuerte Tool-Aufrufe, Workflows mit langen Kontexten und Inferenz mit geringer Latenz. Es handelt sich um eine multimodale Familie mit zwei Varianten, die für den Betrieb autonomer Agenten entwickelt wurde, welche extrem große Kontexte (bis zu 2 Millionen Token) durchsuchen, Code ausführen, Dienste aufrufen und Schlussfolgerungen ziehen.