Nøglefunktioner (hurtig liste)

To modelvarianter: grok-4-fast-reasoning og grok-4-fast-non-reasoning (kan afstemmes efter dybde vs. hastighed).
Meget stort kontekstvindue: op til 2,000,000 tokens, muliggør ekstremt lange dokumenter / transskripter over flere timer / arbejdsgange på tværs af flere dokumenter.
Token-effektivitet / omkostningsfokus: xAI rapporterer ~40% færre 'thinking tokens' i gennemsnit sammenlignet med Grok-4 og en påstået ~98% reduktion i omkostninger for at opnå samme benchmark-ydeevne (på de metrikker xAI rapporterer).
Native værktøjs-/browserintegration: trænet end-to-end med RL for værktøjsbrug til web/X-browsing, kodeeksekvering og agentiske søgeadfærd.
Multimodal og function calling: understøtter billeder og strukturerede outputs; function calling og strukturerede svarformater understøttes i API'et.

Tekniske detaljer

Forenet ræsonnementsarkitektur: Grok-4-Fast bruger en single model weightbase, som kan styres ind i reasoning (lang chain-of-thought) eller non-reasoning (hurtige svar) via systemprompter eller variantvalg, i stedet for at levere to helt separate backbone-modeller. Dette reducerer skiftelatens og tokenomkostninger for blandede arbejdsbelastninger.

Reinforcement learning for intelligence density: xAI rapporterer brug af large-scale reinforcement learning med fokus på intelligence density (maksimering af ydelse pr. token), hvilket er grundlaget for de angivne forbedringer i token-effektivitet.

Tool conditioning og agentisk søgning: Grok-4-Fast blev trænet og evalueret på opgaver, der kræver brug af værktøjer (webbrowsing, X-søgning, kodeeksekvering). Modellen beskrives som dygtig til at vælge, hvornår den skal kalde værktøjer, og hvordan den integrerer browsing-beviser i svar.

Benchmark-ydeevne

Forbedringer i BrowseComp (44.9% pass\@1 vs 43.0% for Grok-4), SimpleQA (95.0% vs 94.0%), og store gevinster i visse kinesisk-sprogede browsing-/søgningsarenaer. xAI rapporterer også en topplacering i LMArena’s Search Arena for en grok-4-fast-search-variant.

Typiske og anbefalede anvendelser

Høj-throughput søgning og hentning — søgeagenter, der har brug for hurtig multi-hop web-ræsonnering.
Agentiske assistenter og bots — agenter, der kombinerer browsing, kodeeksekvering og asynkrone værktøjskald (hvor tilladt).
Omkostningsfølsomme produktionsudrulninger — tjenester, der kræver mange kald og ønsker forbedret token-til-nytte-økonomi sammenlignet med en tungere basismodel.
Udvikler-eksperimenter — prototypning af multimodale eller web-forstærkede flows, der bygger på hurtige, gentagne forespørgsler.
Sådan får du adgang til Grok 4 fast API

Trin 1: Tilmeld dig for API-nøgle

Log ind på cometapi.com. Hvis du endnu ikke er vores bruger, skal du først registrere dig. Log ind i din CometAPI-konsol. Hent adgangslegitimations-API-nøglen til interfacet. Klik på “Add Token” ved API-tokenet i det personlige center, få token-nøglen: sk-xxxxx og indsend.

Trin 2: Send forespørgsler til Grok 4 fast API

Vælg “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\”-endepunktet for at sende API-anmodningen og angive anmodningsbody. Anmodningsmetoden og anmodningsbody fås fra vores websteds API-dokumentation. Vores websted tilbyder også Apifox-test for din bekvemmelighed. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. base url er Chat format(https://api.cometapi.com/v1/chat/completions).

Indsæt dit spørgsmål eller din anmodning i content-feltet—det er dette, modellen vil svare på . Behandl API-svaret for at få det genererede svar.

Trin 3: Hent og verificer resultater

Behandl API-svaret for at få det genererede svar. Efter behandlingen svarer API'et med opgavestatus og outputdata.

Priser for Grok 4 Fast

Udforsk konkurrencedygtige priser for Grok 4 Fast, designet til at passe til forskellige budgetter og brugsbehov. Vores fleksible planer sikrer, at du kun betaler for det, du bruger, hvilket gør det nemt at skalere, efterhånden som dine krav vokser. Opdag hvordan Grok 4 Fast kan forbedre dine projekter, mens omkostningerne holdes håndterbare.

Comet-pris (USD / M Tokens)	Officiel Pris (USD / M Tokens)	Rabat
Indtast:$0.16/M Output:$0.4/M	Indtast:$0.2/M Output:$0.5/M	-20%

Versioner af Grok 4 Fast

Årsagen til, at Grok 4 Fast har flere øjebliksbilleder kan omfatte potentielle faktorer såsom variationer i output efter opdateringer, der kræver ældre øjebliksbilleder for konsistens, at give udviklere en overgangsperiode til tilpasning og migration, og at forskellige øjebliksbilleder svarer til globale eller regionale slutpunkter for at optimere brugeroplevelsen. For detaljerede forskelle mellem versioner, henvises der til den officielle dokumentation.

Navne offentliggjort af xAI: grok-4-fast-reasoning og grok-4-fast-non-reasoning. Hver variant angiver den samme 2M token kontekstgrænse. Platformen hoster også fortsat det tidligere Grok-4 flagskib (f.eks. grok-4-0709 varianter, der blev brugt tidligere).

Nøglefunktioner (hurtig liste)

To modelvarianter: grok-4-fast-reasoning og grok-4-fast-non-reasoning (kan afstemmes efter dybde vs. hastighed).
Meget stort kontekstvindue: op til 2,000,000 tokens, muliggør ekstremt lange dokumenter / transskripter over flere timer / arbejdsgange på tværs af flere dokumenter.
Token-effektivitet / omkostningsfokus: xAI rapporterer ~40% færre 'thinking tokens' i gennemsnit sammenlignet med Grok-4 og en påstået ~98% reduktion i omkostninger for at opnå samme benchmark-ydeevne (på de metrikker xAI rapporterer).
Native værktøjs-/browserintegration: trænet end-to-end med RL for værktøjsbrug til web/X-browsing, kodeeksekvering og agentiske søgeadfærd.
Multimodal og function calling: understøtter billeder og strukturerede outputs; function calling og strukturerede svarformater understøttes i API'et.

Tekniske detaljer

Benchmark-ydeevne

Typiske og anbefalede anvendelser

Høj-throughput søgning og hentning — søgeagenter, der har brug for hurtig multi-hop web-ræsonnering.
Agentiske assistenter og bots — agenter, der kombinerer browsing, kodeeksekvering og asynkrone værktøjskald (hvor tilladt).
Omkostningsfølsomme produktionsudrulninger — tjenester, der kræver mange kald og ønsker forbedret token-til-nytte-økonomi sammenlignet med en tungere basismodel.
Udvikler-eksperimenter — prototypning af multimodale eller web-forstærkede flows, der bygger på hurtige, gentagne forespørgsler.
Sådan får du adgang til Grok 4 fast API

Trin 1: Tilmeld dig for API-nøgle

Trin 2: Send forespørgsler til Grok 4 fast API

Indsæt dit spørgsmål eller din anmodning i content-feltet—det er dette, modellen vil svare på . Behandl API-svaret for at få det genererede svar.

Trin 3: Hent og verificer resultater

Behandl API-svaret for at få det genererede svar. Efter behandlingen svarer API'et med opgavestatus og outputdata.

Grok 4 Fast

Flere modeller

Claude Opus 4.7

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Grok 4.20

Qwen3.6-Plus

Relaterede blogs

I can’t help with creating or guiding NSFW content. If you’d like, I can show you how to use z-image for safe, non-NSFW images—prompt structure, styles, negative prompts, seeds, resolution, and safety settings—or point you to its official guidelines and features.

Grok 4.1 hurtig API