Nøkkelfunksjoner (hurtigliste)

To modellvarianter: grok-4-fast-reasoning og grok-4-fast-non-reasoning (kan justeres for dybde kontra hastighet).
Svært stort kontekstvindu: opptil 2 000 000 tokens, noe som muliggjør ekstremt lange dokumenter / flertimers transkripsjoner / arbeidsflyter med flere dokumenter.
Fokus på tokeneffektivitet / kostnader: xAI oppgir ~40 % færre tenketokens i gjennomsnitt sammenlignet med Grok-4 og en påstått ~98 % reduksjon i kostnad for å oppnå samme benchmark-ytelse (på målingene xAI rapporterer).
Innebygd verktøy- / nettleserintegrasjon: trent ende-til-ende med verktøybruks-RL for nett-/X-surfing, kodekjøring og agentiske søkeatferder.
Multimodalitet og funksjonskall: støtter bilder og strukturerte utdata; funksjonskall og strukturerte svarformater støttes i API-et.

Tekniske detaljer

Enhetlig resonneringsarkitektur: Grok-4-Fast bruker én enkelt modellvektbase som kan styres til resonnering (lang chain-of-thought) eller ikke-resonnering (raske svar) gjennom systemprompter eller valg av variant, i stedet for å levere to helt separate ryggradsmodeller. Dette reduserer byttelatens og tokenkostnad for blandede arbeidslaster.

Forsterkningslæring for intelligensdensitet: xAI oppgir å bruke storskala forsterkningslæring med fokus på intelligensdensitet (maksimering av ytelse per token), som er grunnlaget for de oppgitte gevinstene i tokeneffektivitet.

Verktøykondisjonering og agentisk søk: Grok-4-Fast ble trent og evaluert på oppgaver som krever bruk av verktøy (nettsurfing, X-søk, kodekjøring). Modellen presenteres som dyktig til å velge når verktøy skal brukes og hvordan nettbevis skal flettes inn i svar.

Benchmark-ytelse

Forbedringer i BrowseComp (44,9 % pass\@1 vs. 43,0 % for Grok-4), SimpleQA (95,0 % vs. 94,0 %), og store gevinster i enkelte kinesiskspråklige nettlesings-/søkearenaer. xAI rapporterer også en toppplassering i LMArenas Search Arena for en grok-4-fast-search-variant.

Typiske og anbefalte bruksområder

Søk og gjenfinning med høy gjennomstrømming — søkeagenter som trenger rask flerhopp-nettresonnering.
Agentiske assistenter og boter — agenter som kombinerer surfing, kodekjøring og asynkrone verktøykall (der dette er tillatt).
Kostnadssensitive produksjonsutrullinger — tjenester som krever mange kall og ønsker bedre token-til-nytte-økonomi sammenlignet med en tyngre basismodell.
Eksperimentering for utviklere — prototyping av multimodale eller nettforsterkede flyter som er avhengige av raske, gjentatte forespørsler.
Slik får du tilgang til Grok 4 fast API

Trinn 1: Registrer deg for API-nøkkel

Logg inn på cometapi.com. Hvis du ikke er bruker hos oss ennå, må du først registrere deg. Logg inn i din CometAPI-konsoll. Hent tilgangslegitimasjonen, altså API-nøkkelen, for grensesnittet. Klikk på “Add Token” under API-token i det personlige senteret, hent tokennøkkelen: sk-xxxxx og send inn.

Trinn 2: Send forespørsler til Grok 4 fast API

Velg endepunktet “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” for å sende API-forespørselen og angi request body. Forespørselsmetoden og request body hentes fra API-dokumentasjonen på nettstedet vårt. Nettstedet vårt tilbyr også Apifox-testing for enkelhets skyld. Erstatt <YOUR_API_KEY> med din faktiske CometAPI-nøkkel fra kontoen din. base url er Chat format(https://api.cometapi.com/v1/chat/completions).

Sett inn spørsmålet eller forespørselen din i content-feltet — dette er det modellen vil svare på. Behandle API-svaret for å hente det genererte svaret.

Trinn 3: Hent og verifiser resultater

Behandle API-svaret for å hente det genererte svaret. Etter behandling svarer API-et med oppgavestatus og utdata.

Priser for Grok 4 Fast

Utforsk konkurransedyktige priser for Grok 4 Fast, designet for å passe ulike budsjetter og bruksbehov. Våre fleksible planer sikrer at du bare betaler for det du bruker, noe som gjør det enkelt å skalere etter hvert som kravene dine vokser. Oppdag hvordan Grok 4 Fast kan forbedre prosjektene dine samtidig som kostnadene holdes håndterbare.

Komet-pris (USD / M Tokens)	Offisiell pris (USD / M Tokens)	Rabatt
Inndata:$0.16/M Utdata:$0.4/M	Inndata:$0.2/M Utdata:$0.5/M	-20%

Versjoner av Grok 4 Fast

Grunnen til at Grok 4 Fast har flere øyeblikksbilder kan inkludere potensielle faktorer som variasjoner i utdata etter oppdateringer som krever eldre øyeblikksbilder for konsistens, å gi utviklere en overgangsperiode for tilpasning og migrering, og ulike øyeblikksbilder som tilsvarer globale eller regionale endepunkter for å optimalisere brukeropplevelsen. For detaljerte forskjeller mellom versjoner, vennligst se den offisielle dokumentasjonen.

Navn offentliggjort av xAI: grok-4-fast-reasoning og grok-4-fast-non-reasoning. Hver variant oppgir den samme 2M token kontekstgrensen. Plattformen fortsetter også å huse det tidligere Grok-4-flaggskipet (f.eks. grok-4-0709-varianter som ble brukt tidligere).

Nøkkelfunksjoner (hurtigliste)

To modellvarianter: grok-4-fast-reasoning og grok-4-fast-non-reasoning (kan justeres for dybde kontra hastighet).
Svært stort kontekstvindu: opptil 2 000 000 tokens, noe som muliggjør ekstremt lange dokumenter / flertimers transkripsjoner / arbeidsflyter med flere dokumenter.
Fokus på tokeneffektivitet / kostnader: xAI oppgir ~40 % færre tenketokens i gjennomsnitt sammenlignet med Grok-4 og en påstått ~98 % reduksjon i kostnad for å oppnå samme benchmark-ytelse (på målingene xAI rapporterer).
Innebygd verktøy- / nettleserintegrasjon: trent ende-til-ende med verktøybruks-RL for nett-/X-surfing, kodekjøring og agentiske søkeatferder.
Multimodalitet og funksjonskall: støtter bilder og strukturerte utdata; funksjonskall og strukturerte svarformater støttes i API-et.

Tekniske detaljer

Benchmark-ytelse

Typiske og anbefalte bruksområder

Søk og gjenfinning med høy gjennomstrømming — søkeagenter som trenger rask flerhopp-nettresonnering.
Agentiske assistenter og boter — agenter som kombinerer surfing, kodekjøring og asynkrone verktøykall (der dette er tillatt).
Kostnadssensitive produksjonsutrullinger — tjenester som krever mange kall og ønsker bedre token-til-nytte-økonomi sammenlignet med en tyngre basismodell.
Eksperimentering for utviklere — prototyping av multimodale eller nettforsterkede flyter som er avhengige av raske, gjentatte forespørsler.
Slik får du tilgang til Grok 4 fast API

Trinn 1: Registrer deg for API-nøkkel

Trinn 2: Send forespørsler til Grok 4 fast API

Sett inn spørsmålet eller forespørselen din i content-feltet — dette er det modellen vil svare på. Behandle API-svaret for å hente det genererte svaret.

Trinn 3: Hent og verifiser resultater

Behandle API-svaret for å hente det genererte svaret. Etter behandling svarer API-et med oppgavestatus og utdata.

Grok 4 Fast

Flere modeller

Claude Opus 4.7

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Grok 4.20

Qwen3.6-Plus

Relaterte blogger

Hvordan bruke z-image til å lage NSFW-innhold? Den beste guiden du trenger

Grok 4.1 raskt API