Lansering av Grok 4 Fast API: 98 % billigere å kjøre, bygget for høykapasitetssøk

xAI annonsert Grok 4 Fast, en kostnadsoptimalisert variant av Grok-familien som selskapet sier leverer nesten flaggskip-benchmark-ytelse, samtidig som den kutter prisen for å oppnå den ytelsen ved å 98% sammenlignet med Grok 4. Den nye modellen er designet for høy gjennomstrømningssøk og bruk av agentverktøy, og inkluderer et kontekstvindu med 2 millioner token og separate "resonnerings"- og "ikke-resonnerings"-varianter slik at utviklere kan finjustere databehandlingen til sine behov.

Kjernefunksjoner og fordeler

Kostnadseffektiv inferensmodell: Grok 4 Fast er bygget fra Grok 4-familien med fokus på tokeneffektivitet og verktøybruk i sanntid. xAI rapporterer at modellen krever omtrent 40 % færre «tenke»-poletter i gjennomsnitt. Kunstig analyse – som sporer latens, utgangshastighet og pris/ytelse på tvers av mange offentlige modeller – plasserer Grok 4 Fast høyt på sine intelligens- kontra kostnadsgrenser og bekrefter modellens raske utgangshastigheter og gunstige kostnadsforhold i tidlige tester.

Grok 4 Fast

Store kontekstvinduer: Grok 4 Fast er designet for høy gjennomstrømningssøk og bruk av agentverktøy, og inkluderer et kontekstvindu med 2 millioner token og separate "resonnerings"- og "ikke-resonnerings"-varianter slik at utviklere kan finjustere databehandlingen til sine behov.

Innebygde verktøybruksmuligheter: Grok 4 Fast tilbyr «banebrytende nett- og X-søkemuligheter» som forbedrer henting, navigering og syntese av nettinnhold under agentiske arbeidsflyter – og posisjonerer Grok 4 Fast som et praktisk søkeverktøy for applikasjoner som krever sanntids informasjonsinnsamling og resonnement på tvers av lange dokumenter. Ledende ytelse på flere søkebenchmarks, inkludert:

BrowseComp (zh): 51.2 % (vs. Grok 4s 45.0 %)
X Bench Deepsearch (zh): 74.0 % (vs. Grok 4s 66.0 %)

Unified Architecture: Den samme modellen støtter både inferens- og ikke-inferensmoduser, noe som eliminerer behovet for separat modellbytte. Redusert ventetid og kostnad gjør den egnet for sanntidsapplikasjoner (som søk, spørsmålssvar og forskningsassistanse).

Ytelsessammenligning (viktigste referansepunkter)

I privat LMArena-testing som xAI delte, grok-4-fast-search (kodenavn menlo)-varianten topper søkearenaen med en Elo-vurdering på 1,163, mens tekstvarianten (tahoe) ligger blant de ti beste i Text Arena – resultater xAI bruker for å støtte påstandene sine om søkeytelse.

Grok 4 Rask samsvar med eller tett bak Grok 4 på flere grenseverdier (for eksempel: GPQA Diamond, AIME 2025 og HMMT 2025), samtidig som den overgår tidligere mindre modeller på resonneringsoppgaver – bevis xAI bruker for å rettferdiggjøre påstanden om «sammenlignbar ytelse».

Lansering av Grok 4 Fast API: 98 % billigere å kjøre, bygget for høykapasitetssøk

Sammenlign resultater

Sammenlignet med Grok 4: Billigere og mindre beregningskrevende, men med lignende ytelse.

Sammenlignet med Grok 3 Mini: Kraftigere, i stand til kompleks resonnering og søk i sanntid.

Sammenlignet med GPT-5/Gemini/Claude: Takket være den ekstremt høye tokeneffektiviteten og verktøykapasiteten, er den ledende innen kostnadseffektivitet og noen søkeoppgaver.

Priser og tilgjengelighet

Kontekst og tokens: To modellsmaker: grok-4-fast-reasoning og grok-4-fast-non-reasoning, hver med 2M kontekst.

Publiserte (liste) priser i lanseringsinnlegget (eksempelnivåer):

Inndata-tokens: $0.20 / 1 million (<128k) — $0.40 / 1 million (≥128k)
Utdata-tokens: $0.50 / 1 million (<128k) — $1.00 / 1 million (≥128k)
Bufrede inndatatokener: $0.05 / 1 million.
(Se xAI-kunngjøringen for nøyaktige faktureringsregler og eventuelle tidsbegrensede kampanjer.)

Leverandørtilgjengelighet: xAI lister opp kortsiktig gratis tilgjengelighet via OpenRouter og Vercel AI Gateway og generell tilgjengelighet via xAIs API.

Hva det betyr for brukere og team

Store kostnadsbesparelser for produksjonsbruk – kombinasjonen av lavere priser per token og færre «tenke»-tokener betyr at team kan kjøre flere spørringer eller arbeidsflyter i større kontekst til en liten brøkdel av kostnaden for Grok 4, noe som reduserer barrierene for eksperimentering og skalerte distribusjoner betydelig. (Påstand støttet av xAI-kostnads-/ytelsesopplysninger og tredjeparts kostnadsanalyser.)
Fungerer med svært lange dokumenter og flertrinns resonnement – 2 millioner tokener gjør det praktisk å innta hele bøker, store kodebaser eller lange juridiske/tekniske dossierer i én økt, noe som forbedrer nøyaktighet og sammenheng for oppgaver som krever langsiktig kontekst (dokumentsøk, oppsummering, generering av langformatkode, forskningsassistenter).
Raskere utganger med lavere latens for interaktive applikasjoner – som en «rask» variant er den konstruert for raskere token-gjennomstrømning og lavere latens, noe som er fordelaktig for chat-grensesnitt, kodeassistenter og agentløkker i sanntid der respons er viktig. (Kunstig analyse og leverandørbenchmarks vektlegger utdatahastighet som en differensierende faktor.)
God pris/ytelse for benchmarkede resonneringsoppgaver – for team som bedømmer modeller etter akademiske referansepunkter i frontlinjen, tilbyr Grok 4 Fast et sterkt kompromiss: nøyaktighet nær grensen til dramatisk lavere kostnad, noe som gjør det attraktivt for forskningslaboratorier og selskaper som ofte kjører dyre referansepakker.

Konklusjon:

Grok 4 Fast posisjonerer xAI til å konkurrere på pris-ytelse og for søkesentrerte agentapplikasjoner. Hvis selskapets påstander om effektivitet og verifisering holder mål i uavhengige, domenespesifikke tester, kan Grok 4 Fast omforme kostnadsforventningene for verktøyaktiverte LLM-distribusjoner med høy kapasitet – spesielt for applikasjoner som er avhengige av live web-henting og flertrinns verktøybruk.

Komme i gang

CometAPI er en enhetlig API-plattform som samler over 500 AI-modeller fra ledende leverandører – som OpenAIs GPT-serie, Googles Gemini, Anthropics Claude, Midjourney, Suno og flere – i ett enkelt, utviklervennlig grensesnitt. Ved å tilby konsistent autentisering, forespørselsformatering og svarhåndtering, forenkler CometAPI dramatisk integreringen av AI-funksjoner i applikasjonene dine. Enten du bygger chatboter, bildegeneratorer, musikkomponister eller datadrevne analysepipeliner, lar CometAPI deg iterere raskere, kontrollere kostnader og forbli leverandøruavhengig – alt samtidig som du utnytter de nyeste gjennombruddene på tvers av AI-økosystemet.

Utviklere har tilgang Grok-4-fast (modell: grok-4-fast-reasoning” / “grok-4-fast-reasoning) gjennom Comet API, den nyeste modellversjonen er alltid oppdatert med den offisielle nettsiden. For å begynne, utforsk modellens muligheter i lekeplass og konsulter API-veiledning for detaljerte instruksjoner. Før du får tilgang, må du sørge for at du har logget inn på CometAPI og fått API-nøkkelen. CometAPI tilby en pris som er langt lavere enn den offisielle prisen for å hjelpe deg med å integrere.

Klar til å dra? → Registrer deg for CometAPI i dag !