Ciri utama (senarai ringkas)

Dua varian model: grok-4-fast-reasoning dan grok-4-fast-non-reasoning (boleh dilaras untuk kedalaman vs. kelajuan).
Tetingkap konteks yang sangat besar: sehingga 2,000,000 token, membolehkan dokumen yang sangat panjang / transkrip berjam-jam / aliran kerja berbilang dokumen.
Kecekapan token / fokus kos: xAI melaporkan ~40% token pemikiran lebih sedikit secara purata berbanding Grok-4 dan mendakwa ~98% pengurangan kos untuk mencapai prestasi penanda aras yang sama (berdasarkan metrik yang dilaporkan oleh xAI).
Integrasi alat / pelayaran asli: dilatih hujung-ke-hujung dengan RL penggunaan alat untuk pelayaran web/X, pelaksanaan kod dan tingkah laku carian agenik.
Multimodal & pemanggilan fungsi: menyokong imej dan output berstruktur; pemanggilan fungsi dan format respons berstruktur disokong dalam API.

Butiran teknikal

Seni bina penaakulan bersatu: Grok-4-Fast menggunakan asas pemberat model tunggal yang boleh diarahkan kepada tingkah laku reasoning (rantai pemikiran panjang) atau non-reasoning (jawapan pantas) melalui arahan sistem atau pemilihan varian, dan bukannya menghantar dua model tulang belakang yang sepenuhnya berasingan. Ini mengurangkan kependaman pertukaran dan kos token untuk beban kerja bercampur.

Pembelajaran pengukuhan untuk ketumpatan kecerdasan: xAI melaporkan menggunakan pembelajaran pengukuhan berskala besar yang memfokuskan pada ketumpatan kecerdasan (memaksimumkan prestasi setiap token), yang menjadi asas kepada peningkatan kecekapan token yang dinyatakan.

Pengkondisian alat dan carian agenik: Grok-4-Fast dilatih dan dinilai pada tugasan yang memerlukan pemanggilan alat (pelayaran web, carian X, pelaksanaan kod). Model ini digambarkan mahir memilih bila untuk memanggil alat dan bagaimana menyepadukan bukti pelayaran ke dalam jawapan.

Prestasi penanda aras

Ipeningkatan dalam BrowseComp (44.9% pass\@1 vs 43.0% untuk Grok-4), SimpleQA (95.0% vs 94.0%), serta peningkatan besar dalam arena pelayaran/carian berbahasa Cina tertentu. xAI juga melaporkan kedudukan teratas dalam Search Arena LMArena untuk varian grok-4-fast-search.

Kes penggunaan tipikal & disyorkan

Carian dan pengambilan berkapasiti tinggi — agen carian yang memerlukan penaakulan web berbilang loncatan dengan pantas.
Pembantu & bot agenik — agen yang menggabungkan pelayaran, pelaksanaan kod, dan panggilan alat tak segerak (di tempat yang dibenarkan).
Penyebaran produksi sensitif kos — perkhidmatan yang memerlukan banyak panggilan dan mahukan ekonomi token-ke-utiliti yang lebih baik berbanding model asas yang lebih berat.
Eksperimen pembangun — memprototaip aliran multimodal atau diperkaya web yang bergantung pada pertanyaan pantas dan berulang.
Cara mengakses API Grok 4 Fast

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kunci API kelayakan akses untuk antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.

Langkah 2: Hantar Permintaan ke API Grok 4 Fast

Pilih titik akhir “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar daripada akaun anda. base url ialah Chat format(https://api.cometapi.com/v1/chat/completions).

Masukkan soalan atau permintaan anda ke dalam medan content—ini ialah kandungan yang akan direspons oleh model. Proseskan respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan dan Sahkan Keputusan

Proseskan respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan memberikan status tugas dan data output.

Harga untuk Grok 4 Fast

Terokai harga yang kompetitif untuk Grok 4 Fast, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana Grok 4 Fast boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.

Harga Comet (USD / M Tokens)	Harga Rasmi (USD / M Tokens)	Diskaun
Masukan:$0.16/M Keluaran:$0.4/M	Masukan:$0.2/M Keluaran:$0.5/M	-20%

Versi Grok 4 Fast

Sebab Grok 4 Fast mempunyai berbilang snapshot mungkin merangkumi faktor berpotensi seperti variasi output selepas kemas kini yang memerlukan snapshot lama untuk konsistensi, menyediakan tempoh peralihan untuk penyesuaian dan migrasi kepada pembangun, serta snapshot berbeza yang sepadan dengan endpoint global atau serantau untuk mengoptimumkan pengalaman pengguna. Untuk perbezaan terperinci antara versi, sila rujuk dokumentasi rasmi.

Nama awam yang diumumkan oleh xAI: grok-4-fast-reasoning dan grok-4-fast-non-reasoning. Setiap varian melaporkan had konteks yang sama iaitu 2M token. Platform tersebut juga terus menghoskan model unggulan terdahulu Grok-4 (cth., varian grok-4-0709 yang digunakan sebelum ini).

Ciri utama (senarai ringkas)

Dua varian model: grok-4-fast-reasoning dan grok-4-fast-non-reasoning (boleh dilaras untuk kedalaman vs. kelajuan).
Tetingkap konteks yang sangat besar: sehingga 2,000,000 token, membolehkan dokumen yang sangat panjang / transkrip berjam-jam / aliran kerja berbilang dokumen.
Kecekapan token / fokus kos: xAI melaporkan ~40% token pemikiran lebih sedikit secara purata berbanding Grok-4 dan mendakwa ~98% pengurangan kos untuk mencapai prestasi penanda aras yang sama (berdasarkan metrik yang dilaporkan oleh xAI).
Integrasi alat / pelayaran asli: dilatih hujung-ke-hujung dengan RL penggunaan alat untuk pelayaran web/X, pelaksanaan kod dan tingkah laku carian agenik.
Multimodal & pemanggilan fungsi: menyokong imej dan output berstruktur; pemanggilan fungsi dan format respons berstruktur disokong dalam API.

Butiran teknikal

Prestasi penanda aras

Kes penggunaan tipikal & disyorkan

Carian dan pengambilan berkapasiti tinggi — agen carian yang memerlukan penaakulan web berbilang loncatan dengan pantas.
Pembantu & bot agenik — agen yang menggabungkan pelayaran, pelaksanaan kod, dan panggilan alat tak segerak (di tempat yang dibenarkan).
Penyebaran produksi sensitif kos — perkhidmatan yang memerlukan banyak panggilan dan mahukan ekonomi token-ke-utiliti yang lebih baik berbanding model asas yang lebih berat.
Eksperimen pembangun — memprototaip aliran multimodal atau diperkaya web yang bergantung pada pertanyaan pantas dan berulang.
Cara mengakses API Grok 4 Fast

Langkah 1: Daftar untuk Kunci API

Langkah 2: Hantar Permintaan ke API Grok 4 Fast

Masukkan soalan atau permintaan anda ke dalam medan content—ini ialah kandungan yang akan direspons oleh model. Proseskan respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan dan Sahkan Keputusan

Proseskan respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan memberikan status tugas dan data output.

Grok 4 Fast

Lebih Banyak Model

Claude Opus 4.7

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Grok 4.20

Qwen3.6-Plus

Blog Berkaitan

Bagaimana menggunakan z-image untuk mencipta kandungan NSFW? Panduan terbaik yang anda perlukan

API pantas Grok 4.1