Grok-4-Fast ialah xAI model penaakulan cekap kos baharu direka untuk menjadikan penaakulan berkualiti tinggi dan keupayaan carian web lebih murah dan pantas untuk kegunaan pengguna dan pembangun. xAI meletakkannya sebagai a sempadan tawaran yang mengekalkan prestasi penanda aras Grok-4 sambil meningkatkan kecekapan token, dan menghantar dua varian yang ditala untuk sama ada penaakulan or tidak beralasan beban kerja.
Ciri utama (senarai cepat)
- Dua varian model:
grok-4-fast-reasoningandgrok-4-fast-non-reasoning(boleh ditala untuk kedalaman vs. kelajuan). - Tetingkap konteks yang sangat besar: sehingga Token 2,000,000, membolehkan dokumen yang sangat panjang / transkrip berbilang jam / aliran kerja berbilang dokumen.
- Kecekapan token / tumpuan kos: laporan xAI ~40% lebih sedikit token pemikiran secara purata berbanding Grok-4 dan yang dituntut ~98% pengurangan kos untuk mencapai prestasi penanda aras yang sama (pada laporan metrik xAI).
- Penyepaduan alat / penyemakan imbas asli: terlatih hujung ke hujung dengan RL penggunaan alat untuk penyemakan imbas web/X, pelaksanaan kod dan gelagat carian agenik.
- Panggilan multimodal & fungsi: menyokong imej dan output berstruktur; panggilan fungsi dan format respons berstruktur disokong dalam API.
Maklumat teknikal
Seni bina penaakulan bersatu: Grok-4-Fast menggunakan a asas berat model tunggal yang boleh dipandu masuk penaakulan (rantai pemikiran yang panjang) atau tidak beralasan (balas pantas) tingkah laku melalui gesaan sistem atau pemilihan varian, dan bukannya menghantar dua model tulang belakang yang berasingan sepenuhnya. Ini mengurangkan kependaman penukaran dan kos token untuk beban kerja bercampur.
Pembelajaran pengukuhan untuk ketumpatan kecerdasan: laporan xAI menggunakan pembelajaran pengukuhan berskala besar memberi tumpuan kepada ketumpatan kecerdasan (memaksimumkan prestasi setiap token), yang merupakan asas untuk keuntungan kecekapan token yang dinyatakan.
Pengkondisian alat dan carian agen: Grok-4-Fast telah dilatih dan dinilai pada tugas yang memerlukan alat pemanggilan (semakan imbas web, carian X, pelaksanaan kod). Model ini dipersembahkan sebagai mahir memilih bila hendak memanggil alatan dan cara mencantum bukti penyemakan imbas menjadi jawapan.
Prestasi penanda aras
Ipenambahbaikan dalam BrowseComp (44.9% lulus@1 lwn 43.0% untuk Grok-4), SimpleQA (95.0% vs 94.0%), dan keuntungan besar dalam arena penyemakan imbas/pencarian bahasa Cina tertentu. xAI juga melaporkan kedudukan teratas dalam Arena Carian LMArena untuk a grok-4-fast-search pelbagai.

Versi model & penamaan
Nama awam diumumkan oleh xAI: grok-4-fast-reasoning and grok-4-fast-non-reasoning. Setiap varian melaporkan perkara yang sama token 2M had konteks. Platform ini juga terus menjadi tuan rumah yang lebih awal Grok-4 perdana (cth, grok-4-0709 varian yang digunakan sebelum ini).
Had dan pertimbangan keselamatan
- Kebimbangan kandungan-keselamatan: laporan daripada saluran penyiasatan menunjukkan keluarga Grok xAI (dan beberapa ciri Grok) telah dibangunkan dengan pilihan kandungan yang permisif dan beberapa aliran kerja dalaman mendedahkan anotasi kepada bahan yang sangat mengganggu. Terdapat kebimbangan yang jelas tentang keteguhan penyederhanaan dan melaporkan kepada pihak berkuasa untuk kandungan haram. Isu keselamatan dan pematuhan ini penting apabila menggunakan mana-mana varian Grok dalam pengeluaran.
- Pengesahan bebas: banyak tuntutan prestasi/ekonomi xAI dilaporkan sendiri; penanda aras bebas dan ulasan rakan sebaya masih diterbitkan. Anggap tuntutan kecekapan kos sebagai disediakan vendor sehingga replikasi pihak ketiga tersedia.
- Risiko operasi: kerana Grok-4-Fast dirangka untuk penyemakan imbas agen, pengguna harus ambil perhatian halusinasi, had kesegaran data (walaupun keupayaan menyemak imbas), dan privasi pertimbangan apabila model digunakan dengan alat luaran atau pertanyaan web langsung.
Kes penggunaan biasa & disyorkan
- Carian dan perolehan berdaya tinggi — ejen carian yang memerlukan penaakulan web multi-hop pantas.
- Pembantu ejen & bot — ejen yang menggabungkan penyemakan imbas, pelaksanaan kod dan panggilan alat tak segerak (jika dibenarkan).
- Penggunaan pengeluaran yang sensitif terhadap kos — perkhidmatan yang memerlukan banyak panggilan dan mahukan ekonomi token-ke-utiliti yang dipertingkatkan berbanding model asas yang lebih berat.
- Percubaan pemaju — membuat prototaip aliran multimodal atau tambahan web yang bergantung pada pertanyaan cepat dan berulang.
Bagaimana hendak memanggil grok-4-fast API daripada CometAPI
grok-code-fast-1 Harga API dalam CometAPI,diskaun 20% daripada harga rasmi:
| grok-4-cepat-tidak-menaakul | Token Input: token 0.16/ M Token Output: 0.40/M token |
| grok-4-cepat-penaakulan | Token Input: token 0.16/ M Token Output: 0.40/M token |
Langkah yang Diperlukan
- Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar dahulu
- Dapatkan kunci API kelayakan akses antara muka. Klik "Tambah Token" pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
Gunakan Kaedah
- Pilih "
grok-4-fast-reasoning"/"grok-4-fast-reasoning” titik akhir untuk menghantar permintaan API dan menetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API tapak web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. - Gantikan dengan kunci CometAPI sebenar anda daripada akaun anda.
- Masukkan soalan atau permintaan anda ke dalam medan kandungan—inilah yang akan dijawab oleh model.
- . Proses respons API untuk mendapatkan jawapan yang dijana.
CometAPI menyediakan REST API yang serasi sepenuhnya—untuk penghijrahan yang lancar. Butiran penting kepada Dokumen API:
- URL asas: https://api.cometapi.com/v1/chat/completions
- Nama Model:"
grok-4-fast-reasoning"/"grok-4-fast-reasoning" - Pengesahan: Token pembawa melalui
Authorization: Bearer YOUR_CometAPI_API_KEYheader - Jenis kandungan:
application/json.
Penyepaduan & Contoh API
Coretan Python untuk a ChatCompletion panggilan melalui CometAPI:
pythonimport openai
openai.api_key = "YOUR_CometAPI_API_KEY"
openai.api_base = "https://api.cometapi.com/v1/chat/completions"
messages = [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize grok-4-fast's main features."}
]
response = openai.ChatCompletion.create(
model="grok-4-fast-reasoning",
messages=messages,
temperature=0.7,
max_tokens=500
)
print(response.choices.message)
See Also Grok 4


