Ciri utama (senarai ringkas)
- Dua varian model:
grok-4-fast-reasoningdangrok-4-fast-non-reasoning(boleh dilaras untuk kedalaman vs. kelajuan). - Tetingkap konteks yang sangat besar: sehingga 2,000,000 token, membolehkan dokumen yang sangat panjang / transkrip berjam-jam / aliran kerja berbilang dokumen.
- Kecekapan token / fokus kos: xAI melaporkan ~40% token pemikiran lebih sedikit secara purata berbanding Grok-4 dan mendakwa ~98% pengurangan kos untuk mencapai prestasi penanda aras yang sama (berdasarkan metrik yang dilaporkan oleh xAI).
- Integrasi alat / pelayaran asli: dilatih hujung-ke-hujung dengan RL penggunaan alat untuk pelayaran web/X, pelaksanaan kod dan tingkah laku carian agenik.
- Multimodal & pemanggilan fungsi: menyokong imej dan output berstruktur; pemanggilan fungsi dan format respons berstruktur disokong dalam API.
Butiran teknikal
Seni bina penaakulan bersatu: Grok-4-Fast menggunakan asas pemberat model tunggal yang boleh diarahkan kepada tingkah laku reasoning (rantai pemikiran panjang) atau non-reasoning (jawapan pantas) melalui arahan sistem atau pemilihan varian, dan bukannya menghantar dua model tulang belakang yang sepenuhnya berasingan. Ini mengurangkan kependaman pertukaran dan kos token untuk beban kerja bercampur.
Pembelajaran pengukuhan untuk ketumpatan kecerdasan: xAI melaporkan menggunakan pembelajaran pengukuhan berskala besar yang memfokuskan pada ketumpatan kecerdasan (memaksimumkan prestasi setiap token), yang menjadi asas kepada peningkatan kecekapan token yang dinyatakan.
Pengkondisian alat dan carian agenik: Grok-4-Fast dilatih dan dinilai pada tugasan yang memerlukan pemanggilan alat (pelayaran web, carian X, pelaksanaan kod). Model ini digambarkan mahir memilih bila untuk memanggil alat dan bagaimana menyepadukan bukti pelayaran ke dalam jawapan.
Prestasi penanda aras
Ipeningkatan dalam BrowseComp (44.9% pass\@1 vs 43.0% untuk Grok-4), SimpleQA (95.0% vs 94.0%), serta peningkatan besar dalam arena pelayaran/carian berbahasa Cina tertentu. xAI juga melaporkan kedudukan teratas dalam Search Arena LMArena untuk varian grok-4-fast-search.
Kes penggunaan tipikal & disyorkan
- Carian dan pengambilan berkapasiti tinggi — agen carian yang memerlukan penaakulan web berbilang loncatan dengan pantas.
- Pembantu & bot agenik — agen yang menggabungkan pelayaran, pelaksanaan kod, dan panggilan alat tak segerak (di tempat yang dibenarkan).
- Penyebaran produksi sensitif kos — perkhidmatan yang memerlukan banyak panggilan dan mahukan ekonomi token-ke-utiliti yang lebih baik berbanding model asas yang lebih berat.
- Eksperimen pembangun — memprototaip aliran multimodal atau diperkaya web yang bergantung pada pertanyaan pantas dan berulang.
- Cara mengakses API Grok 4 Fast
Langkah 1: Daftar untuk Kunci API
Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kunci API kelayakan akses untuk antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.
Langkah 2: Hantar Permintaan ke API Grok 4 Fast
Pilih titik akhir “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar daripada akaun anda. base url ialah Chat format(https://api.cometapi.com/v1/chat/completions).
Masukkan soalan atau permintaan anda ke dalam medan content—ini ialah kandungan yang akan direspons oleh model. Proseskan respons API untuk mendapatkan jawapan yang dijana.
Langkah 3: Dapatkan dan Sahkan Keputusan
Proseskan respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan memberikan status tugas dan data output.

