Fitur utama (daftar singkat)

Dua varian model: grok-4-fast-reasoning dan grok-4-fast-non-reasoning (dapat disesuaikan untuk kedalaman vs. kecepatan).
Jendela konteks sangat besar: hingga 2.000.000 token, memungkinkan dokumen yang sangat panjang / transkrip multi-jam / alur kerja multi-dokumen.
Efisiensi token / fokus biaya: xAI melaporkan ~40% lebih sedikit thinking tokens rata-rata dibandingkan Grok-4 dan klaim ~98% pengurangan biaya untuk mencapai performa benchmark yang sama (berdasarkan metrik yang dilaporkan xAI).
Integrasi alat / penelusuran native: dilatih end-to-end dengan tool-use RL untuk penelusuran web/X, eksekusi kode, dan perilaku pencarian agentik.
Multimodal & function calling: mendukung gambar dan output terstruktur; function calling dan format respons terstruktur didukung dalam API.

Detail teknis

Arsitektur penalaran terpadu: Grok-4-Fast menggunakan single model weightbase yang dapat diarahkan ke perilaku reasoning (chain-of-thought panjang) atau non-reasoning (respons cepat) melalui system prompt atau pemilihan varian, alih-alih merilis dua model backbone yang sepenuhnya terpisah. Ini mengurangi latensi perpindahan dan biaya token untuk beban kerja campuran.

Reinforcement learning untuk densitas kecerdasan: xAI melaporkan penggunaan large-scale reinforcement learning yang berfokus pada intelligence density (memaksimalkan performa per token), yang menjadi dasar bagi peningkatan efisiensi token yang disebutkan.

Tool conditioning dan pencarian agentik: Grok-4-Fast dilatih dan dievaluasi pada tugas-tugas yang memerlukan pemanggilan alat (penelusuran web, pencarian X, eksekusi kode). Model ini diposisikan sebagai mahir dalam memilih kapan harus memanggil alat dan bagaimana merangkai bukti penelusuran ke dalam jawaban.

Performa benchmark

Peningkatan pada BrowseComp (44,9% pass\@1 vs 43,0% untuk Grok-4), SimpleQA (95,0% vs 94,0%), dan peningkatan besar di beberapa area penelusuran/pencarian berbahasa Mandarin. xAI juga melaporkan peringkat teratas di Search Arena milik LMArena untuk varian grok-4-fast-search.

Kasus penggunaan umum & yang direkomendasikan

Pencarian dan pengambilan berthroughput tinggi — agen pencarian yang membutuhkan penalaran web multi-hop yang cepat.
Asisten & bot agentik — agen yang menggabungkan penelusuran, eksekusi kode, dan pemanggilan alat asinkron (jika diizinkan).
Penerapan produksi yang sensitif terhadap biaya — layanan yang memerlukan banyak panggilan dan menginginkan ekonomi token-terhadap-utilitas yang lebih baik dibandingkan model dasar yang lebih berat.
Eksperimen developer — pembuatan prototipe alur multimodal atau berbantuan web yang mengandalkan kueri cepat dan berulang.
Cara mengakses API Grok 4 fast

Langkah 1: Daftar untuk mendapatkan API Key

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI Anda. Dapatkan kredensial akses berupa API key antarmuka. Klik “Add Token” pada bagian API token di pusat personal, dapatkan token key: sk-xxxxx lalu kirimkan.

Langkah 2: Kirim permintaan ke API Grok 4 fast

Pilih endpoint “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” untuk mengirim permintaan API dan atur request body. Metode permintaan dan request body dapat diperoleh dari dokumentasi API di situs web kami. Situs web kami juga menyediakan pengujian Apifox untuk kemudahan Anda. Ganti <YOUR_API_KEY> dengan CometAPI key aktual dari akun Anda. base url adalah Chat format(https://api.cometapi.com/v1/chat/completions).

Masukkan pertanyaan atau permintaan Anda ke dalam field content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan verifikasi hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data output.

Harga untuk Grok 4 Fast

Jelajahi harga kompetitif untuk Grok 4 Fast, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana Grok 4 Fast dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.

Harga Comet (USD / M Tokens)	Harga Resmi (USD / M Tokens)	Diskon
Masukan:$0.16/M Keluaran:$0.4/M	Masukan:$0.2/M Keluaran:$0.5/M	-20%

Versi Grok 4 Fast

Alasan Grok 4 Fast memiliki beberapa _snapshot_ mungkin mencakup faktor-faktor potensial seperti variasi keluaran setelah pembaruan yang memerlukan _snapshot_ lama untuk konsistensi, memberikan masa transisi bagi pengembang untuk beradaptasi dan bermigrasi, serta _snapshot_ berbeda yang sesuai dengan _endpoint_ global atau regional untuk mengoptimalkan pengalaman pengguna. Untuk perbedaan detail antar versi, silakan merujuk ke dokumentasi resmi.

Nama publik yang diumumkan oleh xAI: grok-4-fast-reasoning dan grok-4-fast-non-reasoning. Setiap varian melaporkan batas konteks 2M token yang sama. Platform ini juga terus menampung flagship Grok-4 yang lebih awal (misalnya, varian grok-4-0709 yang digunakan sebelumnya).

Fitur utama (daftar singkat)

Dua varian model: grok-4-fast-reasoning dan grok-4-fast-non-reasoning (dapat disesuaikan untuk kedalaman vs. kecepatan).
Jendela konteks sangat besar: hingga 2.000.000 token, memungkinkan dokumen yang sangat panjang / transkrip multi-jam / alur kerja multi-dokumen.
Efisiensi token / fokus biaya: xAI melaporkan ~40% lebih sedikit thinking tokens rata-rata dibandingkan Grok-4 dan klaim ~98% pengurangan biaya untuk mencapai performa benchmark yang sama (berdasarkan metrik yang dilaporkan xAI).
Integrasi alat / penelusuran native: dilatih end-to-end dengan tool-use RL untuk penelusuran web/X, eksekusi kode, dan perilaku pencarian agentik.
Multimodal & function calling: mendukung gambar dan output terstruktur; function calling dan format respons terstruktur didukung dalam API.

Detail teknis

Performa benchmark

Kasus penggunaan umum & yang direkomendasikan

Pencarian dan pengambilan berthroughput tinggi — agen pencarian yang membutuhkan penalaran web multi-hop yang cepat.
Asisten & bot agentik — agen yang menggabungkan penelusuran, eksekusi kode, dan pemanggilan alat asinkron (jika diizinkan).
Penerapan produksi yang sensitif terhadap biaya — layanan yang memerlukan banyak panggilan dan menginginkan ekonomi token-terhadap-utilitas yang lebih baik dibandingkan model dasar yang lebih berat.
Eksperimen developer — pembuatan prototipe alur multimodal atau berbantuan web yang mengandalkan kueri cepat dan berulang.
Cara mengakses API Grok 4 fast

Langkah 1: Daftar untuk mendapatkan API Key

Langkah 2: Kirim permintaan ke API Grok 4 fast

Masukkan pertanyaan atau permintaan Anda ke dalam field content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan verifikasi hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data output.

Grok 4 Fast

Model Lainnya

Claude Opus 4.7

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Grok 4.20

Qwen3.6-Plus

Blog Terkait

Cara Menggunakan z-image untuk Membuat Konten NSFW? Panduan Terbaik yang Anda Butuhkan

API cepat Grok 4.1