ModelHargaPerusahaan
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pengembang
Mulai CepatDokumentasiDasbor API
Perusahaan
Tentang kamiPerusahaan
Sumber Daya
Model AIBlogCatatan PerubahanDukungan
Syarat dan Ketentuan LayananKebijakan Privasi
© 2026 CometAPI · All rights reserved
Home/Models/xAI/Grok 4 Fast
X

Grok 4 Fast

Masukan:$0.16/M
Keluaran:$0.4/M
Konteks:2M
Keluaran Maksimum:30K
Grok 4 Fast adalah model kecerdasan buatan baru yang diluncurkan oleh xAI, yang mengintegrasikan kemampuan inferensi dan non-inferensi ke dalam satu arsitektur. Model ini memiliki jendela konteks 2 juta token dan dirancang untuk aplikasi dengan throughput tinggi seperti pencarian dan pengodean. Model ini menawarkan dua versi: Grok-4-Fast-Reasoning dan Grok-4-Fast-Non-Reasoning, yang dioptimalkan untuk tugas yang berbeda.
Baru
Penggunaan komersial
Playground
Ikhtisar
Fitur
Harga
API
Versi

Fitur utama (daftar singkat)

  • Dua varian model: grok-4-fast-reasoning dan grok-4-fast-non-reasoning (dapat disesuaikan untuk kedalaman vs. kecepatan).
  • Jendela konteks sangat besar: hingga 2.000.000 token, memungkinkan dokumen yang sangat panjang / transkrip multi-jam / alur kerja multi-dokumen.
  • Efisiensi token / fokus biaya: xAI melaporkan ~40% lebih sedikit thinking tokens rata-rata dibandingkan Grok-4 dan klaim ~98% pengurangan biaya untuk mencapai performa benchmark yang sama (berdasarkan metrik yang dilaporkan xAI).
  • Integrasi alat / penelusuran native: dilatih end-to-end dengan tool-use RL untuk penelusuran web/X, eksekusi kode, dan perilaku pencarian agentik.
  • Multimodal & function calling: mendukung gambar dan output terstruktur; function calling dan format respons terstruktur didukung dalam API.

Detail teknis

Arsitektur penalaran terpadu: Grok-4-Fast menggunakan single model weightbase yang dapat diarahkan ke perilaku reasoning (chain-of-thought panjang) atau non-reasoning (respons cepat) melalui system prompt atau pemilihan varian, alih-alih merilis dua model backbone yang sepenuhnya terpisah. Ini mengurangi latensi perpindahan dan biaya token untuk beban kerja campuran.

Reinforcement learning untuk densitas kecerdasan: xAI melaporkan penggunaan large-scale reinforcement learning yang berfokus pada intelligence density (memaksimalkan performa per token), yang menjadi dasar bagi peningkatan efisiensi token yang disebutkan.

Tool conditioning dan pencarian agentik: Grok-4-Fast dilatih dan dievaluasi pada tugas-tugas yang memerlukan pemanggilan alat (penelusuran web, pencarian X, eksekusi kode). Model ini diposisikan sebagai mahir dalam memilih kapan harus memanggil alat dan bagaimana merangkai bukti penelusuran ke dalam jawaban.

Performa benchmark

Peningkatan pada BrowseComp (44,9% pass\@1 vs 43,0% untuk Grok-4), SimpleQA (95,0% vs 94,0%), dan peningkatan besar di beberapa area penelusuran/pencarian berbahasa Mandarin. xAI juga melaporkan peringkat teratas di Search Arena milik LMArena untuk varian grok-4-fast-search.

Kasus penggunaan umum & yang direkomendasikan

  • Pencarian dan pengambilan berthroughput tinggi — agen pencarian yang membutuhkan penalaran web multi-hop yang cepat.
  • Asisten & bot agentik — agen yang menggabungkan penelusuran, eksekusi kode, dan pemanggilan alat asinkron (jika diizinkan).
  • Penerapan produksi yang sensitif terhadap biaya — layanan yang memerlukan banyak panggilan dan menginginkan ekonomi token-terhadap-utilitas yang lebih baik dibandingkan model dasar yang lebih berat.
  • Eksperimen developer — pembuatan prototipe alur multimodal atau berbantuan web yang mengandalkan kueri cepat dan berulang.
  • Cara mengakses API Grok 4 fast

Langkah 1: Daftar untuk mendapatkan API Key

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI Anda. Dapatkan kredensial akses berupa API key antarmuka. Klik “Add Token” pada bagian API token di pusat personal, dapatkan token key: sk-xxxxx lalu kirimkan.

Langkah 2: Kirim permintaan ke API Grok 4 fast

Pilih endpoint “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” untuk mengirim permintaan API dan atur request body. Metode permintaan dan request body dapat diperoleh dari dokumentasi API di situs web kami. Situs web kami juga menyediakan pengujian Apifox untuk kemudahan Anda. Ganti <YOUR_API_KEY> dengan CometAPI key aktual dari akun Anda. base url adalah Chat format(https://api.cometapi.com/v1/chat/completions).

Masukkan pertanyaan atau permintaan Anda ke dalam field content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan verifikasi hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API akan merespons dengan status tugas dan data output.

Fitur untuk Grok 4 Fast

Jelajahi fitur-fitur utama dari Grok 4 Fast, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk Grok 4 Fast

Jelajahi harga kompetitif untuk Grok 4 Fast, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana Grok 4 Fast dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.
Harga Comet (USD / M Tokens)Harga Resmi (USD / M Tokens)Diskon
Masukan:$0.16/M
Keluaran:$0.4/M
Masukan:$0.2/M
Keluaran:$0.5/M
-20%

Kode contoh dan API untuk Grok 4 Fast

Akses kode sampel komprehensif dan sumber daya API untuk Grok 4 Fast guna mempermudah proses integrasi Anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu Anda memanfaatkan potensi penuh Grok 4 Fast dalam proyek Anda.
POST
/v1/chat/completions

Versi Grok 4 Fast

Alasan Grok 4 Fast memiliki beberapa _snapshot_ mungkin mencakup faktor-faktor potensial seperti variasi keluaran setelah pembaruan yang memerlukan _snapshot_ lama untuk konsistensi, memberikan masa transisi bagi pengembang untuk beradaptasi dan bermigrasi, serta _snapshot_ berbeda yang sesuai dengan _endpoint_ global atau regional untuk mengoptimalkan pengalaman pengguna. Untuk perbedaan detail antar versi, silakan merujuk ke dokumentasi resmi.

Nama publik yang diumumkan oleh xAI: grok-4-fast-reasoning dan grok-4-fast-non-reasoning. Setiap varian melaporkan batas konteks 2M token yang sama. Platform ini juga terus menampung flagship Grok-4 yang lebih awal (misalnya, varian grok-4-0709 yang digunakan sebelumnya).

Model Lainnya

C

Claude Opus 4.7

Masukan:$3/M
Keluaran:$15/M
Model paling cerdas untuk agen dan pemrograman
A

Claude Sonnet 4.6

Masukan:$2.4/M
Keluaran:$12/M
Claude Sonnet 4.6 adalah model Sonnet kami yang paling mumpuni sejauh ini. Ini merupakan peningkatan menyeluruh atas keahlian model di bidang pemrograman, penggunaan komputer, penalaran konteks panjang, perencanaan agen, pekerjaan berbasis pengetahuan, dan desain. Sonnet 4.6 juga menyertakan jendela konteks 1M token dalam tahap beta.
O

GPT-5.4 nano

Masukan:$0.16/M
Keluaran:$1/M
GPT-5.4 nano dirancang untuk tugas-tugas di mana kecepatan dan biaya paling penting, seperti klasifikasi, ekstraksi data, pemeringkatan, dan sub-agen.
O

GPT-5.4 mini

Masukan:$0.6/M
Keluaran:$3.6/M
GPT-5.4 mini menghadirkan keunggulan GPT-5.4 ke model yang lebih cepat dan lebih efisien, dirancang untuk beban kerja bervolume tinggi.
X

Grok 4.20

Masukan:$1.6/M
Keluaran:$4.8/M
Rilis Grok 4.20 memperkenalkan arsitektur multiagen (beberapa agen terspesialisasi yang dikoordinasikan secara waktu nyata), mode konteks yang diperluas, serta peningkatan yang berfokus pada kemampuan mengikuti instruksi, pengurangan halusinasi, dan keluaran terstruktur/berbantuan alat.
Q

Qwen3.6-Plus

Masukan:$0.32/M
Keluaran:$1.92/M
Qwen 3.6-Plus kini tersedia, menghadirkan kemampuan pengembangan kode yang ditingkatkan serta efisiensi yang lebih tinggi dalam pengenalan dan inferensi multimodal, menjadikan pengalaman Vibe Coding semakin baik.

Blog Terkait

Cara Menggunakan z-image untuk Membuat Konten NSFW? Panduan Terbaik yang Anda Butuhkan
Jan 7, 2026

Cara Menggunakan z-image untuk Membuat Konten NSFW? Panduan Terbaik yang Anda Butuhkan

Tongyi Lab milik Alibaba telah secara resmi merilis Z-Image, model generatif gambar sumber terbuka dengan 6 miliar parameter yang saat ini sedang menggemparkan komunitas AI. Dirilis pada akhir 2025, Z-Image dengan cepat menggeser favorit sebelumnya seperti Flux dan SDXL di mata banyak pengguna lokal.
API cepat Grok 4.1
Nov 19, 2025
grok-4-1-fast
x-ai

API cepat Grok 4.1

Grok 4.1 Fast adalah model besar xAI yang berfokus pada produksi, dioptimalkan untuk pemanggilan alat agen, alur kerja konteks panjang, dan inferensi latensi rendah. Model ini merupakan keluarga multimoda dengan dua varian yang dirancang untuk menjalankan agen otonom yang mencari, mengeksekusi kode, memanggil layanan, dan melakukan penalaran pada konteks yang sangat besar (hingga 2 juta token).