Home/Models/xAI/Grok 4.1 Fast
X

Grok 4.1 Fast

Masukan:$0.16/M
Keluaran:$0.4/M
Konteks:2M
Keluaran Maksimum:30K
Grok 4.1 Fast adalah model berskala besar xAI yang berfokus pada produksi, dioptimalkan untuk pemanggilan alat berbasis agen, alur kerja berkonteks panjang, dan inferensi berlatensi rendah. Ini adalah keluarga multimodal dengan dua varian yang dirancang untuk menjalankan agen otonom yang dapat mencari, mengeksekusi kode, memanggil layanan, dan bernalar pada konteks yang sangat besar (hingga 2 juta token).
Baru
Penggunaan komersial
Playground
Ikhtisar
Fitur
Harga
API
Versi

Fitur utama

  • Dua varian: grok-4-1-fast-reasoning (thinking / agenik) dan grok-4-1-fast-non-reasoning (respons instan “Fast”).
  • Jendela konteks masif: 2.000.000 token — dirancang untuk transkrip multi-jam, koleksi dokumen besar, dan perencanaan multi-putaran yang panjang.
  • First-party Agent Tools API: penjelajahan web/X bawaan, eksekusi kode sisi server, pencarian file, dan konektor “MCP” sehingga model dapat bertindak sebagai agen otonom tanpa perekat eksternal.
  • Modalitas: Multimodal (teks + gambar dan kemampuan visual yang ditingkatkan termasuk analisis bagan dan ekstraksi setara OCR).

Bagaimana cara kerja Grok 4.1 Fast?

  • Arsitektur & mode: Grok 4.1 Fast disajikan sebagai satu keluarga model yang dapat dikonfigurasi untuk “reasoning” (rantai pemikiran internal dan deliberasi lebih tinggi) atau operasi “fast” non-reasoning untuk latensi lebih rendah. Mode reasoning dapat diaktifkan/nonaktifkan oleh parameter API (mis., reasoning.enabled) pada lapisan penyedia seperti CometAPI.
  • Sinyal pelatihan: xAI melaporkan reinforcement learning dalam lingkungan agenik tersimulasikan (pelatihan yang sarat alat) untuk meningkatkan performa pada tugas pemanggilan alat multi-putaran, berjangka panjang (mereka merujuk pelatihan pada τ²-bench Telecom dan long-context RL).
  • Orkestrasi alat: Alat dijalankan di infrastruktur xAI; Grok dapat memanggil beberapa alat secara paralel dan memutuskan rencana agenik lintas putaran (pencarian web, pencarian X, eksekusi kode, pengambilan file, server MCP).
  • Throughput & batas laju: contoh batas yang dipublikasikan termasuk 480 permintaan/menit dan 4.000.000 token/menit untuk klaster grok-4-1-fast-reasoning.

Versi model & penamaan Grok 4.1 fast

  • grok-4-1-fast-reasoning — mode agenik “thinking”: token penalaran internal, orkestrasi alat, terbaik untuk alur kerja multi-langkah yang kompleks.
  • grok-4-1-fast-non-reasoning — mode “Fast” instan: token pemikiran internal minimal, latensi lebih rendah untuk chat, curah pendapat, penulisan bentuk pendek.

Kinerja tolok ukur Grok 4.1 fast

xAI menyoroti beberapa kemenangan tolok ukur dan peningkatan terukur dibanding rilis Grok sebelumnya dan beberapa model pesaing. Angka yang dipublikasikan utama:

  • τ²-bench (tolok ukur alat agenik telekomunikasi): dilaporkan skor 100% dengan total biaya $105。
  • Berkeley Function Calling v4: dilaporkan akurasi keseluruhan 72% (angka yang dipublikasikan xAI) dengan total biaya yang dilaporkan ~$400 dalam konteks tolok ukur tersebut.
  • Riset & pencarian agenik (Research-Eval / Reka / X Browse): xAI melaporkan skor lebih unggul dan biaya lebih rendah vs beberapa kompetitor pada tolok ukur pencarian agenik internal/industri (contoh: Grok 4.1 Fast: skor Research-Eval dan X Browse secara signifikan lebih tinggi daripada GPT-5 dan Claude Sonnet 4.5 pada tabel yang dipublikasikan xAI).
  • Faktualitas / halusinasi: Grok 4.1 Fast memangkas separuh laju halusinasi dibanding Grok 4 Fast pada FActScore dan metrik internal terkait.

Keterbatasan & risiko Grok 4.1 fast

  • Halusinasi berkurang, bukan dihilangkan. Pengurangan yang dipublikasikan bermakna (xAI melaporkan pemangkasan laju halusinasi secara substansial vs Grok 4 Fast sebelumnya) namun kesalahan faktual tetap bisa terjadi pada kasus tepi dan alur kerja respons cepat—validasi output yang kritis secara independen.
  • Permukaan kepercayaan alat: alat sisi server meningkatkan kenyamanan tetapi juga memperluas permukaan serangan (penyalahgunaan alat, hasil eksternal yang salah, atau sumber usang). Gunakan pemeriksaan asal-usul dan pagar pengaman; perlakukan output alat otomatis sebagai bukti yang perlu diverifikasi.
  • Bukan SOTA serba guna: ulasan menunjukkan seri Grok unggul pada STEM, penalaran, dan tugas agenik konteks panjang, namun bisa tertinggal pada beberapa pemahaman visual multimodal dan generasi kreatif dibanding penawaran multimodal terbaru dari vendor lain.

Perbandingan Grok 4.1 fast dengan model terkemuka lainnya

  • Versus Grok 4 / Grok 4.1 (non-Fast): Fast menukar sebagian komputasi/“thinking” internal demi latensi dan ekonomi token sambil menargetkan kualitas penalaran mendekati tingkat Grok 4; dioptimalkan untuk penggunaan agenik produksi alih-alih penalaran puncak mentah pada tolok ukur offline berat. ([xAI][5])
  • Versus keluarga Google Gemini / keluarga OpenAI GPT / Anthropic Claude: ulasan independen dan pers teknologi mencatat kekuatan Grok dalam penalaran logis, pemanggilan alat, dan penanganan konteks panjang, sementara vendor lain kadang memimpin dalam visi multimodal, generasi kreatif, atau trade-off harga/kinerja yang berbeda.
  • Cara mengakses API Grok 4.1 fast

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kredensial akses kunci API antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.

gambar

Langkah 2: Kirim Permintaan ke API Grok 4.1 fast

Pilih endpoint “\grok-4-1-fast-reasoning/ grok-4-1-fast-non-reasoning\” untuk mengirim permintaan API dan setel body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. base url adalah format Chat (https://api.cometapi.com/v1/chat/completions).

Masukkan pertanyaan atau permintaan Anda ke dalam bidang content—ini adalah yang akan direspons oleh model . Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data output.

Fitur untuk Grok 4.1 Fast

Jelajahi fitur-fitur utama dari Grok 4.1 Fast, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk Grok 4.1 Fast

Jelajahi harga kompetitif untuk Grok 4.1 Fast, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana Grok 4.1 Fast dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.
Harga Comet (USD / M Tokens)Harga Resmi (USD / M Tokens)
Masukan:$0.16/M
Keluaran:$0.4/M
Masukan:$0.2/M
Keluaran:$0.5/M

Kode contoh dan API untuk Grok 4.1 Fast

Akses kode sampel komprehensif dan sumber daya API untuk Grok 4.1 Fast guna mempermudah proses integrasi Anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu Anda memanfaatkan potensi penuh Grok 4.1 Fast dalam proyek Anda.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="grok-4-1-fast-non-reasoning",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

Versi Grok 4.1 Fast

Alasan Grok 4.1 Fast memiliki beberapa _snapshot_ mungkin mencakup faktor-faktor potensial seperti variasi keluaran setelah pembaruan yang memerlukan _snapshot_ lama untuk konsistensi, memberikan masa transisi bagi pengembang untuk beradaptasi dan bermigrasi, serta _snapshot_ berbeda yang sesuai dengan _endpoint_ global atau regional untuk mengoptimalkan pengalaman pengguna. Untuk perbedaan detail antar versi, silakan merujuk ke dokumentasi resmi.
grok-4-1-fast-reasoning
grok-4-1-fast-non-reasoning

Model Lainnya