ModelHargaPerusahaan
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pengembang
Mulai CepatDokumentasiDasbor API
Perusahaan
Tentang kamiPerusahaan
Sumber Daya
Model AIBlogCatatan PerubahanDukungan
Syarat dan Ketentuan LayananKebijakan Privasi
© 2026 CometAPI · All rights reserved
Home/Models/xAI/Grok 4.1 Fast
X

Grok 4.1 Fast

Masukan:$0.16/M
Keluaran:$0.4/M
Konteks:2M
Keluaran Maksimum:30K
Grok 4.1 Fast adalah model berskala besar xAI yang berfokus pada produksi, dioptimalkan untuk pemanggilan alat berbasis agen, alur kerja berkonteks panjang, dan inferensi berlatensi rendah. Ini adalah keluarga multimodal dengan dua varian yang dirancang untuk menjalankan agen otonom yang dapat mencari, mengeksekusi kode, memanggil layanan, dan bernalar pada konteks yang sangat besar (hingga 2 juta token).
Baru
Penggunaan komersial
Playground
Ikhtisar
Fitur
Harga
API
Versi

Fitur utama

  • Dua varian: grok-4-1-fast-reasoning (thinking / agentik) dan grok-4-1-fast-non-reasoning (respons “Fast” instan).
  • Jendela konteks masif: 2,000,000 tokens — dirancang untuk transkrip berjam-jam, koleksi dokumen besar, dan perencanaan multi-giliran yang panjang.
  • First-party Agent Tools API: penjelajahan web/X bawaan, eksekusi kode sisi server, pencarian file, dan konektor “MCP” sehingga model dapat bertindak sebagai agen otonom tanpa perekat eksternal.
  • Modalitas: Multimodal (teks + gambar dan kemampuan visual yang ditingkatkan termasuk analisis bagan dan ekstraksi setara OCR).

Bagaimana cara kerja Grok 4.1 Fast?

  • Arsitektur & mode: Grok 4.1 Fast disajikan sebagai satu keluarga model yang dapat dikonfigurasi untuk operasi “reasoning” (rantai pemikiran internal dan deliberasi lebih mendalam) atau operasi “fast” non-reasoning untuk latensi yang lebih rendah. Mode reasoning dapat diaktifkan/nonaktifkan melalui parameter API (misalnya, reasoning.enabled) pada lapisan penyedia seperti CometAPI.
  • Sinyal pelatihan: xAI melaporkan reinforcement learning dalam lingkungan agentik yang disimulasikan (pelatihan yang banyak menggunakan tool) untuk meningkatkan performa pada tugas pemanggilan tool multi-giliran berjangka panjang (mereka merujuk pelatihan pada τ²-bench Telecom dan RL konteks panjang).
  • Orkestrasi tool: Tool berjalan pada infrastruktur xAI; Grok dapat memanggil banyak tool secara paralel dan memutuskan rencana agentik lintas giliran (pencarian web, pencarian X, eksekusi kode, pengambilan file, server MCP).
  • Throughput & batas laju: batas contoh yang dipublikasikan mencakup 480 requests/minute dan 4,000,000 tokens/minute untuk klaster grok-4-1-fast-reasoning.

Versi model Grok 4.1 fast & penamaan

  • grok-4-1-fast-reasoning — mode agentik “thinking”: token penalaran internal, orkestrasi tool, terbaik untuk alur kerja multi-langkah yang kompleks.
  • grok-4-1-fast-non-reasoning — mode “Fast” instan: token pemikiran internal minimal, latensi lebih rendah untuk obrolan, brainstorming, penulisan bentuk pendek.

Performa benchmark Grok 4.1 fast

xAI menyoroti beberapa kemenangan benchmark dan peningkatan terukur dibanding rilis Grok sebelumnya dan beberapa model pesaing. Angka kunci yang dipublikasikan:

  • τ²-bench (benchmark tool agentik untuk telekom): dilaporkan skor 100% dengan total biaya $105.
  • Berkeley Function Calling v4: dilaporkan 72% akurasi keseluruhan (angka yang dipublikasikan xAI) dengan total biaya sekitar ~$400 dalam konteks benchmark tersebut.
  • Riset & penelusuran agentik (Research-Eval / Reka / X Browse): xAI melaporkan skor lebih unggul dan biaya lebih rendah dibanding beberapa kompetitor pada benchmark penelusuran agentik internal/industri (contoh: Grok 4.1 Fast: skor Research-Eval dan X Browse secara signifikan lebih tinggi daripada GPT-5 dan Claude Sonnet 4.5 dalam tabel yang dipublikasikan xAI).
  • Faktualitas / halusinasi: Grok 4.1 Fast mengurangi separuh laju halusinasi dibanding Grok 4 Fast pada FActScore dan metrik internal terkait.

Keterbatasan & risiko Grok 4.1 fast

  • Halusinasi berkurang, bukan dihilangkan. Pengurangan yang dipublikasikan bermakna (xAI melaporkan pemangkasan tingkat halusinasi secara substansial vs Grok 4 Fast sebelumnya) namun kesalahan faktual masih terjadi pada kasus tepi dan alur respons cepat—validasi hasil yang sangat krusial secara terpisah.
  • Permukaan kepercayaan tool: tool sisi server meningkatkan kemudahan tetapi juga memperluas permukaan serangan (penyalahgunaan tool, hasil eksternal yang salah, atau sumber yang usang). Gunakan pemeriksaan asal-usul dan guardrail; perlakukan output tool otomatis sebagai bukti yang perlu diverifikasi.
  • Bukan SOTA serbaguna: ulasan menunjukkan seri Grok unggul dalam STEM, penalaran, dan tugas agentik konteks panjang, tetapi mungkin tertinggal dalam beberapa tugas pemahaman visual multimodal dan generasi kreatif dibanding penawaran multimodal terbaru dari vendor lain.

Bagaimana Grok 4.1 fast dibandingkan dengan model terkemuka lainnya

  • Dibanding Grok 4 / Grok 4.1 (non-Fast): Fast menukar sebagian komputasi internal/“thinking” demi latensi dan penghematan token sambil berupaya menjaga kualitas penalaran mendekati level Grok 4; dioptimalkan untuk penggunaan agentik produksi alih-alih puncak penalaran murni pada benchmark offline berat. ([xAI][5])
  • Dibanding keluarga Google Gemini / OpenAI GPT / Anthropic Claude: ulasan independen dan pemberitaan teknologi mencatat kekuatan Grok pada penalaran logis, pemanggilan tool, dan penanganan konteks panjang, sementara vendor lain kadang unggul dalam visi multimodal, generasi kreatif, atau kompromi harga/kinerja yang berbeda.
  • Cara mengakses Grok 4.1 fast API

Langkah 1: Daftar untuk API Key

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kredensial akses API key untuk antarmuka. Klik “Add Token” pada API token di pusat pribadi, dapatkan token key: sk-xxxxx dan kirimkan.

Langkah 2: Kirim Permintaan ke Grok 4.1 fast API

Pilih endpoint “\grok-4-1-fast-reasoning/ grok-4-1-fast-non-reasoning\” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dok API situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. base url adalah [Chat] format([https://api.cometapi.com/v1/chat/completions]).
Masukkan pertanyaan atau permintaan Anda ke bidang content—itulah yang akan direspons model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah pemrosesan, API merespons dengan status tugas dan data keluaran.

Fitur untuk Grok 4.1 Fast

Jelajahi fitur-fitur utama dari Grok 4.1 Fast, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk Grok 4.1 Fast

Jelajahi harga kompetitif untuk Grok 4.1 Fast, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana Grok 4.1 Fast dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.
Harga Comet (USD / M Tokens)Harga Resmi (USD / M Tokens)Diskon
Masukan:$0.16/M
Keluaran:$0.4/M
Masukan:$0.2/M
Keluaran:$0.5/M
-20%

Kode contoh dan API untuk Grok 4.1 Fast

Akses kode sampel komprehensif dan sumber daya API untuk Grok 4.1 Fast guna mempermudah proses integrasi Anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu Anda memanfaatkan potensi penuh Grok 4.1 Fast dalam proyek Anda.
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="grok-4-1-fast-non-reasoning",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="grok-4-1-fast-non-reasoning",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const BASE_URL = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey: COMETAPI_KEY,
  baseURL: BASE_URL,
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "grok-4-1-fast-non-reasoning",
    messages: [
      { role: "system", content: "You are a helpful assistant." },
      { role: "user", content: "Hello!" },
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Curl Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const BASE_URL = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey: COMETAPI_KEY,
  baseURL: BASE_URL,
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "grok-4-1-fast-non-reasoning",
    messages: [
      { role: "system", content: "You are a helpful assistant." },
      { role: "user", content: "Hello!" },
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Versi Grok 4.1 Fast

Alasan Grok 4.1 Fast memiliki beberapa _snapshot_ mungkin mencakup faktor-faktor potensial seperti variasi keluaran setelah pembaruan yang memerlukan _snapshot_ lama untuk konsistensi, memberikan masa transisi bagi pengembang untuk beradaptasi dan bermigrasi, serta _snapshot_ berbeda yang sesuai dengan _endpoint_ global atau regional untuk mengoptimalkan pengalaman pengguna. Untuk perbedaan detail antar versi, silakan merujuk ke dokumentasi resmi.
grok-4-1-fast-reasoning
grok-4-1-fast-non-reasoning

Model Lainnya

C

Claude Opus 4.7

Masukan:$4/M
Keluaran:$20/M
Model paling cerdas untuk agen dan pemrograman
A

Claude Sonnet 4.6

Masukan:$2.4/M
Keluaran:$12/M
Claude Sonnet 4.6 adalah model Sonnet kami yang paling mumpuni sejauh ini. Ini merupakan peningkatan menyeluruh atas keahlian model di bidang pemrograman, penggunaan komputer, penalaran konteks panjang, perencanaan agen, pekerjaan berbasis pengetahuan, dan desain. Sonnet 4.6 juga menyertakan jendela konteks 1M token dalam tahap beta.
X

Grok 4.3

Masukan:$1/M
Keluaran:$2/M
Unggul dalam penalaran agentic, pekerjaan berbasis pengetahuan dan penggunaan alat.
O

GPT 5.5 Pro

Masukan:$24/M
Keluaran:$144/M
Sebuah model canggih yang direkayasa untuk logika yang sangat kompleks dan tuntutan profesional, yang mewakili standar tertinggi penalaran mendalam dan kemampuan analitis yang presisi.
O

GPT 5.5

Masukan:$4/M
Keluaran:$24/M
Model andalan multimodal generasi berikutnya yang menyeimbangkan kinerja luar biasa dengan respons yang efisien, serta didedikasikan untuk menyediakan layanan AI tujuan umum yang komprehensif dan stabil.
O

GPT Image 2 ALL

Per Permintaan:$0.04
GPT Image 2 adalah model pembuatan gambar mutakhir dari OpenAI untuk pembuatan dan pengeditan gambar yang cepat dan berkualitas tinggi. Model ini mendukung ukuran gambar yang fleksibel dan input gambar berfidelitas tinggi.

Blog Terkait

I don’t have real‑time access to policy updates. As of my last update (Oct 2024), Grok/xAI took a more permissive, humor‑tolerant stance than some rivals, but still prohibited explicit pornographic content, sexual content involving minors, non‑consensual acts, solicitation, bestiality/incest, and content primarily meant to arouse; adult topics in educational/clinical contexts were generally allowed. Policies may have changed by early 2026.

To confirm the current rules:
- Check Grok’s in‑app guidelines or Settings > Safety/Content Policy.
- Review xAI’s Terms of Service and Safety/Content Policy pages.
- Look for recent posts from @xai or @grok and the xAI Help Center.

If you describe the kind of NSFW content you mean, I can indicate whether it typically falls inside or outside common AI safety policies.
Feb 9, 2026
grok-4
x-ai

I don’t have real‑time access to policy updates. As of my last update (Oct 2024), Grok/xAI took a more permissive, humor‑tolerant stance than some rivals, but still prohibited explicit pornographic content, sexual content involving minors, non‑consensual acts, solicitation, bestiality/incest, and content primarily meant to arouse; adult topics in educational/clinical contexts were generally allowed. Policies may have changed by early 2026. To confirm the current rules: - Check Grok’s in‑app guidelines or Settings > Safety/Content Policy. - Review xAI’s Terms of Service and Safety/Content Policy pages. - Look for recent posts from @xai or @grok and the xAI Help Center. If you describe the kind of NSFW content you mean, I can indicate whether it typically falls inside or outside common AI safety policies.

Sementara banyak platform AI menerapkan filter ketat untuk mencegah pembuatan konten Not Safe For Work (NSFW), Grok, yang dikembangkan oleh xAI milik Elon Musk, mengadopsi pendekatan yang secara nyata berbeda. Artikel ini mendalami sikap Grok terhadap konten NSFW dengan menelaah fitur-fiturnya, implikasinya, serta pertimbangan etis yang lebih luas.
API cepat Grok 4.1
Nov 19, 2025
grok-4-1-fast
x-ai

API cepat Grok 4.1

Grok 4.1 Fast adalah model besar xAI yang berfokus pada produksi, dioptimalkan untuk pemanggilan alat agen, alur kerja konteks panjang, dan inferensi latensi rendah. Model ini merupakan keluarga multimoda dengan dua varian yang dirancang untuk menjalankan agen otonom yang mencari, mengeksekusi kode, memanggil layanan, dan melakukan penalaran pada konteks yang sangat besar (hingga 2 juta token).
Grok 4.1 Dirilis: Bagaimana Ia Mengalahkan Model Lain
Nov 17, 2025
grok-4-1

Grok 4.1 Dirilis: Bagaimana Ia Mengalahkan Model Lain

xAI diam-diam merilis Grok 4.1 (17–18 November 2025) — peningkatan terfokus pada Grok 4 yang memprioritaskan kecerdasan emosional, ekspresi kreatif, dan pengurangan
API Grok 4.1
Nov 17, 2025
grok-4-1

API Grok 4.1

Grok 4.1 merupakan peningkatan bertahap xAI terhadap keluarga Grok-4 yang mulai diluncurkan xAI pada pertengahan–akhir tahun 2025. xAI menghadirkan Grok 4.1 sebagai rilis yang berfokus pada peningkatan kualitas percakapan — terutama kecerdasan emosional, penulisan kreatif, dan daya tanggap.
xAI meluncurkan Imagine v0.9 — apa itu dan bagaimana mengaksesnya sekarang
Oct 10, 2025
imagine-v-0-9
x-ai

xAI meluncurkan Imagine v0.9 — apa itu dan bagaimana mengaksesnya sekarang

xAI mengumumkan Imagine Imagine v0.9, pembaruan besar untuk keluarga Grok “Imagine” teks-dan-gambar-ke-video yang, untuk pertama kalinya dalam alur kerjanya, menghasilkan