關鍵功能（快速清單）

兩種模型變體： grok-4-fast-reasoning 和 grok-4-fast-non-reasoning（可在深度與速度間調校）。
超大上下文視窗： 最多可達 2,000,000 tokens，支援超長文件 / 多小時的逐字稿 / 多文件工作流程。
著重 Token 效率 / 成本： xAI 報告平均 ~40% 更少的思考 token，並聲稱為達到相同基準表現成本降低 ~98%（以 xAI 報告的指標為準）。
原生工具 / 瀏覽整合： 經由針對工具使用的強化學習進行端到端訓練，涵蓋網頁 / X 瀏覽、程式碼執行與代理式搜尋行為。
多模態與函式呼叫： 支援影像與結構化輸出；API 支援函式呼叫與結構化回應格式。

技術細節

統一的推理架構： Grok-4-Fast 採用 單一模型權重基座，可透過系統提示或變體選擇引導為推理（長鏈式思考）或 非推理（快速回覆）行為，而非提供兩個完全獨立的骨幹模型。這能在混合工作負載中降低切換延遲與 token 成本。

以強化學習提升智慧密度： xAI 報告使用 大規模強化學習 以 智慧密度（每個 token 的效能最大化）為重點，這是其所稱 Token 效率提升的基礎。

工具條件化與代理式搜尋： Grok-4-Fast 在需要呼叫工具（網頁瀏覽、X 搜尋、程式碼執行）的任務上進行訓練與評估。該模型被呈現為擅長判斷何時呼叫工具，以及如何將瀏覽所得證據串接進答案。

基準測試表現

在 BrowseComp（44.9% pass\@1，相較於 Grok-4 的 43.0%）、SimpleQA（95.0% 對 94.0%） 上有改進，並在某些中文語言的瀏覽 / 搜尋領域有大幅提升。xAI 亦報告 grok-4-fast-search 變體在 LMArena 的 Search Arena 中名列前茅。

典型與建議用例

高吞吐搜尋與檢索 — 適用於需要快速多跳網頁推理的搜尋代理。
代理式助理與機器人 — 可結合瀏覽、程式碼執行與非同步工具呼叫（在允許的情況下）。
對成本敏感的生產部署 — 需要大量呼叫，並希望相較於更重的基礎模型獲得更佳 token 對效用經濟性的服務。
開發者實驗 — 製作多模態或網路增強流程原型，仰賴快速且反覆的查詢。
如何存取 Grok 4 fast API

步驟 1：註冊取得 API 金鑰

登入 cometapi.com。若尚未成為用戶，請先註冊。登入你的 CometAPI 控制台。取得介面的存取憑證 API 金鑰。在個人中心的 API token 處點擊 “Add Token”，取得 token 金鑰：sk-xxxxx 並提交。

步驟 2：向 Grok 4 fast API 發送請求

選擇 “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” 端點發送 API 請求並設定請求體。請求方法與請求體可於我們的網站 API 文件取得。我們也提供 Apifox 測試以供便利。將 <YOUR_API_KEY> 替換為你帳戶中的實際 CometAPI 金鑰。base url is Chat format(https://api.cometapi.com/v1/chat/completions)。

在 content 欄位中插入你的問題或請求——模型將回應該內容。處理 API 回應以取得生成的答案。

步驟 3：擷取並驗證結果

處理 API 回應以取得生成的答案。處理完成後，API 會回傳任務狀態與輸出資料。

Grok 4 Fast 的定價

探索 Grok 4 Fast 的競爭性定價，專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費，讓您能夠隨著需求增長輕鬆擴展。了解 Grok 4 Fast 如何在保持成本可控的同時提升您的專案效果。

彗星價格 (USD / M Tokens)	官方價格 (USD / M Tokens)	折扣
輸入:$0.16/M 輸出:$0.4/M	輸入:$0.2/M 輸出:$0.5/M	-20%

Grok 4 Fast的版本

Grok 4 Fast擁有多個快照的原因可能包括：更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期，以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。

xAI 公布的公開名稱：grok-4-fast-reasoning 與 grok-4-fast-non-reasoning。每個變體均標示相同的 200 萬 token 上下文限制。該平台也持續提供較早的 Grok-4 旗艦模型（例如先前使用的 grok-4-0709 變體）。

關鍵功能（快速清單）

兩種模型變體： grok-4-fast-reasoning 和 grok-4-fast-non-reasoning（可在深度與速度間調校）。
超大上下文視窗： 最多可達 2,000,000 tokens，支援超長文件 / 多小時的逐字稿 / 多文件工作流程。
著重 Token 效率 / 成本： xAI 報告平均 ~40% 更少的思考 token，並聲稱為達到相同基準表現成本降低 ~98%（以 xAI 報告的指標為準）。
原生工具 / 瀏覽整合： 經由針對工具使用的強化學習進行端到端訓練，涵蓋網頁 / X 瀏覽、程式碼執行與代理式搜尋行為。
多模態與函式呼叫： 支援影像與結構化輸出；API 支援函式呼叫與結構化回應格式。

技術細節

以強化學習提升智慧密度： xAI 報告使用 大規模強化學習 以 智慧密度（每個 token 的效能最大化）為重點，這是其所稱 Token 效率提升的基礎。

基準測試表現

典型與建議用例

高吞吐搜尋與檢索 — 適用於需要快速多跳網頁推理的搜尋代理。
代理式助理與機器人 — 可結合瀏覽、程式碼執行與非同步工具呼叫（在允許的情況下）。
對成本敏感的生產部署 — 需要大量呼叫，並希望相較於更重的基礎模型獲得更佳 token 對效用經濟性的服務。
開發者實驗 — 製作多模態或網路增強流程原型，仰賴快速且反覆的查詢。
如何存取 Grok 4 fast API

步驟 1：註冊取得 API 金鑰

步驟 2：向 Grok 4 fast API 發送請求

在 content 欄位中插入你的問題或請求——模型將回應該內容。處理 API 回應以取得生成的答案。

步驟 3：擷取並驗證結果

處理 API 回應以取得生成的答案。處理完成後，API 會回傳任務狀態與輸出資料。

Grok 4 Fast

更多模型

Claude Opus 4.7

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Grok 4.20

Qwen3.6-Plus

相關部落格

如何使用 z-image 製作 NSFW 內容？你需要的最佳指南

Grok 4.1 快速 API