關鍵功能(快速清單)
- 兩種模型變體:
grok-4-fast-reasoning和grok-4-fast-non-reasoning(可在深度與速度間調校)。 - 超大上下文視窗: 最多可達 2,000,000 tokens,支援超長文件 / 多小時的逐字稿 / 多文件工作流程。
- 著重 Token 效率 / 成本: xAI 報告平均 ~40% 更少的思考 token,並聲稱為達到相同基準表現成本降低 ~98%(以 xAI 報告的指標為準)。
- 原生工具 / 瀏覽整合: 經由針對工具使用的強化學習進行端到端訓練,涵蓋網頁 / X 瀏覽、程式碼執行與代理式搜尋行為。
- 多模態與函式呼叫: 支援影像與結構化輸出;API 支援函式呼叫與結構化回應格式。
技術細節
統一的推理架構: Grok-4-Fast 採用 單一模型權重基座,可透過系統提示或變體選擇引導為 推理(長鏈式思考)或 非推理(快速回覆)行為,而非提供兩個完全獨立的骨幹模型。這能在混合工作負載中降低切換延遲與 token 成本。
以強化學習提升智慧密度: xAI 報告使用 大規模強化學習 以 智慧密度(每個 token 的效能最大化)為重點,這是其所稱 Token 效率提升的基礎。
工具條件化與代理式搜尋: Grok-4-Fast 在需要呼叫工具(網頁瀏覽、X 搜尋、程式碼執行)的任務上進行訓練與評估。該模型被呈現為擅長判斷何時呼叫工具,以及如何將瀏覽所得證據串接進答案。
基準測試表現
在 BrowseComp(44.9% pass\@1,相較於 Grok-4 的 43.0%)、SimpleQA(95.0% 對 94.0%) 上有改進,並在某些中文語言的瀏覽 / 搜尋領域有大幅提升。xAI 亦報告 grok-4-fast-search 變體在 LMArena 的 Search Arena 中名列前茅。
典型與建議用例
- 高吞吐搜尋與檢索 — 適用於需要快速多跳網頁推理的搜尋代理。
- 代理式助理與機器人 — 可結合瀏覽、程式碼執行與非同步工具呼叫(在允許的情況下)。
- 對成本敏感的生產部署 — 需要大量呼叫,並希望相較於更重的基礎模型獲得更佳 token 對效用經濟性的服務。
- 開發者實驗 — 製作多模態或網路增強流程原型,仰賴快速且反覆的查詢。
- 如何存取 Grok 4 fast API
步驟 1:註冊取得 API 金鑰
登入 cometapi.com。若尚未成為用戶,請先註冊。登入你的 CometAPI 控制台。取得介面的存取憑證 API 金鑰。在個人中心的 API token 處點擊 “Add Token”,取得 token 金鑰:sk-xxxxx 並提交。
步驟 2:向 Grok 4 fast API 發送請求
選擇 “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” 端點發送 API 請求並設定請求體。請求方法與請求體可於我們的網站 API 文件取得。我們也提供 Apifox 測試以供便利。將 <YOUR_API_KEY> 替換為你帳戶中的實際 CometAPI 金鑰。base url is Chat format(https://api.cometapi.com/v1/chat/completions)。
在 content 欄位中插入你的問題或請求——模型將回應該內容。處理 API 回應以取得生成的答案。
步驟 3:擷取並驗證結果
處理 API 回應以取得生成的答案。處理完成後,API 會回傳任務狀態與輸出資料。

