Grok-4-Fast 是 xAI 的 新的成本效益推理模型 旨在為消費者和開發者提供更便宜、更快速的高品質推理和網路搜尋功能。 xAI 將其定位為 邊疆 該產品保留了 Grok-4 的基準性能,同時提高了代幣效率,並提供了兩種版本,分別針對 推理 or 非推理 工作量。
主要特點(快速清單)
- 兩種型號:
grok-4-fast-reasoninggrok-4-fast-non-reasoning(可根據深度和速度進行調整)。 - 非常大的上下文視窗: 到 2,000,000令牌,支援極長的文檔/多小時的記錄/多文檔工作流程。
- 代幣效率/成本重點: xAI 報告~思考標記減少 40% 平均而言,與 Grok-4 相比,並聲稱 實現相同基準性能的成本降低約 98% (根據 xAI 報告的指標)。
- 本機工具/瀏覽整合: 使用工具使用 RL 進行端對端訓練,用於 Web/X 瀏覽、程式碼執行和代理搜尋行為。
- 多模式和函數呼叫: 支援影像和結構化輸出;API 支援函數呼叫和結構化回應格式。
技術細節
統一推理架構: Grok-4-Fast 使用 單一模型權重基 可以引導 推理 (長鏈思維)或 非推理 透過系統提示或變體選擇來簡化(快速回應)行為,而不是運送兩個完全獨立的骨幹模型。這減少了混合工作負載的切換延遲和令牌成本。
強化學習提高智能密度: xAI 報告使用 大規模強化學習 專注於 智力密度 (最大化每個令牌的效能),這是所述令牌效率增益的基礎。
工具調節和代理搜尋: Grok-4-Fast 已針對需要呼叫工具的任務(網頁瀏覽、X 搜尋、程式碼執行)進行了訓練和評估。該模型擅長 選擇 何時調用工具以及如何將瀏覽證據拼接成答案。
基準性能
IBrowseComp 的改進(通過率@1 為 44.9%,而 Grok-4 為 43.0%), SimpleQA(95.0% vs 94.0%),並在某些中文瀏覽/搜尋領域取得了巨大進步。 xAI 還報告稱,在 LMArena 的搜尋領域中, grok-4-fast-search 變種。

模型版本和命名
xAI 公佈的公開名稱: grok-4-fast-reasoning grok-4-fast-non-reasoning. 每個變體報告相同的 2M代幣 上下文限制。該平台也繼續承載早期的 格羅克-4 旗艦(例如, grok-4-0709 變體)。
限制和安全考慮
- 內容安全問題: 調查機構的報告表明,xAI 的 Grok 系列(以及部分 Grok 功能)在開發時使用了較為寬鬆的內容選項,並且一些內部工作流程導致註釋者接觸到令人極度不安的內容。人們對審核的穩健性以及向當局舉報非法內容有明確的擔憂。在生產環境中部署任何 Grok 版本時,這些安全性和合規性問題都至關重要。
- 獨立驗證: xAI 的許多性能/經濟性聲明均為自行報告;獨立基準測試和同行評審仍在發布中。在第三方可複製之前,成本效益聲明應視為供應商提供。
- 操作風險: 由於 Grok-4-Fast 是為代理瀏覽而設計的,因此使用者應注意 幻覺, 數據新鮮度限制 (儘管具有瀏覽功能),並且 隱私 當模型與外部工具或即時網路查詢一起使用時的注意事項。
典型和推薦的用例
- 高通量搜尋和檢索 — 需要快速多跳網路推理的搜尋代理。
- 代理助理和機器人 — 結合瀏覽、程式碼執行和非同步工具呼叫(在允許的情況下)的代理程式。
- 成本敏感的生產部署 — 需要多次調用並希望改進代幣到效用經濟學而非更重的基礎模型的服務。
- 開發人員實驗 — 原型化依賴快速、重複查詢的多模式或網路增強流程。
如何致電 grok-4-fast 來自 CometAPI 的 API
grok-code-fast-1 CometAPI 中的 API 定價,比官方價格便宜 20%:
| grok-4-快速非推理 | 輸入代幣:$0.16/百萬代幣 輸出代幣:0.40 美元/百萬代幣 |
| grok-4-快速推理 | 輸入代幣:$0.16/百萬代幣 輸出代幣:0.40 美元/百萬代幣 |
所需步驟
- 登錄到 cometapi.com。如果您還不是我們的用戶,請先註冊
- 取得介面的存取憑證API key。在個人中心的API token處點選“新增Token”,取得Token金鑰:sk-xxxxx並提交。
使用方法
- 選擇“
grok-4-fast-reasoning” /“grok-4-fast-reasoning「端點發送 API 請求並設定請求體。請求方法和請求體可從我們網站的 API 文件中取得。為了方便您使用,我們網站也提供了 Apifox 測試。 - 代替使用您帳戶中的實際 CometAPI 金鑰。
- 將您的問題或請求插入內容欄位 - 這是模型將會回應的內容。
- 。處理 API 回應以取得產生的答案。
CometAPI 提供完全相容的 REST API,以實現無縫遷移。關鍵細節如下: API 文件:
- 基本網址: https://api.cometapi.com/v1/chat/completions
- 型號名稱:“
grok-4-fast-reasoning” /“grok-4-fast-reasoning“ - 驗證: Bearer 令牌透過
Authorization: Bearer YOUR_CometAPI_API_KEY頭 - 內容類型:
application/json.
API 整合和範例
Python 程式碼片段 聊天完成 透過 CometAPI 呼叫:
pythonimport openai
openai.api_key = "YOUR_CometAPI_API_KEY"
openai.api_base = "https://api.cometapi.com/v1/chat/completions"
messages = [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize grok-4-fast's main features."}
]
response = openai.ChatCompletion.create(
model="grok-4-fast-reasoning",
messages=messages,
temperature=0.7,
max_tokens=500
)
print(response.choices.message)
參見 格洛克4
