xAI宣布 Grok 4 快速是 Grok 系列的成本優化版本,該公司表示,它提供了接近旗艦級的基準性能,同時透過降低價格實現了這一性能 98% 與 Grok 4 相比。新模型專為高吞吐量搜尋和代理工具使用而設計,包括一個 2 萬個令牌上下文視窗和單獨的「推理」和「非推理」變體,以讓開發人員根據自己的需求調整計算。
核心功能和優勢
成本效益推理模型: Grok 4 Fast 是基於 Grok 4 系列構建的,專注於代幣效率和即時工具的使用。 xAI 報告稱,該模型大約需要 「思考」代幣減少 40% 平均而言。人工智慧分析(透過追蹤許多公共模型的延遲、輸出速度和性價比)將 Grok 4 Fast 置於智慧與成本前沿的高度,並在早期測試中證實了該模型的快速輸出速度和有利的成本比。

大型上下文視窗: Grok 4 Fast 專為高吞吐量搜尋和代理工具使用而設計,包含一個 2 萬個令牌上下文視窗和單獨的「推理」和「非推理」變體,以讓開發人員根據自己的需求調整計算。
本機工具使用功能: Grok 4 Fast 提供“尖端的 Web 和 X 搜尋功能”,可改善代理工作流程期間 Web 內容的檢索、導航和合成——將 Grok 4 Fast 定位為需要實時收集信息和推理長文檔的應用程序的實用搜索工具,在多個搜索基準上表現領先,包括:
- BrowseComp (zh):51.2%(相對於 Grok 4 的 45.0%)
- X Bench Deepsearch (zh):74.0%(對比 Grok 4 的 66.0%)
統一架構: 同一模型支援推理和非推理模式,無需單獨切換模型。降低延遲和成本,適用於即時應用(例如搜尋、問答和研究輔助)。
性能比較(主要基準)
在 xAI 分享的私人 LMArena 測試中, grok-4-fast-search (代號 門洛) 變體在搜尋競技場中名列前茅,Elo 評級為 1,163,而文字變體(塔霍) 位居 Text Arena 前十名——xAI 使用這個結果來支持其關於搜尋效能的聲明。
Grok 4 在多個前沿基準測試(例如:GPQA Diamond、AIME 2025 和 HMMT 2025)上快速匹配或緊接著 Grok 4,同時在推理任務上優於之前較小的模型——xAI 使用這些證據來證明「可比性能」的說法。

比較結果
與 Grok 4 相比:更便宜、計算強度更低,但性能相似。
與 Grok 3 Mini 相比:功能更強大,能夠進行複雜的推理和即時搜尋。
與 GPT-5/Gemini/Claude 相比:得益於其極高的 token 效率和工具能力,在性價比和部分搜尋任務上領先。
定價與供貨
上下文和標記: 兩種模型風格: grok-4-fast-reasoning grok-4-fast-non-reasoning,每個都有 2M 上下文。
發布貼文中公佈的(清單)價格(範例等級):
- 輸入標記:
0.20 / 1 萬** (<128k)— **0.40 / 1 萬 (≥128k) - 輸出令牌:
0.50 / 1 萬** (<128k)— **1.00 / 1 萬 (≥128k) - 緩存的輸入令牌: $0.05 / 1 萬.
(有關確切的計費規則和任何限時促銷活動,請參閱 xAI 公告。)
提供者可用性: xAI 列出了透過 OpenRouter 和 Vercel AI Gateway 提供的短期免費可用性以及透過 xAI 的 API 提供的一般可用性。
這對用戶和團隊意味著什麼
- 為生產使用節省大量成本 更低的單價和更少的「思考」代幣意味著團隊可以以 Grok 4 一小部分的成本運行更多查詢或更大上下文的工作流程,從而大大降低了實驗和規模部署的門檻。 (此說法得到了 xAI 成本/效能揭露和第三方成本分析的支持。)
- 適用於非常長的文檔和多步驟推理 — 2M 個令牌使得在單一會話中攝取整本書、大型程式碼庫或長篇法律/技術檔案變得切實可行,從而提高了需要長期上下文的任務(文件搜尋、摘要、長格式程式碼產生、研究助理)的準確性和連貫性。
- 為互動式應用程式提供更快、更低延遲的輸出 — 作為「快速」版本,它旨在實現更快的令牌吞吐量和更低的延遲,這有利於聊天使用者介面、編碼助理以及即時代理循環等對回應速度至關重要的應用。 (人工智慧分析和提供者基準測試強調輸出速度是其差異化因素。)
- 對於基準推理任務來說,性價比較高 — 對於透過前沿學術基準來評判模型的團隊來說,Grok 4 Fast 提供了一個強有力的折衷方案:以極低的成本實現接近前沿的準確性,這對於經常運行昂貴基準套件的研究實驗室和公司來說具有吸引力。
總結:
Grok 4 Fast 讓 xAI 在性價比和以搜尋為中心的代理應用方面更具競爭力。如果該公司宣稱的效率和驗證能力在獨立的特定領域測試中得到證實,Grok 4 Fast 可能會重塑高效能、工具支援的 LLM 部署的成本預期,尤其是那些依賴即時 Web 檢索和多步驟工具使用的應用程式。
入門
CometAPI 是一個統一的 API 平台,它將來自領先供應商(例如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)的 500 多個 AI 模型聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。
開發人員可以訪問 Grok-4-fast ( 模型: grok-4-fast-reasoning” / “grok-4-fast-reasoning)透過 CometAPI, 最新型號版本 始終與官方網站同步更新。首先,探索該模型的功能 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。
準備出發了嗎? → 立即註冊 CometAPI !


