模型定價企業
500+ AI 模型 API,全部整合在一個 API 中。就在 CometAPI
模型 API
開發者
快速入門說明文件API 儀表板
公司
關於我們企業
資源
AI模型部落格更新日誌支援
服務條款隱私政策
© 2026 CometAPI · All rights reserved
Home/Models/xAI/Grok 4 Fast
X

Grok 4 Fast

輸入:$0.16/M
輸出:$0.4/M
上下文:2M
最大輸出:30K
Grok 4 Fast 是由 xAI 推出的全新人工智慧模型,將推理與非推理能力整合於單一架構之中。此模型具有 2 million token 的上下文視窗,並為搜尋與程式碼撰寫等高吞吐量應用而設計。該模型提供兩個版本:Grok-4-Fast-Reasoning 與 Grok-4-Fast-Non-Reasoning,分別針對不同任務進行最佳化。
新
商業用途
Playground
概覽
功能
定價
API
版本

關鍵功能(快速清單)

  • 兩種模型變體: grok-4-fast-reasoning 和 grok-4-fast-non-reasoning(可在深度與速度間調校)。
  • 超大上下文視窗: 最多可達 2,000,000 tokens,支援超長文件 / 多小時的逐字稿 / 多文件工作流程。
  • 著重 Token 效率 / 成本: xAI 報告平均 ~40% 更少的思考 token,並聲稱為達到相同基準表現成本降低 ~98%(以 xAI 報告的指標為準)。
  • 原生工具 / 瀏覽整合: 經由針對工具使用的強化學習進行端到端訓練,涵蓋網頁 / X 瀏覽、程式碼執行與代理式搜尋行為。
  • 多模態與函式呼叫: 支援影像與結構化輸出;API 支援函式呼叫與結構化回應格式。

技術細節

統一的推理架構: Grok-4-Fast 採用 單一模型權重基座,可透過系統提示或變體選擇引導為 推理(長鏈式思考)或 非推理(快速回覆)行為,而非提供兩個完全獨立的骨幹模型。這能在混合工作負載中降低切換延遲與 token 成本。

以強化學習提升智慧密度: xAI 報告使用 大規模強化學習 以 智慧密度(每個 token 的效能最大化)為重點,這是其所稱 Token 效率提升的基礎。

工具條件化與代理式搜尋: Grok-4-Fast 在需要呼叫工具(網頁瀏覽、X 搜尋、程式碼執行)的任務上進行訓練與評估。該模型被呈現為擅長判斷何時呼叫工具,以及如何將瀏覽所得證據串接進答案。

基準測試表現

在 BrowseComp(44.9% pass\@1,相較於 Grok-4 的 43.0%)、SimpleQA(95.0% 對 94.0%) 上有改進,並在某些中文語言的瀏覽 / 搜尋領域有大幅提升。xAI 亦報告 grok-4-fast-search 變體在 LMArena 的 Search Arena 中名列前茅。

典型與建議用例

  • 高吞吐搜尋與檢索 — 適用於需要快速多跳網頁推理的搜尋代理。
  • 代理式助理與機器人 — 可結合瀏覽、程式碼執行與非同步工具呼叫(在允許的情況下)。
  • 對成本敏感的生產部署 — 需要大量呼叫,並希望相較於更重的基礎模型獲得更佳 token 對效用經濟性的服務。
  • 開發者實驗 — 製作多模態或網路增強流程原型,仰賴快速且反覆的查詢。
  • 如何存取 Grok 4 fast API

步驟 1:註冊取得 API 金鑰

登入 cometapi.com。若尚未成為用戶,請先註冊。登入你的 CometAPI 控制台。取得介面的存取憑證 API 金鑰。在個人中心的 API token 處點擊 “Add Token”,取得 token 金鑰:sk-xxxxx 並提交。

步驟 2:向 Grok 4 fast API 發送請求

選擇 “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” 端點發送 API 請求並設定請求體。請求方法與請求體可於我們的網站 API 文件取得。我們也提供 Apifox 測試以供便利。將 <YOUR_API_KEY> 替換為你帳戶中的實際 CometAPI 金鑰。base url is Chat format(https://api.cometapi.com/v1/chat/completions)。

在 content 欄位中插入你的問題或請求——模型將回應該內容。處理 API 回應以取得生成的答案。

步驟 3:擷取並驗證結果

處理 API 回應以取得生成的答案。處理完成後,API 會回傳任務狀態與輸出資料。

Grok 4 Fast 的功能

探索 Grok 4 Fast 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

Grok 4 Fast 的定價

探索 Grok 4 Fast 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 Grok 4 Fast 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)官方價格 (USD / M Tokens)折扣
輸入:$0.16/M
輸出:$0.4/M
輸入:$0.2/M
輸出:$0.5/M
-20%

Grok 4 Fast 的範例程式碼和 API

存取完整的範例程式碼和 API 資源,以簡化您的 Grok 4 Fast 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 Grok 4 Fast 的潛力。
POST
/v1/chat/completions

Grok 4 Fast的版本

Grok 4 Fast擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。

xAI 公布的公開名稱:grok-4-fast-reasoning 與 grok-4-fast-non-reasoning。每個變體均標示相同的 200 萬 token 上下文限制。該平台也持續提供較早的 Grok-4 旗艦模型(例如先前使用的 grok-4-0709 變體)。

更多模型

C

Claude Opus 4.7

輸入:$3/M
輸出:$15/M
用於智能體與程式設計的最智能模型
A

Claude Sonnet 4.6

輸入:$2.4/M
輸出:$12/M
Claude Sonnet 4.6 是我們迄今為止最強大的 Sonnet 模型。它對模型在程式設計、電腦操作、長上下文推理、代理規劃、知識工作與設計等方面的能力進行了全面升級。Sonnet 4.6 亦提供 1M 詞元的上下文視窗,目前處於 Beta 階段。
O

GPT-5.4 nano

輸入:$0.16/M
輸出:$1/M
GPT-5.4 nano 專為速度與成本最為關鍵的任務而設計,例如分類、資料擷取、排序與子智能體。
O

GPT-5.4 mini

輸入:$0.6/M
輸出:$3.6/M
GPT-5.4 mini 將 GPT-5.4 的優勢帶入一個更快速、更高效、專為大量工作負載設計的模型。
X

Grok 4.20

輸入:$1.6/M
輸出:$4.8/M
Grok 4.20 版本引入了多代理架構(多個專門化代理在即時協調下協同運作)、擴充的上下文模式,並在指令遵循、降低幻覺,以及結構化/工具化輸出方面進行了重點改進。
Q

Qwen3.6-Plus

輸入:$0.32/M
輸出:$1.92/M
Qwen 3.6-Plus 現已推出,具備增強的程式開發能力與在多模態辨識與推理方面更高的效率,進一步提升 Vibe Coding 的體驗。

相關部落格

如何使用 z-image 製作 NSFW 內容?你需要的最佳指南
Jan 7, 2026

如何使用 z-image 製作 NSFW 內容?你需要的最佳指南

Alibaba’s Tongyi Lab 正式發布了 Z-Image,這是一款擁有60億參數的開源圖像生成模型,目前正在席捲 AI 社群。於 2025 年末發布的 Z-Image,已迅速在許多本地用戶眼中取代了過去的熱門之選,如 Flux 和 SDXL。
Grok 4.1 快速 API
Nov 19, 2025
grok-4-1-fast
x-ai

Grok 4.1 快速 API

Grok 4.1 Fast 是 xAI 面向生產環境的大型模型,針對智能體工具呼叫、長上下文工作流程和低延遲推理進行了最佳化。它是一個多模態、雙變體系列,旨在運行自主智能體,這些智能體可以搜尋、執行程式碼、調用服務,並在極其龐大的上下文(高達 2 萬個 token)中進行推理。