模型定價企業
500+ AI 模型 API,全部整合在一個 API 中。就在 CometAPI
模型 API
開發者
快速入門說明文件API 儀表板
公司
關於我們企業
資源
AI模型部落格更新日誌支援
服務條款隱私政策
© 2026 CometAPI · All rights reserved
Home/Models/xAI/Grok 4.1 Fast
X

Grok 4.1 Fast

輸入:$0.16/M
輸出:$0.4/M
上下文:2M
最大輸出:30K
Grok 4.1 Fast 是 xAI 面向生產環境的大型模型,針對代理式工具呼叫、長上下文工作流程與低延遲推論進行了最佳化。它是一個多模態、雙變體的模型家族,旨在運行能夠搜尋、執行程式碼、呼叫服務,並在極大上下文(最高可達 2 million tokens)中進行推理的自主代理。
新
商業用途
Playground
概覽
功能
定價
API
版本

關鍵功能

  • 兩種變體: grok-4-1-fast-reasoning (thinking / agentic) 和 grok-4-1-fast-non-reasoning (instant “Fast” responses)。
  • 超大上下文窗口: 2,000,000 tokens — 為多小時轉錄、大型文件集與長多輪規劃而設計。
  • 第一方 Agent Tools API: 內建 web/X 瀏覽、伺服端程式碼執行、檔案搜尋與 “MCP” 連接器,讓模型可在無需外部膠合的情況下作為自主代理運作。
  • 模態: 多模態(文字 + 影像,並升級視覺能力,包括圖表分析與 OCR 級別擷取)。

Grok 4.1 Fast 如何運作?

  • 架構與模式: Grok 4.1 Fast 作為單一模型家族提供,可配置為「reasoning」(內部思維鏈與更高層次的審慎推理)或非推理的「fast」模式以獲得更低延遲。可在如 CometAPI 等供應層透過 API 參數(例如 reasoning.enabled)開啟或關閉推理模式。
  • 訓練訊號: xAI 報告在模擬的代理環境中進行強化學習(重工具訓練),以提升長期、多輪工具呼叫任務的表現(他們提到在 τ²-bench Telecom 與長上下文 RL 上的訓練)。
  • 工具協調: 工具在 xAI 基礎設施上執行;Grok 能並行調用多個工具,並在多輪對話中制定代理計劃(網頁搜尋、X 搜尋、程式碼執行、檔案擷取、MCP 伺服器)。
  • 吞吐量與速率限制: 發布的示例上限包括 grok-4-1-fast-reasoning 叢集的 480 requests/minute 與 4,000,000 tokens/minute。

Grok 4.1 fast 模型版本與命名

  • grok-4-1-fast-reasoning — 「思考」代理模式:內部推理 tokens、工具協調,適用於複雜多步工作流程。
  • grok-4-1-fast-non-reasoning — 即時「Fast」模式:最小化內部思考 tokens,降低延遲,適合聊天、腦暴、短篇寫作。

Grok 4.1 fast 基準測試表現

xAI 強調相較於先前的 Grok 版本與部分競品,在多項基準中取得勝出與實測改進。重點發布數據:

  • τ²-bench(電信代理工具基準): 報告 100% 分數,總成本 $105。
  • Berkeley Function Calling v4: 報告 72% 整體準確率(xAI 發布數字),在該基準情境中的總報告成本約為 ~$400。
  • Research & agentic search(Research-Eval / Reka / X Browse): xAI 報告在內部/業界的代理搜尋基準上,分數更高且成本更低(例如:Grok 4.1 Fast 在 Research-Eval 與 X Browse 的分數顯著高於 GPT-5 與 Claude Sonnet 4.5,見 xAI 發布表格)。
  • 事實性/幻覺: 相較 Grok 4 Fast,Grok 4.1 Fast 在 FActScore 與相關內部指標上將幻覺率減半。

Grok 4.1 fast 限制與風險

  • 幻覺減少但未消除。 雖然發布的降低幅度顯著(xAI 報告相較先前 Grok 4 Fast 大幅減少幻覺),但在邊緣情境與快速回應流程中仍可能出錯——對關鍵任務輸出請獨立驗證。
  • 工具信任面: 伺服端工具帶來便利,也擴大攻擊面(工具誤用、外部結果錯誤或來源過時)。請採用來源驗證與護欄;將自動化工具輸出視為需核實的證據。
  • 並非通用的 SOTA: 評測顯示 Grok 系列在 STEM、推理與長上下文代理任務上表現出色,但在最新的一些多模態視覺理解與創意生成任務上,可能落後於其他供應商的最新產品。

Grok 4.1 fast 與其他領先模型的比較

  • 相較 Grok 4 / Grok 4.1(非 Fast): Fast 在延遲與 token 經濟上以犧牲部分內部運算/「思考」開銷為代價,同時力求將推理品質維持在接近 Grok 4 的水準;它針對生產環境中的代理型使用優化,而非離線重型基準上的原始峰值推理。([xAI][5])
  • 相較 Google Gemini 系列 / OpenAI GPT 系列 / Anthropic Claude: 獨立評測與科技媒體指出,Grok 在邏輯推理、工具呼叫與長上下文處理方面具優勢,而其他供應商有時在多模態視覺、創意生成或不同的價格/效能權衡上更具領先。
  • 如何存取 Grok 4.1 fast API

步驟 1:註冊取得 API 金鑰

登入 cometapi.com。若您尚未成為我們的使用者,請先註冊。登入您的 CometAPI 控制台。取得介面的存取憑證 API key。在個人中心的 API token 中點擊 “Add Token”,取得 token key:sk-xxxxx,並提交。

步驟 2:向 Grok 4.1 fast API 發送請求

選擇 “\grok-4-1-fast-reasoning/ grok-4-1-fast-non-reasoning\” 端點發送 API 請求並設定請求體。請求方法與請求體可從我們網站的 API 文件取得。我們的網站也提供 Apifox 測試以利使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。base url is Chat format(https://api.cometapi.com/v1/chat/completions)。

將您的問題或請求填入 content 欄位——模型會對此作出回應。處理 API 回應以取得生成的答案。

步驟 3:擷取並驗證結果

處理 API 回應以取得生成的答案。處理後,API 會回傳任務狀態與輸出資料。

Grok 4.1 Fast 的功能

探索 Grok 4.1 Fast 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

Grok 4.1 Fast 的定價

探索 Grok 4.1 Fast 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 Grok 4.1 Fast 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)官方價格 (USD / M Tokens)折扣
輸入:$0.16/M
輸出:$0.4/M
輸入:$0.2/M
輸出:$0.5/M
-20%

Grok 4.1 Fast 的範例程式碼和 API

存取完整的範例程式碼和 API 資源,以簡化您的 Grok 4.1 Fast 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 Grok 4.1 Fast 的潛力。
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="grok-4-1-fast-non-reasoning",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="grok-4-1-fast-non-reasoning",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const BASE_URL = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey: COMETAPI_KEY,
  baseURL: BASE_URL,
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "grok-4-1-fast-non-reasoning",
    messages: [
      { role: "system", content: "You are a helpful assistant." },
      { role: "user", content: "Hello!" },
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Curl Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const BASE_URL = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey: COMETAPI_KEY,
  baseURL: BASE_URL,
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "grok-4-1-fast-non-reasoning",
    messages: [
      { role: "system", content: "You are a helpful assistant." },
      { role: "user", content: "Hello!" },
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Grok 4.1 Fast的版本

Grok 4.1 Fast擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。
grok-4-1-fast-reasoning
grok-4-1-fast-non-reasoning

更多模型

C

Claude Opus 4.7

輸入:$4/M
輸出:$20/M
用於智能體與程式設計的最智能模型
A

Claude Sonnet 4.6

輸入:$2.4/M
輸出:$12/M
Claude Sonnet 4.6 是我們迄今為止最強大的 Sonnet 模型。它對模型在程式設計、電腦操作、長上下文推理、代理規劃、知識工作與設計等方面的能力進行了全面升級。Sonnet 4.6 亦提供 1M 詞元的上下文視窗,目前處於 Beta 階段。
X

Grok 4.3

輸入:$1/M
輸出:$2/M
擅長代理式推理、知識工作與工具使用。
O

GPT 5.5 Pro

輸入:$24/M
輸出:$144/M
一款專為極其複雜的邏輯與專業需求而設計的先進模型,代表深度推理與精準分析能力的最高標準。
O

GPT 5.5

輸入:$4/M
輸出:$24/M
新一代多模態旗艦模型,兼顧卓越效能與高效回應,致力於提供全面而穩定的通用型 AI 服務。
O

GPT Image 2 ALL

每次請求:$0.04
GPT Image 2 是 OpenAI 的最先進影像生成模型,適用於快速且高品質的影像生成與編輯。它支援彈性的影像尺寸與高保真度的影像輸入。

相關部落格

Grok 現在(截至 2026 年初)是否允許 NSFW?
Feb 9, 2026
grok-4
x-ai

Grok 現在(截至 2026 年初)是否允許 NSFW?

儘管許多 AI 平台為防止生成不適合在工作場合(NSFW)的內容而實施嚴格的過濾機制,由 Elon Musk 的 xAI 開發的 Grok 則採取了顯著不同的做法。本文深入探討 Grok 對 NSFW 內容的立場,並檢視其特點、影響,以及更廣泛的倫理考量。
Grok 4.1 快速 API
Nov 19, 2025
grok-4-1-fast
x-ai

Grok 4.1 快速 API

Grok 4.1 Fast 是 xAI 面向生產環境的大型模型,針對智能體工具呼叫、長上下文工作流程和低延遲推理進行了最佳化。它是一個多模態、雙變體系列,旨在運行自主智能體,這些智能體可以搜尋、執行程式碼、調用服務,並在極其龐大的上下文(高達 2 萬個 token)中進行推理。
Grok 4.1 發布:它如何碾壓其他型號
Nov 17, 2025
grok-4-1

Grok 4.1 發布:它如何碾壓其他型號

xAI悄悄發布了Grok 4.1(2025年11月17日至18日)——這是Grok 4的升級版,重點提升了情緒智商、創造性表達和減少
Grok 4.1 API
Nov 17, 2025
grok-4-1

Grok 4.1 API

Grok 4.1 是 xAI 對 Grok-4 系列的漸進式升級,xAI 於 2025 年中後期開始推出該系列。 xAI 將 Grok 4.1 定位為專注於提高對話品質的版本——尤其是在情緒智商、創意寫作和回應能力方面。
xAI 發布 Imagine v0.9 — 它是什麼以及如何訪問
Oct 10, 2025
imagine-v-0-9
x-ai

xAI 發布 Imagine v0.9 — 它是什麼以及如何訪問

xAI 宣布推出 Imagine Imagine v0.9,這是 Grok “Imagine” 文字和圖像轉影片系列的一次重大更新,首次在其產品線中生成