Grok-4.20 Beta 的技術規格

項目	Grok-4.20 Beta（公開規格）
模型系列	Grok-4 系列
開發者	xAI
發佈狀態	Beta（首次推送 2026 年 2 月 17 日）
輸入類型	文字、影像、影片
輸出類型	文字輸出（支援結構化輸出與函式/工具呼叫）。
上下文視窗	最多 2,000,000 個 token
架構	多代理協作式推理
工具支援	函式呼叫、結構化輸出
推理	內建推理能力
訓練基礎設施	Colossus 超級叢集（約 200,000 個 GPU）
模型變體	grok-4.20-multi-agent-beta-0309, grok-4.20-beta-0309-reasoning, grok-4.20-beta-0309-non-reasoning.

什麼是 Grok-4.20 Beta

Grok-4.20 Beta 是由 xAI 開發、Grok-4 家族中最新的實驗性版本。它聚焦於代理型推理、極長上下文處理與高速推理，旨在以比早期 Grok 模型更低的幻覺率提供精準答案。

與早期採用單一模型推理的 Grok 模型不同，Grok-4.20 引入了多代理協作，多個內部代理可同時分析提示並收斂於最終答案。此架構旨在提升在複雜推理、程式設計與研究任務上的表現。

Grok-4.20 的主要特性

超長上下文視窗（2M tokens）：可在單一提示中處理整本書、龐大資料集或大型程式碼庫。
多代理推理架構：最多四個內部代理可並行分析提示，在產出最終答案前討論解法。
代理型工具呼叫與結構化輸出：支援函式呼叫與結構化回應，以便整合至應用與自動化工作流程。
多模態理解：在同一模型流程中接受文字、影像與影片輸入。
快速推理並聚焦低幻覺：xAI 將此模型定位為針對真實回答與嚴格遵循提示進行最佳化。

Grok-4.20 Beta 的基準測試表現

Beta 期間公開基準數據仍然有限，但早期報告顯示：

基準	成果 / 狀態
LMSYS Chatbot Arena	預估 ELO ~1505–1535
ForecastBench	早期測試排名第 2
Alpha Arena trading challenge	獲得 +34.59% 報酬

這些數字表明，Grok-4.20 更側重在真實世界的推理與代理驅動任務中與前沿模型競爭，而非僅在簡單的基準題上。

Grok-4.20 Beta 與其他前沿模型

模型	開發者	上下文視窗	主要優勢
Grok-4.20 Beta	xAI	2M tokens	多代理推理
GPT-5.2	OpenAI	~400K tokens	高階推理與程式設計
Gemini 3 Pro	Google	~1M tokens	多模態與 Google 生態系
Claude 4 Opus	Anthropic	~200K+ tokens	可靠的推理

關鍵差異

Grok-4.20 著重於推理任務的多代理協作。
它提供生產環境 LLM 中最大的上下文視窗之一（2M tokens）。
視評估任務而定，競品可能在結構化推理或創意寫作等領域表現優於 Grok。

代表性使用案例

長上下文研究分析
處理大型文件、法律材料或學術研究。
代理型自動化系統
構建由模型規劃並執行任務的多步工作流程。
高階程式設計與模擬
透過長推理鏈解決工程問題或模擬系統。
資料分析與儀表板自動化
並行追蹤並分析多條資料流。
多模態知識處理
在統一的推理流程中解讀影像、影片幀與文字。

如何存取並使用 Grok 4.2 API

步驟 1：註冊取得 API 金鑰

登入 cometapi.com。若您尚未成為我們的使用者，請先註冊。登入您的 CometAPI console。取得該介面的存取憑證 API 金鑰。在個人中心的 API token 處點擊 “Add Token”，取得 token key：sk-xxxxx 並提交。

步驟 2：向 `Grok 4.2` API 發送請求

選擇 “grok-4.20-beta-0309-reasoning” 端點發送 API 請求並設定請求本文。請求方法與請求本文可從我們網站的 API 文件取得。我們的網站也提供 Apifox 測試以便您使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。Where to call it: Chat 格式。

將您的問題或請求插入 content 欄位——模型將對此作出回應。處理 API 回應以取得生成的答案。

步驟 3：擷取並驗證結果

處理 API 回應以取得生成的答案。處理完成後，API 會回傳任務狀態與輸出資料。

模型 ID	說明	可用性	請求
grok-4.20-multi-agent-beta-0309	為即時代理協調與工具呼叫優化的多代理變體（適用於深度研究工作流程，其中多個子代理會進行網頁搜尋、程式碼執行與評析）。	✅	回應格式呼叫。
grok-4.20-beta-0309-reasoning	推理優化變體：優先深層「思維鏈」式推理，並在偏重推理的測試中取得更高基準分數；相較於非推理變體，預期延遲更高、每個 token 的成本更高。	✅	聊天格式呼叫與回應格式呼叫。
grok-4.20-beta-0309-non-reasoning	適用於高吞吐任務的低延遲／低成本變體，優先提供確定性的回覆、短答案或串流輸出；取捨包括較低的推理基準分數。	✅	聊天格式呼叫與回應格式呼叫。

Grok 4.20 Beta

Grok-4.20 Beta 的技術規格

什麼是 Grok-4.20 Beta

Grok-4.20 的主要特性

Grok-4.20 Beta 的基準測試表現

Grok-4.20 Beta 與其他前沿模型

代表性使用案例

如何存取並使用 Grok 4.2 API

步驟 1：註冊取得 API 金鑰

步驟 2：向 `Grok 4.2` API 發送請求

步驟 3：擷取並驗證結果

常見問題

What makes Grok-4.20 Beta different from previous Grok models?

How large is the context window in the Grok-4.20 Beta API?

Can Grok-4.20 Beta handle multimodal inputs such as images or video?

How does Grok-4.20 Beta compare with GPT-5.2 or Gemini models?

Is Grok-4.20 Beta available through an API for developers?

What benchmarks show Grok-4.20 Beta performance?

Grok 4.20 Beta 的功能

Grok 4.20 Beta 的定價

Grok 4.20 Beta 的範例程式碼和 API

Grok 4.20 Beta的版本

更多模型