What makes Grok-4.20 different from previous Grok models?

Grok-4.20 giới thiệu một hệ thống suy luận đa tác nhân, trong đó nhiều tác nhân phân tích một lời nhắc đồng thời và phối hợp để đưa ra câu trả lời cuối cùng, qua đó cải thiện khả năng suy luận phức tạp và hiệu suất viết mã.

How large is the context window in the Grok-4.20 API?

Grok-4.20 hỗ trợ cửa sổ ngữ cảnh lên đến 2,000,000 token, cho phép các nhà phát triển xử lý các tài liệu hoặc tập dữ liệu cực dài trong một yêu cầu duy nhất.

Can Grok-4.20 handle multimodal inputs such as images or video?

Có. Grok-4.20 hỗ trợ các đầu vào đa phương thức bao gồm văn bản, hình ảnh và video, cho phép phân tích nội dung hỗn hợp trong một cuộc hội thoại duy nhất.

How does Grok-4.20 compare with GPT-5.2 or Gemini models?

Grok-4.20 tập trung vào suy luận đa tác nhân và các cửa sổ ngữ cảnh rất dài, trong khi GPT-5.2 nhấn mạnh suy luận có độ chính xác cao và các mô hình Gemini tập trung vào tích hợp đa phương thức trong hệ sinh thái Google.

Is Grok-4.20 available through an API for developers?

Có. Grok-4.20 có sẵn thông qua Come API.

What benchmarks show Grok-4.20 performance?

Các báo cáo ban đầu đặt Grok-4.20 vào khoảng 1505–1535 ELO trên LMSYS Arena và ghi nhận kết quả mạnh mẽ trong các cuộc thi thực tế như mô phỏng giao dịch Alpha Arena.

API Grok 4.20 Giá Phải Chăng | text-to-text

Thông số kỹ thuật của Grok-4.20

Hạng mục	Grok-4.20 (thông số công khai)
Họ mô hình	Dòng Grok-4
Nhà phát triển	xAI
Trạng thái phát hành	Beta (đợt triển khai đầu tiên 17 tháng 2, 2026)
Loại đầu vào	Văn bản, Hình ảnh, Video
Loại đầu ra	Đầu ra văn bản (hỗ trợ đầu ra có cấu trúc và gọi hàm/công cụ).
Cửa sổ ngữ cảnh	Tối đa 2,000,000 token
Kiến trúc	Lập luận hợp tác đa tác tử
Hỗ trợ công cụ	Gọi hàm, đầu ra có cấu trúc
Lập luận	Khả năng lập luận tích hợp
Hạ tầng huấn luyện	Colossus supercluster (~200,000 GPU)
Biến thể mô hình	grok-4.20-multi-agent-beta-0309, grok-4.20-beta-0309-reasoning, grok-4.20-beta-0309-non-reasoning.

Grok-4.20 là gì

Grok-4.20 là bản phát hành thử nghiệm mới nhất trong gia đình Grok-4 do xAI phát triển. Nó tập trung vào lập luận dựa trên tác tử, xử lý ngữ cảnh cực dài và suy luận tốc độ cao, hướng tới việc cung cấp câu trả lời chính xác với tỷ lệ ảo giác thấp hơn so với các mẫu Grok trước đó.

Không giống các mẫu Grok trước đây dùng suy luận đơn mô hình, Grok-4.20 giới thiệu hợp tác đa tác tử, trong đó nhiều tác tử nội bộ phân tích prompt đồng thời và hội tụ về câu trả lời cuối cùng. Kiến trúc này được thiết kế để cải thiện hiệu suất trong các tác vụ lập luận phức tạp, lập trình và nghiên cứu.

Tính năng chính của Grok-4.20

Cửa sổ ngữ cảnh siêu dài (2M token): Cho phép xử lý cả sách, bộ dữ liệu lớn hoặc kho mã dài trong một prompt.
Kiến trúc lập luận đa tác tử: Tối đa bốn tác tử nội bộ có thể phân tích prompt song song và tranh luận về các phương án trước khi tạo câu trả lời cuối cùng.
Gọi công cụ theo tác tử và đầu ra có cấu trúc: Hỗ trợ gọi hàm và phản hồi có cấu trúc để tích hợp với ứng dụng và quy trình tự động.
Hiểu đa phương thức: Chấp nhận đầu vào văn bản, hình ảnh và video trong cùng một pipeline của mô hình.
Suy luận nhanh với trọng tâm giảm ảo giác: xAI định vị mô hình được tối ưu cho câu trả lời trung thực và tuân thủ prompt tốt.

Hiệu năng đánh giá của Grok-4.20

Dữ liệu đánh giá công khai vẫn còn hạn chế trong giai đoạn beta, nhưng báo cáo ban đầu cho thấy:

Bộ đánh giá	Kết quả / Trạng thái
LMSYS Chatbot Arena	ELO ước tính ~1505–1535
ForecastBench	Xếp hạng #2 trong thử nghiệm ban đầu
Alpha Arena trading challenge	Đạt lợi nhuận +34.59%

Những con số này cho thấy Grok-4.20 cạnh tranh với các mô hình tiên tiến trong các tác vụ lập luận thực tiễn và do tác tử điều khiển, thay vì các câu hỏi đánh giá đơn giản.

Grok-4.20 Beta so với các mô hình tiên tiến khác

Mô hình	Nhà phát triển	Cửa sổ ngữ cảnh	Thế mạnh chính
Grok-4.20	xAI	2M token	Lập luận đa tác tử
GPT-5.2	OpenAI	~400K token	Lập luận nâng cao + lập trình
Gemini 3 Pro	Google	~1M token	Đa phương thức và hệ sinh thái Google
Claude 4 Opus	Anthropic	~200K+ token	Lập luận đáng tin cậy

Khác biệt chính

Grok-4.20 nhấn mạnh hợp tác đa tác tử cho các tác vụ lập luận.
Cung cấp một trong những cửa sổ ngữ cảnh lớn nhất trong các LLM vận hành (2M token).
Các mô hình cạnh tranh có thể vượt Grok trong một số lĩnh vực như lập luận có cấu trúc hoặc viết sáng tạo tùy theo bài đánh giá.

Tình huống sử dụng tiêu biểu

Phân tích nghiên cứu ngữ cảnh dài
Xử lý tài liệu lớn, tài liệu pháp lý hoặc nghiên cứu học thuật.
Hệ thống tự động hóa dựa trên tác tử
Xây dựng quy trình nhiều bước nơi mô hình lập kế hoạch và thực thi tác vụ.
Lập trình nâng cao và mô phỏng
Giải quyết bài toán kỹ thuật hoặc mô phỏng hệ thống với chuỗi lập luận dài.
Phân tích dữ liệu và tự động hóa bảng điều khiển
Theo dõi và phân tích đồng thời nhiều luồng dữ liệu.
Xử lý tri thức đa phương thức
Diễn giải hình ảnh, khung hình video và văn bản trong một quy trình lập luận thống nhất.

Cách truy cập và sử dụng API Grok 4.2

Bước 1: Đăng ký lấy khóa API

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng, vui lòng đăng ký trước. Đăng nhập vào Bảng điều khiển CometAPI. Lấy khóa API truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, nhận khóa token: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu tới API `Grok 4.2`

Chọn endpoint “grok-4.20-0309-reasoning” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng. Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế trong tài khoản của bạn. Nơi gọi: định dạng Chat.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.

Giá cả cho Grok 4.20

Khám phá mức giá cạnh tranh cho Grok 4.20, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách Grok 4.20 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.

Giá Comet (USD / M Tokens)	Giá Chính Thức (USD / M Tokens)	Giảm giá
Đầu vào:$1/M Đầu ra:$2/M	Đầu vào:$1.25/M Đầu ra:$2.5/M	-20%

Mã mẫu và API cho Grok 4.20

Truy cập mã mẫu toàn diện và tài nguyên API cho Grok 4.20 để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của Grok 4.20 trong các dự án của mình.

Python
JavaScript
Curl

import os

from openai import OpenAI

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="grok-4.20-multi-agent-beta-0309",
    input=[
        {
            "role": "user",
            "content": "Research the latest breakthroughs in quantum computing and summarize the key findings.",
        }
    ],
    tools=[{"type": "web_search"}, {"type": "x_search"}],
)

print(response.output_text or response.model_dump_json(indent=2))

Python Code Example

import os

from openai import OpenAI

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="grok-4.20-multi-agent-beta-0309",
    input=[
        {
            "role": "user",
            "content": "Research the latest breakthroughs in quantum computing and summarize the key findings.",
        }
    ],
    tools=[{"type": "web_search"}, {"type": "x_search"}],
)

print(response.output_text or response.model_dump_json(indent=2))

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const apiKey = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const baseUrl = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey,
  baseURL: baseUrl,
});

const response = await client.responses.create({
  model: "grok-4.20-multi-agent-beta-0309",
  input: [
    {
      role: "user",
      content: "Research the latest breakthroughs in quantum computing and summarize the key findings.",
    },
  ],
  tools: [{ type: "web_search" }, { type: "x_search" }],
});

console.log(response.output_text ?? JSON.stringify(response.output, null, 2));

Curl Code Example

#!/usr/bin/env bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

response=$(curl --silent --location --request POST "https://api.cometapi.com/v1/responses" \
  --header "Authorization: Bearer $COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --header "Accept: application/json" \
  --data-raw '{
    "model": "grok-4.20-multi-agent-beta-0309",
    "input": [
      {
        "role": "user",
        "content": "Research the latest breakthroughs in quantum computing and summarize the key findings."
      }
    ],
    "tools": [
      {"type": "web_search"},
      {"type": "x_search"}
    ]
  }')

if command -v jq >/dev/null 2>&1; then
  printf '%s\n' "$response" | jq -r '(
    [
      .output[]?
      | select(.type == "message")
      | .content[]?
      | select(.type == "output_text")
      | .text
    ][0]
  ) // .output_text // .'
else
  printf '%s\n' "$response"
fi

Các phiên bản của Grok 4.20

Lý do Grok 4.20 có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.

ID mô hình	mô tả	Tính khả dụng	Yêu cầu
grok-4.20-multi-agent-beta-0309	Biến thể đa tác tử được tinh chỉnh cho việc điều phối tác tử theo thời gian thực và gọi công cụ (hữu ích cho các quy trình nghiên cứu chuyên sâu, nơi nhiều tác tử phụ thực hiện tìm kiếm web, chạy mã và phản biện).	✅	gọi theo định dạng phản hồi.
grok-4.20-0309-reasoning	Biến thể tối ưu cho suy luận: ưu tiên kiểu suy luận theo chuỗi tư duy sâu hơn và điểm chuẩn cao hơn trong các bài kiểm tra nặng về suy luận; dự kiến độ trễ/chi phí trên mỗi token cao hơn so với các biến thể không suy luận.	✅	gọi theo định dạng chat và gọi theo định dạng phản hồi.
grok-4.20-0309-non-reasoning	Biến thể độ trễ thấp / chi phí thấp cho các tác vụ thông lượng cao, nơi ưu tiên câu trả lời ngắn mang tính quyết định hoặc đầu ra dạng streaming; đánh đổi là điểm chuẩn suy luận thấp hơn.	✅	gọi theo định dạng chat và gọi theo định dạng phản hồi.