Mô hìnhGiáDoanh nghiệp
500+ API Mô hình AI, Tất cả trong Một API. Chỉ cần CometAPI
API Mô hình
Nhà phát triển
Bắt đầu nhanhTài liệuBảng Điều Khiển API
Công ty
Về chúng tôiDoanh nghiệp
Tài nguyên
Mô hình AIBlogNhật ký thay đổiHỗ trợ
Điều khoản Dịch vụChính sách Bảo mật
© 2026 CometAPI · All rights reserved
Home/Models/xAI/Grok 4.20
X

Grok 4.20

Đầu vào:$1.6/M
Đầu ra:$4.8/M
Bối cảnh:2,000,000
Bản phát hành Grok 4.20 giới thiệu kiến trúc đa tác nhân (nhiều tác nhân chuyên biệt được điều phối theo thời gian thực), các chế độ ngữ cảnh được mở rộng, và các cải tiến tập trung vào khả năng tuân thủ hướng dẫn, giảm ảo giác, cùng đầu ra có cấu trúc/được hỗ trợ công cụ.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API
Phiên bản

Thông số kỹ thuật của Grok-4.20

Hạng mụcGrok-4.20 (thông số công khai)
Họ mô hìnhDòng Grok-4
Nhà phát triểnxAI
Trạng thái phát hànhBeta (đợt triển khai đầu tiên 17 tháng 2, 2026)
Loại đầu vàoVăn bản, Hình ảnh, Video
Loại đầu raĐầu ra văn bản (hỗ trợ đầu ra có cấu trúc và gọi hàm/công cụ).
Cửa sổ ngữ cảnhTối đa 2,000,000 token
Kiến trúcLập luận hợp tác đa tác tử
Hỗ trợ công cụGọi hàm, đầu ra có cấu trúc
Lập luậnKhả năng lập luận tích hợp
Hạ tầng huấn luyệnColossus supercluster (~200,000 GPU)
Biến thể mô hìnhgrok-4.20-multi-agent-beta-0309, grok-4.20-beta-0309-reasoning, grok-4.20-beta-0309-non-reasoning.

Grok-4.20 là gì

Grok-4.20 là bản phát hành thử nghiệm mới nhất trong gia đình Grok-4 do xAI phát triển. Nó tập trung vào lập luận dựa trên tác tử, xử lý ngữ cảnh cực dài và suy luận tốc độ cao, hướng tới việc cung cấp câu trả lời chính xác với tỷ lệ ảo giác thấp hơn so với các mẫu Grok trước đó.

Không giống các mẫu Grok trước đây dùng suy luận đơn mô hình, Grok-4.20 giới thiệu hợp tác đa tác tử, trong đó nhiều tác tử nội bộ phân tích prompt đồng thời và hội tụ về câu trả lời cuối cùng. Kiến trúc này được thiết kế để cải thiện hiệu suất trong các tác vụ lập luận phức tạp, lập trình và nghiên cứu.

Tính năng chính của Grok-4.20

  • Cửa sổ ngữ cảnh siêu dài (2M token): Cho phép xử lý cả sách, bộ dữ liệu lớn hoặc kho mã dài trong một prompt.
  • Kiến trúc lập luận đa tác tử: Tối đa bốn tác tử nội bộ có thể phân tích prompt song song và tranh luận về các phương án trước khi tạo câu trả lời cuối cùng.
  • Gọi công cụ theo tác tử và đầu ra có cấu trúc: Hỗ trợ gọi hàm và phản hồi có cấu trúc để tích hợp với ứng dụng và quy trình tự động.
  • Hiểu đa phương thức: Chấp nhận đầu vào văn bản, hình ảnh và video trong cùng một pipeline của mô hình.
  • Suy luận nhanh với trọng tâm giảm ảo giác: xAI định vị mô hình được tối ưu cho câu trả lời trung thực và tuân thủ prompt tốt.

Hiệu năng đánh giá của Grok-4.20

Dữ liệu đánh giá công khai vẫn còn hạn chế trong giai đoạn beta, nhưng báo cáo ban đầu cho thấy:

Bộ đánh giáKết quả / Trạng thái
LMSYS Chatbot ArenaELO ước tính ~1505–1535
ForecastBenchXếp hạng #2 trong thử nghiệm ban đầu
Alpha Arena trading challengeĐạt lợi nhuận +34.59%

Những con số này cho thấy Grok-4.20 cạnh tranh với các mô hình tiên tiến trong các tác vụ lập luận thực tiễn và do tác tử điều khiển, thay vì các câu hỏi đánh giá đơn giản.

Grok-4.20 Beta so với các mô hình tiên tiến khác

Mô hìnhNhà phát triểnCửa sổ ngữ cảnhThế mạnh chính
Grok-4.20xAI2M tokenLập luận đa tác tử
GPT-5.2OpenAI~400K tokenLập luận nâng cao + lập trình
Gemini 3 ProGoogle~1M tokenĐa phương thức và hệ sinh thái Google
Claude 4 OpusAnthropic~200K+ tokenLập luận đáng tin cậy

Khác biệt chính

  • Grok-4.20 nhấn mạnh hợp tác đa tác tử cho các tác vụ lập luận.
  • Cung cấp một trong những cửa sổ ngữ cảnh lớn nhất trong các LLM vận hành (2M token).
  • Các mô hình cạnh tranh có thể vượt Grok trong một số lĩnh vực như lập luận có cấu trúc hoặc viết sáng tạo tùy theo bài đánh giá.

Tình huống sử dụng tiêu biểu

  1. Phân tích nghiên cứu ngữ cảnh dài
    Xử lý tài liệu lớn, tài liệu pháp lý hoặc nghiên cứu học thuật.
  2. Hệ thống tự động hóa dựa trên tác tử
    Xây dựng quy trình nhiều bước nơi mô hình lập kế hoạch và thực thi tác vụ.
  3. Lập trình nâng cao và mô phỏng
    Giải quyết bài toán kỹ thuật hoặc mô phỏng hệ thống với chuỗi lập luận dài.
  4. Phân tích dữ liệu và tự động hóa bảng điều khiển
    Theo dõi và phân tích đồng thời nhiều luồng dữ liệu.
  5. Xử lý tri thức đa phương thức
    Diễn giải hình ảnh, khung hình video và văn bản trong một quy trình lập luận thống nhất.

Cách truy cập và sử dụng API Grok 4.2

Bước 1: Đăng ký lấy khóa API

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng, vui lòng đăng ký trước. Đăng nhập vào Bảng điều khiển CometAPI. Lấy khóa API truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, nhận khóa token: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu tới API Grok 4.2

Chọn endpoint “grok-4.20-0309-reasoning” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng. Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế trong tài khoản của bạn. Nơi gọi: định dạng Chat.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.

Câu Hỏi Thường Gặp

What makes Grok-4.20 different from previous Grok models?

Grok-4.20 giới thiệu một hệ thống suy luận đa tác nhân, trong đó nhiều tác nhân phân tích một lời nhắc đồng thời và phối hợp để đưa ra câu trả lời cuối cùng, qua đó cải thiện khả năng suy luận phức tạp và hiệu suất viết mã.

How large is the context window in the Grok-4.20 API?

Grok-4.20 hỗ trợ cửa sổ ngữ cảnh lên đến 2,000,000 token, cho phép các nhà phát triển xử lý các tài liệu hoặc tập dữ liệu cực dài trong một yêu cầu duy nhất.

Can Grok-4.20 handle multimodal inputs such as images or video?

Có. Grok-4.20 hỗ trợ các đầu vào đa phương thức bao gồm văn bản, hình ảnh và video, cho phép phân tích nội dung hỗn hợp trong một cuộc hội thoại duy nhất.

How does Grok-4.20 compare with GPT-5.2 or Gemini models?

Grok-4.20 tập trung vào suy luận đa tác nhân và các cửa sổ ngữ cảnh rất dài, trong khi GPT-5.2 nhấn mạnh suy luận có độ chính xác cao và các mô hình Gemini tập trung vào tích hợp đa phương thức trong hệ sinh thái Google.

Is Grok-4.20 available through an API for developers?

Có. Grok-4.20 có sẵn thông qua Come API.

What benchmarks show Grok-4.20 performance?

Các báo cáo ban đầu đặt Grok-4.20 vào khoảng 1505–1535 ELO trên LMSYS Arena và ghi nhận kết quả mạnh mẽ trong các cuộc thi thực tế như mô phỏng giao dịch Alpha Arena.

Tính năng cho Grok 4.20

Khám phá các tính năng chính của Grok 4.20, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho Grok 4.20

Khám phá mức giá cạnh tranh cho Grok 4.20, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách Grok 4.20 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$1.6/M
Đầu ra:$4.8/M
Đầu vào:$2/M
Đầu ra:$6/M
-20%

Mã mẫu và API cho Grok 4.20

Truy cập mã mẫu toàn diện và tài nguyên API cho Grok 4.20 để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của Grok 4.20 trong các dự án của mình.
POST
/v1/chat/completions
Python
JavaScript
Curl
import os

from openai import OpenAI

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="grok-4.20-multi-agent-beta-0309",
    input=[
        {
            "role": "user",
            "content": "Research the latest breakthroughs in quantum computing and summarize the key findings.",
        }
    ],
    tools=[{"type": "web_search"}, {"type": "x_search"}],
)

print(response.output_text or response.model_dump_json(indent=2))

Python Code Example

import os

from openai import OpenAI

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="grok-4.20-multi-agent-beta-0309",
    input=[
        {
            "role": "user",
            "content": "Research the latest breakthroughs in quantum computing and summarize the key findings.",
        }
    ],
    tools=[{"type": "web_search"}, {"type": "x_search"}],
)

print(response.output_text or response.model_dump_json(indent=2))

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const apiKey = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const baseUrl = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey,
  baseURL: baseUrl,
});

const response = await client.responses.create({
  model: "grok-4.20-multi-agent-beta-0309",
  input: [
    {
      role: "user",
      content: "Research the latest breakthroughs in quantum computing and summarize the key findings.",
    },
  ],
  tools: [{ type: "web_search" }, { type: "x_search" }],
});

console.log(response.output_text ?? JSON.stringify(response.output, null, 2));

Curl Code Example

#!/usr/bin/env bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

response=$(curl --silent --location --request POST "https://api.cometapi.com/v1/responses" \
  --header "Authorization: Bearer $COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --header "Accept: application/json" \
  --data-raw '{
    "model": "grok-4.20-multi-agent-beta-0309",
    "input": [
      {
        "role": "user",
        "content": "Research the latest breakthroughs in quantum computing and summarize the key findings."
      }
    ],
    "tools": [
      {"type": "web_search"},
      {"type": "x_search"}
    ]
  }')

if command -v jq >/dev/null 2>&1; then
  printf '%s\n' "$response" | jq -r '(
    [
      .output[]?
      | select(.type == "message")
      | .content[]?
      | select(.type == "output_text")
      | .text
    ][0]
  ) // .output_text // .'
else
  printf '%s\n' "$response"
fi

Các phiên bản của Grok 4.20

Lý do Grok 4.20 có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.
ID mô hìnhmô tảTính khả dụngYêu cầu
grok-4.20-multi-agent-beta-0309Biến thể đa tác tử được tinh chỉnh cho việc điều phối tác tử theo thời gian thực và gọi công cụ (hữu ích cho các quy trình nghiên cứu chuyên sâu, nơi nhiều tác tử phụ thực hiện tìm kiếm web, chạy mã và phản biện).✅gọi theo định dạng phản hồi.
grok-4.20-0309-reasoningBiến thể tối ưu cho suy luận: ưu tiên kiểu suy luận theo chuỗi tư duy sâu hơn và điểm chuẩn cao hơn trong các bài kiểm tra nặng về suy luận; dự kiến độ trễ/chi phí trên mỗi token cao hơn so với các biến thể không suy luận.✅gọi theo định dạng chat và gọi theo định dạng phản hồi.
grok-4.20-0309-non-reasoningBiến thể độ trễ thấp / chi phí thấp cho các tác vụ thông lượng cao, nơi ưu tiên câu trả lời ngắn mang tính quyết định hoặc đầu ra dạng streaming; đánh đổi là điểm chuẩn suy luận thấp hơn.✅gọi theo định dạng chat và gọi theo định dạng phản hồi.

Thêm mô hình

C

Claude Opus 4.7

Đầu vào:$3/M
Đầu ra:$15/M
Mô hình thông minh nhất cho tác tử và lập trình
A

Claude Sonnet 4.6

Đầu vào:$2.4/M
Đầu ra:$12/M
Claude Sonnet 4.6 là mô hình Sonnet mạnh mẽ nhất của chúng tôi từ trước đến nay. Đây là một bản nâng cấp toàn diện về các kỹ năng của mô hình, bao gồm lập trình, sử dụng máy tính, suy luận trong ngữ cảnh dài, lập kế hoạch tác nhân, công việc tri thức và thiết kế. Sonnet 4.6 cũng có cửa sổ ngữ cảnh 1M token ở giai đoạn beta.
O

GPT 5.5 Pro

Đầu vào:$24/M
Đầu ra:$144/M
Một mô hình tiên tiến được thiết kế để xử lý logic cực kỳ phức tạp và đáp ứng các yêu cầu chuyên môn, đại diện cho tiêu chuẩn cao nhất về suy luận sâu và năng lực phân tích chính xác.
O

GPT 5.5

Đầu vào:$4/M
Đầu ra:$24/M
Một mô hình chủ lực đa phương thức thế hệ mới cân bằng giữa hiệu năng vượt trội và khả năng phản hồi hiệu quả, nhằm cung cấp các dịch vụ AI mục đích chung toàn diện và ổn định.
O

GPT Image 2 ALL

Theo Yêu cầu:$0.04
GPT Image 2 là mô hình tạo ảnh tối tân của OpenAI dùng cho việc tạo và chỉnh sửa hình ảnh nhanh, chất lượng cao. Nó hỗ trợ kích thước ảnh linh hoạt và đầu vào hình ảnh có độ trung thực cao.
O

GPT 5.5 ALL

Đầu vào:$4/M
Đầu ra:$24/M
GPT-5.5 xuất sắc trong việc viết mã, nghiên cứu trực tuyến, phân tích dữ liệu và thao tác giữa nhiều công cụ. Mô hình không chỉ nâng cao mức độ tự chủ khi xử lý các tác vụ phức tạp đa bước mà còn cải thiện đáng kể năng lực suy luận và hiệu suất thực thi, đồng thời vẫn duy trì độ trễ tương đương với phiên bản tiền nhiệm, qua đó đánh dấu một bước tiến quan trọng hướng tới tự động hóa công việc văn phòng bằng AI.

Blog liên quan

Cursor Composer vs Windsurf vs GitHub Copilot: Giá & những gì bạn thực sự nhận được
Apr 20, 2026
copilot
composer-2
windsurf

Cursor Composer vs Windsurf vs GitHub Copilot: Giá & những gì bạn thực sự nhận được

Nếu bạn muốn đầu ra tự động tốt nhất, Cursor thường vượt trội. Nếu bạn muốn trải nghiệm chỉnh sửa có hướng dẫn mượt mà nhất, Windsurf thường là lựa chọn dễ chịu nhất. Nếu bạn muốn quy trình làm việc gốc GitHub có giá trị trên mỗi đô la tốt nhất, Copilot là lựa chọn thiết thực nhất. Bảng xếp hạng đó được rút ra từ các thiết kế sản phẩm, mức giá và mô hình agent hiện tại do mỗi nhà cung cấp công bố.
Grok 4.2: Tính năng, Kiến trúc và So sánh
Mar 12, 2026
grok-4-2

Grok 4.2: Tính năng, Kiến trúc và So sánh

Grok 4.2 là sản phẩm chủ lực bản beta công khai của xAI trong dòng Grok 4: một mô hình tạo sinh đa tác tử, hỗ trợ công cụ, có thông lượng hàng đầu ngành, cửa sổ ngữ cảnh khổng lồ 2,000,000 token cho chế độ tác tử, và các biến thể API chuyên biệt như grok-4.20-multi-agent-beta-0309, grok-4.20-beta-0309-reasoning và grok-4.20-beta-0309-non-reasoning. Sản phẩm được tối ưu cho các quy trình làm việc nhanh, dựa trên tác tử (dữ liệu X thời gian thực / gọi công cụ), có mặt trên Web, iOS/Android và các kênh API giai đoạn đầu, ví dụ CometAPI, và hướng tới người dùng cần các trợ lý nhanh, nhận biết dữ liệu trực tiếp thay vì tập trung vào lập luận dạng dài ở mức sâu nhất.
Cách sử dụng API Grok 4.2 vào năm 2026
Mar 12, 2026
grok-4-2

Cách sử dụng API Grok 4.2 vào năm 2026

Grok 4.2 là mô hình suy luận đa tác nhân mới nhất của xAI, kết hợp bốn tác nhân phối hợp và các tính năng gọi công cụ theo tác nhân mới để mang lại suy luận nhanh hơn nhiều, với mức ảo giác thấp hơn cho khối lượng công việc doanh nghiệp. Hiện nay, để gọi mô hình này, đa số nhà phát triển hoặc (a) sử dụng các endpoint REST/gRPC chính thức của xAI, hoặc (b) gọi thông qua một trình tổng hợp như CometAPI (single REST endpoint,post https://api.cometapi.com/v1/responsess) giúp đơn giản hóa khóa, thanh toán và chuyển đổi giữa nhiều mô hình.
Grok 4.2: sẽ mang lại điều gì và vì sao điều đó quan trọng đối với AI vào năm 2026
Jan 18, 2026
grok-4-2

Grok 4.2: sẽ mang lại điều gì và vì sao điều đó quan trọng đối với AI vào năm 2026

Grok 4.2, một phiên bản tinh vi của mẫu chủ lực của Elon Musk. Không giống các phiên bản tiền nhiệm, Grok 4.2 đã xuất hiện thông qua một loạt "checkpoint bí mật"—những biến thể mô hình bí ẩn xuất hiện trên các bảng xếp hạng với các mật danh như *Obsidian, Vortex Shade và Quantum Crow.