Home/Models/OpenAI/GPT-5.2
O

GPT-5.2

Đầu vào:$1.4/M
Đầu ra:$11.2/M
Bối cảnh:400,000
Đầu ra tối đa:128,000
GPT-5.2 là bộ mô hình đa biến thể (Instant, Thinking, Pro) được thiết kế nhằm mang lại khả năng hiểu ngữ cảnh dài tốt hơn, khả năng lập trình và sử dụng công cụ mạnh hơn, và hiệu năng cao hơn đáng kể trên các chuẩn đánh giá “knowledge-work” ở mức chuyên nghiệp.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API

GPT-5.2 API là gì

GPT-5.2 API giống với GPT-5.2 Thinking trong ChatGPT. GPT-5.2 Thinking là phiên bản tầm trung của họ GPT-5.2 của OpenAI, được thiết kế cho công việc chuyên sâu: lập luận nhiều bước, tóm tắt tài liệu dài, tạo mã chất lượng cao và công việc tri thức chuyên nghiệp, nơi độ chính xác và cấu trúc dễ sử dụng quan trọng hơn thông lượng thuần. Trong API, biến thể này được cung cấp dưới dạng model gpt-5.2 (Responses API / Chat Completions), và nằm giữa biến thể Instant có độ trễ thấp và biến thể Pro chất lượng cao nhưng đắt hơn.

Tính năng chính

  • Ngữ cảnh rất dài & tinh gọn: cửa sổ ngữ cảnh hiệu dụng 400K và các công cụ tinh gọn để quản lý mức độ liên quan trong các cuộc hội thoại và tài liệu dài.
  • Cấu hình mức nỗ lực lập luận: none | medium | high | xhigh (xhigh kích hoạt tính toán nội bộ tối đa cho lập luận khó). xhigh được cung cấp cho các biến thể Thinking/Pro.
  • Hỗ trợ công cụ và hàm mạnh hơn: gọi công cụ cấp một, ngữ pháp (CFG/Lark) để ràng buộc đầu ra có cấu trúc, và hành vi tác tử được cải thiện giúp đơn giản hóa tự động hóa nhiều bước phức tạp.
  • Hiểu đa phương thức: khả năng hiểu hình ảnh + văn bản phong phú hơn và tích hợp vào các tác vụ nhiều bước.
  • Cải thiện an toàn / xử lý nội dung nhạy cảm: can thiệp có mục tiêu để giảm phản hồi không mong muốn trong các lĩnh vực như tự gây hại và các bối cảnh nhạy cảm khác.

Khả năng kỹ thuật & thông số (góc nhìn nhà phát triển)

  • Điểm cuối API & ID model: gpt-5.2 cho Thinking (Responses API), gpt-5.2-chat-latest cho luồng công việc chat/instant, và gpt-5.2-pro cho tầng Pro; có sẵn qua Responses API và Chat Completions ở nơi được chỉ định.
  • Token lập luận & quản lý mức nỗ lực: API hỗ trợ tham số rõ ràng để phân bổ tính toán (mức nỗ lực lập luận) cho mỗi yêu cầu; mức nỗ lực cao hơn tăng độ trễ và chi phí nhưng cải thiện chất lượng đầu ra cho các tác vụ phức tạp.
  • Công cụ đầu ra có cấu trúc: hỗ trợ ngữ pháp (Lark / CFG) để ràng buộc đầu ra của model theo DSL hoặc cú pháp chính xác (hữu ích cho SQL, JSON, tạo DSL).
  • Gọi công cụ song song & điều phối tác tử: khả năng song song cải thiện và điều phối công cụ gọn gàng hơn giúp giảm nhu cầu về lời nhắc hệ thống phức tạp và giàn giáo đa tác tử.

Hiệu năng benchmark & dữ liệu hỗ trợ

OpenAI đã công bố nhiều kết quả benchmark nội bộ và bên ngoài cho GPT-5.2. Một số điểm nổi bật (theo số liệu do OpenAI báo cáo):

  • GDPval (44 nghề, công việc tri thức) — GPT-5.2 Thinking “vượt hoặc ngang bằng các chuyên gia hàng đầu trong ngành ở 70.9% phép so sánh”; OpenAI báo cáo rằng đầu ra được tạo ra với >11× tốc độ và <1% chi phí so với các chuyên gia trên các tác vụ GDPval của họ (ước tính tốc độ và chi phí dựa trên dữ liệu lịch sử). Những tác vụ này bao gồm mô hình bảng tính, bản thuyết trình và video ngắn.
  • SWE-Bench Pro (coding) — GPT-5.2 Thinking đạt ≈55.6% trên SWE-Bench Pro và ~80% trên SWE-Bench Verified (chỉ Python) theo OpenAI, thiết lập một chuẩn mới cho đánh giá tạo mã/kỹ thuật trong các bài thử của họ. Theo ví dụ của OpenAI, điều này chuyển hóa thành gỡ lỗi đáng tin cậy hơn và sửa lỗi đầu-cuối trong thực tế.
  • GPQA Diamond (hỏi đáp khoa học trình độ sau đại học) — GPT-5.2 Pro: 93.2%, GPT-5.2 Thinking: 92.4% trên GPQA Diamond (không dùng công cụ, lập luận tối đa).
  • ARC-AGI series — Trên ARC-AGI-2 (benchmark lập luận linh hoạt khó hơn), GPT-5.2 Thinking đạt 52.9% và GPT-5.2 Pro 54.2% (OpenAI cho biết đây là các mốc đẳng cấp hàng đầu mới cho mô hình phong cách chuỗi suy nghĩ).
  • Ngữ cảnh dài (OpenAI MRCRv2) — GPT-5.2 Thinking cho thấy độ chính xác gần 100% trên biến thể MRCR 4-needle đến 256k token và cải thiện đáng kể so với GPT-5.1 trong các thiết lập ngữ cảnh dài. (OpenAI đã công bố biểu đồ và bảng MRCRv2.)

GPT-5.2

So sánh với các đối thủ cùng thời

  • so với Google Gemini 3 (Gemini 3 Pro / Deep Think): Gemini 3 Pro được quảng bá với ~1,048,576 (≈1M) token cửa sổ ngữ cảnh và đầu vào đa phương thức rộng (văn bản, hình ảnh, âm thanh, video, PDF) cùng tích hợp tác tử mạnh qua Vertex AI / AI Studio. Trên lý thuyết, cửa sổ ngữ cảnh lớn hơn của Gemini 3 là điểm khác biệt cho khối lượng công việc phiên đơn cực lớn; đánh đổi bao gồm bề mặt công cụ và mức độ phù hợp hệ sinh thái.
  • so với Anthropic Claude Opus 4.5: Opus 4.5 nhấn mạnh luồng công việc mã hóa/tác tử cho doanh nghiệp và báo cáo kết quả SWE-bench mạnh cùng độ bền vững cho các phiên tác tử dài; Anthropic định vị Opus cho tự động hóa và tạo mã với cửa sổ ngữ cảnh 200k và tích hợp tác tử/Excel chuyên biệt. Opus 4.5 là đối thủ mạnh trong tự động hóa doanh nghiệp và tác vụ mã.

Kết luận thực tiễn: GPT-5.2 hướng tới một tập cải tiến cân bằng (ngữ cảnh 400k, đầu ra token lớn, lập luận/mã hóa được cải thiện). Gemini 3 nhắm tới ngữ cảnh phiên đơn lớn nhất (≈1M), trong khi Claude Opus tập trung vào kỹ thuật doanh nghiệp và độ bền tác tử. Hãy lựa chọn theo kích thước ngữ cảnh, nhu cầu đa phương thức, mức độ phù hợp tính năng/công cụ, và cân bằng chi phí/độ trễ.

Cách truy cập và sử dụng GPT-5.2 API

Bước 1: Đăng ký API Key

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy API key thông tin truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu đến GPT-5.2 API

Chọn điểm cuối “gpt-5.2” để gửi yêu cầu API và thiết lập thân yêu cầu. Phương thức và thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web cũng cung cấp kiểm thử Apifox để thuận tiện cho bạn. Thay thế <YOUR_API_KEY> bằng CometAPI key thực tế từ tài khoản của bạn. Developers gọi các endpoint này qua Responses API / Chat.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để nhận câu trả lời được tạo ra.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để nhận câu trả lời được tạo. Sau khi xử lý, API phản hồi với trạng thái tác vụ và dữ liệu đầu ra.

Xem thêm Gemini 3 Pro API xem trước

Câu hỏi thường gặp

What makes GPT-5.2 OpenAI's flagship model for developers?

GPT-5.2 is OpenAI's best model for coding and agentic tasks, combining a 400K context window with support for code interpreter, web search, file search, image generation, and MCP—making it the most versatile choice for complex workflows.

Does GPT-5.2 support model distillation?

Yes, GPT-5.2 uniquely supports distillation, allowing developers to use its outputs to train smaller, more efficient models for specific tasks while maintaining performance.

What is the knowledge cutoff date for GPT-5.2?

GPT-5.2 has a knowledge cutoff of August 31, 2025. For more recent information, you can enable web search through the Responses API to ground responses in current data.

Can GPT-5.2 process images and generate code simultaneously?

Yes, GPT-5.2 accepts image inputs and supports code interpreter, allowing it to analyze visual content and execute Python code in the same conversation—ideal for data visualization and analysis workflows.

How does GPT-5.2 compare to GPT-5 in pricing and performance?

GPT-5.2 costs $1.75/$14 per million tokens (input/output) compared to GPT-5's $1.25, but delivers materially higher performance on professional benchmarks including coding, long-context understanding, and tool use.

What endpoints does GPT-5.2 support?

GPT-5.2 supports Chat Completions, Responses API, Batch processing, and Assistants API—but does not support fine-tuning, Realtime API, or audio modalities.

Tính năng cho GPT-5.2

Khám phá các tính năng chính của GPT-5.2, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho GPT-5.2

Khám phá mức giá cạnh tranh cho GPT-5.2, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT-5.2 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)
Đầu vào:$1.4/M
Đầu ra:$11.2/M
Đầu vào:$1.75/M
Đầu ra:$14/M

Mã mẫu và API cho GPT-5.2

Truy cập mã mẫu toàn diện và tài nguyên API cho GPT-5.2 để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của GPT-5.2 trong các dự án của mình.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

response = client.responses.create(
    model="gpt-5.2",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "none"},
)

print(response.output_text)

Thêm mô hình