Mô hìnhHỗ trợDoanh nghiệpBlog
500+ API Mô hình AI, Tất cả trong Một API. Chỉ cần CometAPI
API Mô hình
Nhà phát triển
Bắt đầu nhanhTài liệuBảng Điều Khiển API
Tài nguyên
Mô hình AIBlogDoanh nghiệpNhật ký thay đổiGiới thiệu
2025 CometAPI. Bảo lưu mọi quyền.Chính sách Bảo mậtĐiều khoản Dịch vụ
Home/Models/OpenAI/GPT-5.1
O

GPT-5.1

Đầu vào:$1/M
Đầu ra:$8/M
GPT-5.1 là một mô hình ngôn ngữ mục đích chung được tinh chỉnh theo hướng dẫn, tập trung vào việc tạo văn bản và suy luận trên các quy trình làm việc của sản phẩm. Mô hình hỗ trợ đối thoại đa lượt, định dạng đầu ra có cấu trúc, và các tác vụ hướng mã như soạn thảo, tái cấu trúc và giải thích. Các trường hợp sử dụng điển hình bao gồm trợ lý trò chuyện, Hỏi đáp tăng cường truy hồi, chuyển đổi dữ liệu, và tự động hóa kiểu tác tử với công cụ hoặc API khi được hỗ trợ. Những điểm nổi bật về kỹ thuật bao gồm chế độ lấy văn bản làm trung tâm, khả năng tuân theo hướng dẫn, đầu ra theo kiểu JSON, và khả năng tương thích với việc gọi hàm trong các khung điều phối phổ biến.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API

GPT 5.1 API là gì? GPT-5.1 Thinking là biến thể lập luận nâng cao trong họ GPT-5.1 của OpenAI, ưu tiên khả năng lập luận thích ứng và chất lượng cao đồng thời cung cấp cho nhà phát triển quyền kiểm soát rõ ràng đối với sự đánh đổi giữa độ trễ và chi phí tính toán.

Tính năng cơ bản

  • Lập luận thích ứng: mô hình tự động điều chỉnh độ sâu suy nghĩ theo từng yêu cầu — nhanh hơn với tác vụ thường lệ, kiên trì hơn với tác vụ phức tạp. Điều này giúp giảm độ trễ và số token cho các truy vấn phổ biến; đồng thời phân bổ rõ ràng nhiều thời gian lập luận hơn cho đề bài phức tạp và bền bỉ hơn với bài toán nhiều bước; có thể chậm hơn với bài khó nhưng cho câu trả lời sâu hơn.
  • Chế độ lập luận: none / low / medium / high (GPT-5.1 mặc định none cho trường hợp cần độ trễ thấp; chọn mức cao hơn cho tác vụ đòi hỏi hơn). Responses API cung cấp tham số reasoning để kiểm soát điều này.
  • Giọng điệu & phong cách mặc định: thiên về sự rõ ràng với chủ đề phức tạp (ít biệt ngữ hơn), giải thích cặn kẽ và “kiên nhẫn” hơn.
  • Cửa sổ ngữ cảnh (tokens / ngữ cảnh dài) Thinking: lớn hơn nhiều — ngữ cảnh 400K token cho các gói trả phí.

Chi tiết kỹ thuật chính

  • Phân bổ tính toán thích ứng — thiết kế huấn luyện và suy luận khiến mô hình dùng ít token lập luận hơn cho tác vụ tầm thường và dùng nhiều hơn theo tỷ lệ cho tác vụ khó. Đây không phải “động cơ suy nghĩ” tách biệt mà là phân bổ động trong pipeline lập luận.
  • Tham số lập luận trong Responses API — phía client truyền một đối tượng reasoning (ví dụ reasoning: { "effort": "high" }) để yêu cầu lập luận nội bộ sâu hơn; đặt reasoning: { "effort": "none" } sẽ vô hiệu hóa hiệu quả lượt lập luận nội bộ mở rộng để có độ trễ thấp hơn. Responses API cũng trả về metadata về reasoning/token (hữu ích cho chi phí và gỡ lỗi). )
  • Công cụ & lời gọi công cụ song song — GPT-5.1 cải thiện khả năng gọi công cụ song song và bao gồm các công cụ có tên (như apply_patch) giúp giảm lỗi khi chỉnh sửa theo chương trình; song song hóa tăng thông lượng đầu-cuối cho quy trình nặng công cụ.
  • Bộ nhớ đệm prompt và tính bền — hỗ trợ prompt_cache_retention='24h' trên các endpoint Responses và Chat Completions để giữ ngữ cảnh qua nhiều lượt hội thoại (giảm mã hóa token lặp lại).

Hiệu năng benchmark

Ví dụ về độ trễ / hiệu quả token (do nhà cung cấp cung cấp): với truy vấn thường lệ, OpenAI báo cáo giảm mạnh thời gian/token (ví dụ: một lệnh liệt kê npm mất ~10s / ~250 token trên GPT-5 nay còn ~2s / ~50 token trên GPT-5.1 trong thử nghiệm đại diện). Các bên thử nghiệm sớm bên thứ ba (ví dụ, nhà quản lý tài sản, công ty lập trình) báo cáo tăng tốc 2–3× trên nhiều tác vụ và cải thiện hiệu quả token trong các luồng nặng công cụ.

OpenAI và các đối tác sớm đã công bố các tuyên bố benchmark đại diện và những cải thiện đo được:

Đánh giáGPT‑5.1 (high)GPT‑5 (high)
SWE-bench Verified (all 500 problems)76.3%72.8%
GPQA Diamond (no tools)88.1%85.7%
AIME 2025 (no tools)94.0%94.6%
FrontierMath (with Python tool)26.7%26.3%
MMMU85.4%84.2%
Tau2-bench Airline67.0%62.6%
Tau2-bench Telecom*95.6%96.7%
Tau2-bench Retail77.9%81.1%
BrowseComp Long Context 128k90.0%90.0%

Hạn chế & cân nhắc an toàn

  • Rủi ro ảo giác vẫn tồn tại. Lập luận thích ứng giúp ích cho bài toán phức tạp nhưng không loại bỏ ảo giác; tăng reasoning_effort cải thiện kiểm tra nhưng không đảm bảo đúng tuyệt đối. Luôn xác thực đầu ra trong tình huống rủi ro cao.
  • Đánh đổi tài nguyên và chi phí: dù GPT-5.1 có thể hiệu quả token hơn nhiều trên luồng đơn giản, bật mức nỗ lực lập luận cao hoặc chuỗi dùng công cụ kéo dài có thể tăng tiêu thụ token và độ trễ. Dùng bộ nhớ đệm prompt để giảm chi phí lặp lại khi phù hợp.
  • An toàn công cụ: các công cụ apply_patch và shell tăng quyền tự động hóa (và rủi ro). Triển khai sản xuất nên kiểm soát thực thi công cụ (duyệt diff/lệnh trước khi chạy), áp dụng nguyên tắc đặc quyền tối thiểu, và bảo đảm CI/CD cùng rào chắn vận hành vững chắc.

So sánh với các mô hình khác

  • vs GPT-5: GPT-5.1 cải thiện lập luận thích ứng và tuân thủ chỉ dẫn; OpenAI báo cáo thời gian phản hồi nhanh hơn với tác vụ dễ và bền bỉ hơn với tác vụ khó. GPT-5.1 cũng bổ sung tùy chọn lập luận none và mở rộng bộ nhớ đệm prompt.
  • vs GPT-4.x / 4.1: GPT-5.1 được thiết kế cho tác vụ mang tính agent, nặng công cụ và lập trình; OpenAI và đối tác báo cáo cải thiện trên benchmark lập trình và lập luận nhiều bước. Với nhiều tác vụ trò chuyện chuẩn, GPT-5.1 Instant có thể tương đương các mẫu GPT-4.x trước đó nhưng khả năng điều hướng và thiết lập cá tính tốt hơn.
  • vs Anthropic / Claude / các LLM khác: ChatGPT 5.1′;s kiến trúc MoA mang lại lợi thế rõ rệt ở các tác vụ đòi hỏi lập luận phức tạp, nhiều bước. Mô hình đạt điểm số chưa từng có 98.20 trên benchmark HELM về lập luận phức tạp, so với 95.60 của Claude 4 và 94.80 của Gemini 2.0 Ultra.

Tính năng cho GPT-5.1

Khám phá các tính năng chính của GPT-5.1, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho GPT-5.1

Khám phá mức giá cạnh tranh cho GPT-5.1, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT-5.1 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$1/M
Đầu ra:$8/M
Đầu vào:$1.25/M
Đầu ra:$10/M
-20%

Mã mẫu và API cho GPT-5.1

GPT 5.1 API là gì, GPT-5.1 Thinking là biến thể suy luận nâng cao thuộc họ GPT-5.1 của OpenAI, nó ưu tiên khả năng suy luận thích ứng với chất lượng cao hơn đồng thời cho phép các nhà phát triển kiểm soát tường minh đối với sự đánh đổi giữa độ trễ / tài nguyên tính toán.
POST
/v1/responses
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5.1",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5.1",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

Thêm mô hình

A

Claude Opus 4.6

Đầu vào:$4/M
Đầu ra:$20/M
Claude Opus 4.6 là mô hình ngôn ngữ lớn thuộc lớp “Opus” của Anthropic, phát hành vào tháng 2 năm 2026. Mô hình này được định vị như một công cụ chủ lực cho công việc tri thức và các quy trình nghiên cứu — cải thiện khả năng suy luận với ngữ cảnh dài, lập kế hoạch nhiều bước, khả năng sử dụng công cụ (bao gồm các quy trình phần mềm agentic), và các tác vụ sử dụng máy tính như tự động tạo slide và bảng tính.
A

Claude Sonnet 4.6

Đầu vào:$2.4/M
Đầu ra:$12/M
Claude Sonnet 4.6 là mô hình Sonnet mạnh mẽ nhất của chúng tôi từ trước đến nay. Đây là một bản nâng cấp toàn diện về các kỹ năng của mô hình, bao gồm lập trình, sử dụng máy tính, suy luận trong ngữ cảnh dài, lập kế hoạch tác nhân, công việc tri thức và thiết kế. Sonnet 4.6 cũng có cửa sổ ngữ cảnh 1M token ở giai đoạn beta.
O

GPT-5.4 nano

Đầu vào:$0.16/M
Đầu ra:$1/M
GPT-5.4 nano được thiết kế cho các tác vụ trong đó tốc độ và chi phí là ưu tiên hàng đầu, như phân loại, trích xuất dữ liệu, xếp hạng và các tác tử phụ.
O

GPT-5.4 mini

Đầu vào:$0.6/M
Đầu ra:$3.6/M
GPT-5.4 mini đưa những điểm mạnh của GPT-5.4 vào một mô hình nhanh hơn, hiệu quả hơn, được thiết kế cho khối lượng công việc lớn.
A

Claude Mythos Preview

A

Claude Mythos Preview

Sắp ra mắt
Đầu vào:$60/M
Đầu ra:$240/M
Claude Mythos Preview là mô hình tiên phong mạnh mẽ nhất của chúng tôi cho đến nay, và cho thấy một bước nhảy vọt ấn tượng về điểm số trên nhiều thước đo đánh giá so với mô hình tiên phong trước đó của chúng tôi, Claude Opus 4.6.
X

mimo-v2-pro

Đầu vào:$0.8/M
Đầu ra:$2.4/M
MiMo-V2-Pro là mô hình nền tảng chủ lực của Xiaomi, sở hữu hơn 1T tham số tổng và độ dài ngữ cảnh 1M, được tối ưu sâu cho các kịch bản tác tử. Nó thích ứng cao với các khung tác tử tổng quát như OpenClaw. Trên các benchmark chuẩn PinchBench và ClawBench, mô hình này nằm trong nhóm hàng đầu toàn cầu, với hiệu năng cảm nhận tiệm cận Opus 4.6. MiMo-V2-Pro được thiết kế để đóng vai trò bộ não của các hệ thống tác tử, điều phối các quy trình công việc phức tạp, thực thi các tác vụ kỹ thuật trong môi trường sản xuất và cung cấp kết quả một cách đáng tin cậy.

Blog liên quan

GPT 5.2 Codex ra mắt: Tính năng, điểm chuẩn và quyền truy cập
Dec 22, 2025

GPT 5.2 Codex ra mắt: Tính năng, điểm chuẩn và quyền truy cập

OpenAI đã phát hành GPT-5.2-Codex, một phiên bản GPT-5.2 được tối ưu hóa cho Codex, được thiết kế đặc biệt cho các nhiệm vụ lập trình tác tử dài hạn, tái cấu trúc và di trú quy mô lớn, khả năng sử dụng công cụ đáng tin cậy trong môi trường terminal, hành vi gốc trên Windows được cải thiện, và năng lực an ninh mạng mạnh mẽ hơn. Các benchmark như SWE-Bench Pro và Terminal-Bench 2.0 đặt GPT-5.2-Codex ở mức tiên tiến nhất trong số các mô hình lập trình tác tử.
ChatGPT sử dụng bao nhiêu nước mỗi ngày?
Dec 6, 2025
chat-gpt

ChatGPT sử dụng bao nhiêu nước mỗi ngày?

Câu trả lời ngắn gọn: Dịch vụ toàn cầu của ChatGPT có thể tiêu thụ khoảng 2 triệu đến 160 triệu lít nước mỗi ngày — một phạm vi rất rộng do
GPT-5.1 Pro là gì? Giải thích chuyên nghiệp và báo cáo tình hình
Nov 28, 2025
gpt-5-1
gpt-5-1-instant
gpt-5-1-pro

GPT-5.1 Pro là gì? Giải thích chuyên nghiệp và báo cáo tình hình

GPT-5.1 Pro của OpenAI là bản phát hành gia tăng mới nhất trong họ GPT-5: bản cập nhật mô hình cấp độ sản xuất giúp tinh chỉnh lý luận, độ trễ/thông lượng
Claude Opus 4.5: nó như thế nào — và sẽ tốn bao nhiêu?
Nov 23, 2025
gemini-3-pro
gpt-5-1

Claude Opus 4.5: nó như thế nào — và sẽ tốn bao nhiêu?

Các bài đăng trên mạng xã hội và các bài viết điều tra đã chỉ ra sự xuất hiện sắp tới của Claude Opus 4.5 (thường viết ngắn là “Opus 4.5”) — được một số nguồn nội bộ gọi là Neptune V6 — và cho biết mô hình này đang được chia sẻ với các red-teamer bên ngoài để kiểm thử jailbreak. Thông tin công khai vẫn còn rời rạc, vì vậy bài viết này tổng hợp các báo cáo hiện có, giải thích những gì rò rỉ ngụ ý về năng lực và an toàn, và đưa ra ước tính có cơ sở về mức giá khả dĩ cũng như Opus 4.5 có thể so kè ra sao với Gemini 3 của Google và GPT-5.1 của OpenAI.
Gemini 3 Pro so với GPT 5.1: cái nào tốt hơn? So sánh toàn diện
Nov 18, 2025
gemini-3-pro-preview
gpt-5-1

Gemini 3 Pro so với GPT 5.1: cái nào tốt hơn? So sánh toàn diện

Cả GPT-5.1 của OpenAI và Gemini 3 Pro của Google đều đại diện cho những bước tiến mang tính gia tăng nhưng có ý nghĩa trong cuộc chạy đua vũ trang đang tiếp diễn về AI đa phương thức, mục đích chung.