Mô hìnhHỗ trợDoanh nghiệpBlog
500+ API Mô hình AI, Tất cả trong Một API. Chỉ cần CometAPI
API Mô hình
Nhà phát triển
Bắt đầu nhanhTài liệuBảng Điều Khiển API
Tài nguyên
Mô hình AIBlogDoanh nghiệpNhật ký thay đổiGiới thiệu
2025 CometAPI. Bảo lưu mọi quyền.Chính sách Bảo mậtĐiều khoản Dịch vụ
Home/Models/OpenAI/GPT-5 mini
O

GPT-5 mini

Đầu vào:$0.2/M
Đầu ra:$1.6/M
Bối cảnh:400K
Đầu ra tối đa:128K
GPT-5 mini là thành viên trong gia đình GPT-5 của OpenAI, được tối ưu hóa về chi phí và độ trễ, nhằm mang lại phần lớn các năng lực đa phương thức và khả năng làm theo hướng dẫn của GPT-5 với chi phí thấp hơn đáng kể cho việc sử dụng ở quy mô sản xuất lớn. Sản phẩm hướng tới các môi trường mà thông lượng, mức định giá theo mỗi token có thể dự đoán trước và phản hồi nhanh là những ràng buộc chính, đồng thời vẫn cung cấp các khả năng tổng quát mạnh mẽ.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API

Thông tin cơ bản & các tính năng chính

GPT-5 mini là thành viên của dòng GPT-5 của OpenAI được tối ưu về chi phí và độ trễ, nhằm mang lại phần lớn sức mạnh đa phương thức và khả năng tuân theo chỉ dẫn của GPT-5 với chi phí thấp hơn đáng kể cho việc sử dụng sản xuất ở quy mô lớn. Mô hình này hướng đến các môi trường mà thông lượng, mức giá trên mỗi token có thể dự đoán được, và phản hồi nhanh là các ràng buộc chính, trong khi vẫn cung cấp năng lực đa dụng mạnh mẽ.

  • Tên mô hình: gpt-5-mini
  • Cửa sổ ngữ cảnh: 400 000 token
  • Số token đầu ra tối đa: 128 000
  • Các tính năng chính: tốc độ, thông lượng, hiệu quả chi phí, đầu ra mang tính xác định đối với các lời nhắc ngắn gọn

gpt-5-mini hoạt động như thế nào?

Đường suy luận và triển khai được tối ưu hóa. Những cải thiện tốc độ trong thực tế đến từ kernel fusion, tensor parallelism được tinh chỉnh cho một đồ thị nhỏ hơn, và một môi trường chạy suy luận ưu tiên các vòng “suy nghĩ” nội bộ ngắn hơn trừ khi nhà phát triển yêu cầu suy luận sâu hơn. Đó là lý do mini đạt được mức tính toán trên mỗi lượt gọi thấp hơn đáng kể và độ trễ có thể dự đoán được cho lưu lượng lớn. Sự đánh đổi này là có chủ đích: ít tính toán hơn trên mỗi lần forward pass → chi phí thấp hơn và độ trễ trung bình thấp hơn.

Điều khiển cho nhà phát triển. GPT-5 mini cung cấp các tham số như verbosity (kiểm soát mức độ chi tiết/độ dài) và reasoning_effort (đánh đổi giữa tốc độ và độ sâu), cùng với hỗ trợ mạnh mẽ cho tool-calling (gọi hàm, chuỗi công cụ song song, và xử lý lỗi có cấu trúc), giúp các hệ thống sản xuất điều chỉnh chính xác giữa độ chính xác và chi phí.

Hiệu năng benchmark — các con số nổi bật và cách diễn giải

GPT-5 mini thường đạt khoảng ~85–95% hiệu năng của GPT-5 high trên các benchmark tổng quát, đồng thời cải thiện đáng kể về độ trễ/giá. Tài liệu ra mắt nền tảng cho thấy điểm số tuyệt đối rất cao của GPT-5 high (AIME ≈ 94.6% được báo cáo cho biến thể cao cấp nhất), trong khi mini thấp hơn đôi chút nhưng vẫn dẫn đầu ngành ở phân khúc giá của nó.

Trên nhiều benchmark tiêu chuẩn hóa và benchmark nội bộ, GPT-5 mini đạt được:

  • Trí tuệ (AIME ’25): 91.1% (so với 94.6% của GPT-5 high)
  • Đa phương thức (MMMU): 81.6% (so với 84.2% của GPT-5 high)
  • Lập trình (SWE-bench Verified): 71.0% (so với 74.9% của GPT-5 high)
  • Tuân theo chỉ dẫn (Scale MultiChallenge): 62.3% (so với 69.6%)
  • Gọi hàm (τ²-bench telecom): 74.1% (so với 96.7%)
  • Tỷ lệ ảo giác (LongFact-Concepts): 0.7% (càng thấp càng tốt)([OpenAI][4])

Những kết quả này cho thấy các đánh đổi vững chắc của GPT-5 mini giữa hiệu năng, chi phí và tốc độ.

Hạn chế

Các hạn chế đã biết: GPT-5 mini giảm năng lực suy luận sâu so với GPT-5 đầy đủ, nhạy cảm hơn với các lời nhắc mơ hồ, và vẫn còn rủi ro ảo giác.

  • Suy luận sâu bị giảm: Với các tác vụ suy luận nhiều bước, dài hạn, mô hình suy luận đầy đủ hoặc các biến thể “thinking” vượt trội hơn mini.
  • Ảo giác & quá tự tin: Mini giảm ảo giác so với các mô hình rất nhỏ nhưng không loại bỏ hoàn toàn; đầu ra cần được xác thực trong các quy trình có mức độ rủi ro cao (pháp lý, lâm sàng, tuân thủ).
  • Độ nhạy theo ngữ cảnh: Các chuỗi ngữ cảnh rất dài, phụ thuộc lẫn nhau cao sẽ phù hợp hơn với các biến thể GPT-5 đầy đủ có cửa sổ ngữ cảnh lớn hơn hoặc mô hình “thinking”.
  • Giới hạn an toàn & chính sách: Các hàng rào an toàn và giới hạn tốc độ/mức sử dụng áp dụng cho các mô hình GPT-5 khác cũng áp dụng cho mini; các tác vụ nhạy cảm cần có sự giám sát của con người.

gpt-5-mini làm được gì?

  • Tác nhân hội thoại lưu lượng lớn: độ trễ thấp, chi phí có thể dự đoán.
  • Tóm tắt tài liệu & đa phương thức: tóm tắt ngữ cảnh dài, báo cáo hình ảnh + văn bản.
  • Công cụ cho nhà phát triển ở quy mô lớn: kiểm tra mã CI, tự động review, sinh mã nhẹ.
  • Điều phối tác nhân: tool-calling với các chuỗi song song khi không cần suy luận sâu.

Tôi bắt đầu sử dụng API gpt-5-mini như thế nào?

Các bước bắt buộc

  • Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước
  • Lấy khóa API truy cập của giao diện. Nhấp vào “Add Token” trong mục API token ở trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
  • Lấy url của trang này: https://api.cometapi.com/

Cách sử dụng

  1. Chọn endpoint “gpt-5-mini“ / "gpt-5-mini-2025-08-07" để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Website của chúng tôi cũng cung cấp bài kiểm tra Apifox để bạn thuận tiện sử dụng.
  2. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn.
  3. Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi.
  4. . Xử lý phản hồi API để lấy câu trả lời được tạo.

CometAPI cung cấp REST API hoàn toàn tương thích—để di chuyển liền mạch. Các chi tiết chính xem tại  API doc:

  • Các tham số cốt lõi: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Tham số model: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
  • Xác thực:  Bearer YOUR_CometAPI_API_KEY 
  • Content-Type: application/json .

Hướng dẫn gọi API: gpt-5-chat-latest nên được gọi bằng định dạng chuẩn /v1/chat/completions format. Với các mô hình khác (gpt-5, gpt-5-mini, gpt-5-nano, và các phiên bản có ngày của chúng), khuyến nghị sử dụng the /v1/responses format is recommended. Hiện tại có hai chế độ khả dụng.

Tính năng cho GPT-5 mini

Khám phá các tính năng chính của GPT-5 mini, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho GPT-5 mini

Khám phá mức giá cạnh tranh cho GPT-5 mini, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT-5 mini có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$0.2/M
Đầu ra:$1.6/M
Đầu vào:$0.25/M
Đầu ra:$2/M
-20%

Mã mẫu và API cho GPT-5 mini

GPT-5 mini là một biến thể nhẹ, tối ưu chi phí của mô hình GPT-5 chủ lực của OpenAI, được thiết kế để cung cấp khả năng suy luận chất lượng cao và đa phương thức với độ trễ và chi phí thấp hơn.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-mini",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-mini",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

Thêm mô hình

A

Claude Opus 4.6

Đầu vào:$4/M
Đầu ra:$20/M
Claude Opus 4.6 là mô hình ngôn ngữ lớn thuộc lớp “Opus” của Anthropic, phát hành vào tháng 2 năm 2026. Mô hình này được định vị như một công cụ chủ lực cho công việc tri thức và các quy trình nghiên cứu — cải thiện khả năng suy luận với ngữ cảnh dài, lập kế hoạch nhiều bước, khả năng sử dụng công cụ (bao gồm các quy trình phần mềm agentic), và các tác vụ sử dụng máy tính như tự động tạo slide và bảng tính.
A

Claude Sonnet 4.6

Đầu vào:$2.4/M
Đầu ra:$12/M
Claude Sonnet 4.6 là mô hình Sonnet mạnh mẽ nhất của chúng tôi từ trước đến nay. Đây là một bản nâng cấp toàn diện về các kỹ năng của mô hình, bao gồm lập trình, sử dụng máy tính, suy luận trong ngữ cảnh dài, lập kế hoạch tác nhân, công việc tri thức và thiết kế. Sonnet 4.6 cũng có cửa sổ ngữ cảnh 1M token ở giai đoạn beta.
O

GPT-5.4 nano

Đầu vào:$0.16/M
Đầu ra:$1/M
GPT-5.4 nano được thiết kế cho các tác vụ trong đó tốc độ và chi phí là ưu tiên hàng đầu, như phân loại, trích xuất dữ liệu, xếp hạng và các tác tử phụ.
O

GPT-5.4 mini

Đầu vào:$0.6/M
Đầu ra:$3.6/M
GPT-5.4 mini đưa những điểm mạnh của GPT-5.4 vào một mô hình nhanh hơn, hiệu quả hơn, được thiết kế cho khối lượng công việc lớn.
A

Claude Mythos Preview

A

Claude Mythos Preview

Sắp ra mắt
Đầu vào:$60/M
Đầu ra:$240/M
Claude Mythos Preview là mô hình tiên phong mạnh mẽ nhất của chúng tôi cho đến nay, và cho thấy một bước nhảy vọt ấn tượng về điểm số trên nhiều thước đo đánh giá so với mô hình tiên phong trước đó của chúng tôi, Claude Opus 4.6.
X

mimo-v2-pro

Đầu vào:$0.8/M
Đầu ra:$2.4/M
MiMo-V2-Pro là mô hình nền tảng chủ lực của Xiaomi, sở hữu hơn 1T tham số tổng và độ dài ngữ cảnh 1M, được tối ưu sâu cho các kịch bản tác tử. Nó thích ứng cao với các khung tác tử tổng quát như OpenClaw. Trên các benchmark chuẩn PinchBench và ClawBench, mô hình này nằm trong nhóm hàng đầu toàn cầu, với hiệu năng cảm nhận tiệm cận Opus 4.6. MiMo-V2-Pro được thiết kế để đóng vai trò bộ não của các hệ thống tác tử, điều phối các quy trình công việc phức tạp, thực thi các tác vụ kỹ thuật trong môi trường sản xuất và cung cấp kết quả một cách đáng tin cậy.