Home/Models/OpenAI/GPT-5.4 mini
O

GPT-5.4 mini

Đầu vào:$0.6/M
Đầu ra:$3.6/M
Bối cảnh:400,000
Đầu ra tối đa:128,000
GPT-5.4 mini đưa những điểm mạnh của GPT-5.4 vào một mô hình nhanh hơn, hiệu quả hơn, được thiết kế cho khối lượng công việc lớn.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API
Phiên bản

Thông số kỹ thuật của GPT-5.4 Mini

Hạng mụcGPT-5.4 Mini (ước tính từ nguồn chính thức + đối chiếu chéo)
Họ mô hìnhDòng GPT-5.4 (biến thể “mini” tiết kiệm chi phí)
Nhà cung cấpOpenAI
Loại đầu vàoVăn bản, Hình ảnh
Loại đầu raVăn bản
Cửa sổ ngữ cảnh400,000 tokens
Số token đầu ra tối đa128,000 tokens
Mốc kiến thức~May 31, 2024 (kế thừa dòng mini)
Hỗ trợ suy luậnCó (nhẹ so với GPT-5.4 đầy đủ)
Hỗ trợ công cụGọi hàm, tìm kiếm web, tìm kiếm tệp, tác tử (suy ra từ họ GPT-5)
Định vịMô hình tốc độ cao, tiết kiệm chi phí, tiệm cận đầu bảng

GPT-5.4 Mini là gì?

GPT-5.4 Mini là một biến thể tốc độ cao, tiết kiệm chi phí của GPT-5.4 được thiết kế cho các khối lượng công việc lớn nhạy cảm với độ trễ. Mô hình mang một phần đáng kể khả năng suy luận, viết mã và đa phương thức của GPT-5.4 vào một mô hình nhỏ hơn, nhanh hơn, được tối ưu cho hệ thống ở quy mô sản xuất.

So với các mô hình “mini” trước đây, GPT-5.4 Mini được định vị là một mô hình nhỏ tiệm cận đầu bảng, nghĩa là nó tiến gần tới hiệu năng cấp flagship trong khi giảm mạnh chi phí và thời gian phản hồi.

Các tính năng chính của GPT-5.4 Mini

  • Suy luận tốc độ cao: Tối ưu cho ứng dụng độ trễ thấp như chatbot, copilot và hệ thống thời gian thực
  • Cửa sổ ngữ cảnh lớn (400K): Hỗ trợ tài liệu dài, quy trình nhiều bước và bộ nhớ tác tử
  • Hỗ trợ viết mã & tác tử mạnh: Thiết kế cho việc dùng công cụ, suy luận nhiều bước và nhiệm vụ do tác tử phụ đảm nhiệm
  • Đầu vào đa phương thức: Chấp nhận cả văn bản và hình ảnh cho quy trình phong phú hơn
  • Mở rộng tiết kiệm chi phí: Rẻ hơn đáng kể so với GPT-5.4 trong khi vẫn giữ năng lực suy luận mạnh
  • Tối ưu pipeline tác tử: Lý tưởng cho kiến trúc đa mô hình nơi mô hình lớn lập kế hoạch và mô hình mini thực thi

Hiệu năng benchmark của GPT-5.4 Mini

  • Tiệm cận hiệu năng GPT-5.4 trên các nhiệm vụ mã hóa kiểu SWE-Bench (~94–95% hiệu năng của flagship) (ước tính đối chiếu chéo từ các thảo luận phát hành)
  • Cải thiện đáng kể so với GPT-5 Mini về:
    • độ chính xác suy luận
    • độ tin cậy khi sử dụng công cụ
    • khả năng hiểu đa phương thức
  • Được thiết kế để vượt trội các thế hệ “mini” trước trong quy trình tác tử và các benchmark mã hóa
  • đo tốc độ: những người thử nghiệm API sớm báo cáo ~180–190 token/giây trên GPT-5.4 Mini (so với ~55–120 t/s cho các biến thể GPT-5 mini cũ tùy chế độ ưu tiên).

👉 Điểm mấu chốt: GPT-5.4 Mini mang lại hiệu năng tiệm cận đầu bảng với chi phí và độ trễ chỉ bằng một phần, rất phù hợp cho hệ thống có khả năng mở rộng.

GPT-5.4 mini

Tình huống sử dụng tiêu biểu

  1. Trợ lý và trình soạn thảo mã (plugin IDE, Copilot): phân tích ngữ cảnh nhanh, khám phá codebase, và gợi ý hoàn thành nhanh khiến GPT-5.4 Mini lý tưởng cho đề xuất trong trình soạn thảo nơi thời gian tới token đầu tiên rất quan trọng. GitHub Copilot là tích hợp sớm.
  2. Tác tử phụ / nhân công được ủy quyền: nơi một tác tử chính giao các nhiệm vụ ngắn, nhanh (định dạng, bước suy luận nhỏ, tìm kiếm kiểu grep) cho một tác tử rẻ, nhanh. OpenAI định vị mini/nano cho các vai trò này.
  3. Tự động hóa API khối lượng lớn: tạo mã hàng loạt, phân loại ticket tự động, tóm tắt log ở quy mô lớn nơi chi phí mỗi lần gọi và độ trễ là ràng buộc chính. Các số liệu thông lượng từ cộng đồng cho thấy lợi thế vận hành đáng kể cho mini.
  4. Bọc công cụ và chuỗi công cụ: các lần gọi công cụ nhanh nơi mô hình điều phối lời gọi tới công cụ bên ngoài (tìm kiếm, grep, chạy kiểm thử) và trả về đầu ra ngắn gọn, có thể hành động. Họ GPT-5.4 bao gồm khả năng “sử dụng máy tính” được cải thiện.

Cách truy cập API GPT-5.4 Mini

Bước 1: Đăng ký lấy API Key

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI của bạn. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

cometapi-key

Bước 2: Gửi yêu cầu tới API GPT-5.4 Mini

Chọn endpoint “gpt-5.4-mini” để gửi yêu cầu API và thiết lập thân yêu cầu. Phương thức và thân yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Website cũng cung cấp Apifox test để bạn tiện sử dụng. Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base url là Chat Completions và Responses.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.

Câu hỏi thường gặp

Can GPT-5.4 Mini API handle long documents or large context inputs?

Yes, GPT-5.4 Mini supports a 400,000 token context window with up to 128,000 output tokens, making it suitable for long documents and multi-step workflows.

How does GPT-5.4 Mini compare to GPT-5.4 for reasoning tasks?

GPT-5.4 Mini delivers near-frontier reasoning performance but is slightly less capable than GPT-5.4 on complex multi-step or research-grade tasks.

Is GPT-5.4 Mini API suitable for real-time or low-latency applications?

Yes, GPT-5.4 Mini is optimized for speed and low latency, making it ideal for chatbots, copilots, and real-time AI systems.

Does GPT-5.4 Mini support tool use and agent workflows?

Yes, it supports function calling, web search, and agent-style workflows, making it effective in multi-step automation systems.

When should I use GPT-5.4 Mini instead of GPT-5 Mini?

Use GPT-5.4 Mini when you need significantly better reasoning, coding, and multimodal performance while still maintaining low cost and high speed.

Can GPT-5.4 Mini process images as input?

Yes, GPT-5.4 Mini supports image input alongside text, enabling multimodal use cases such as visual analysis and UI understanding.

What are the main limitations of GPT-5.4 Mini API?

Its main limitations are reduced performance compared to GPT-5.4 on very complex reasoning tasks and potential degradation in extremely long-context reasoning scenarios.

Tính năng cho GPT-5.4 mini

Khám phá các tính năng chính của GPT-5.4 mini, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho GPT-5.4 mini

Khám phá mức giá cạnh tranh cho GPT-5.4 mini, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT-5.4 mini có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$0.6/M
Đầu ra:$3.6/M
Đầu vào:$0.75/M
Đầu ra:$4.5/M
-20%

Mã mẫu và API cho GPT-5.4 mini

Truy cập mã mẫu toàn diện và tài nguyên API cho GPT-5.4 mini để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của GPT-5.4 mini trong các dự án của mình.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

response = client.responses.create(
    model="gpt-5.4-mini",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "none"},
)

print(response.output_text)

Các phiên bản của GPT-5.4 mini

Lý do GPT-5.4 mini có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.
version
gpt-5.4-mini
gpt-5.4-mini-2026-03-17

Thêm mô hình