Thông số kỹ thuật của GPT-5.4 Mini
| Hạng mục | GPT-5.4 Mini (ước tính từ thông tin chính thức + xác thực chéo) |
|---|---|
| Họ mô hình | Dòng GPT-5.4 (biến thể “mini” tiết kiệm chi phí) |
| Nhà cung cấp | OpenAI |
| Loại đầu vào | Văn bản, Hình ảnh |
| Loại đầu ra | Văn bản |
| Cửa sổ ngữ cảnh | 400,000 tokens |
| Số token đầu ra tối đa | 128,000 tokens |
| Mốc kiến thức | ~31 tháng 5, 2024 (kế thừa dòng mini) |
| Hỗ trợ suy luận | Có (nhẹ hơn so với GPT-5.4 đầy đủ) |
| Hỗ trợ công cụ | Gọi hàm, tìm kiếm web, tìm kiếm tệp, tác tử (suy ra từ họ GPT-5) |
| Định vị | Mô hình tốc độ cao, tiết kiệm chi phí, gần mức tiên phong |
GPT-5.4 Mini là gì?
GPT-5.4 Mini là biến thể tốc độ cao, tiết kiệm chi phí của GPT-5.4, được thiết kế cho các khối lượng công việc nhạy cảm với độ trễ và có lưu lượng lớn. Mô hình này mang phần đáng kể khả năng suy luận, lập trình và đa phương thức của GPT-5.4 vào một mô hình nhỏ hơn, nhanh hơn, tối ưu cho hệ thống ở quy mô sản xuất.
So với các mô hình “mini” trước đây, GPT-5.4 Mini được định vị là một mô hình nhỏ gần mức tiên phong, nghĩa là mô hình tiến gần hiệu năng hạng đầu trong khi giảm đáng kể chi phí và thời gian phản hồi.
Tính năng chính của GPT-5.4 Mini
- Suy luận tốc độ cao: Tối ưu cho các ứng dụng độ trễ thấp như chatbot, copilots và hệ thống thời gian thực
- Cửa sổ ngữ cảnh lớn (400K): Hỗ trợ tài liệu dài, quy trình nhiều bước và bộ nhớ tác tử
- Khả năng lập trình & hỗ trợ tác tử mạnh: Thiết kế cho việc sử dụng công cụ, suy luận nhiều bước và các nhiệm vụ do tác tử phụ đảm nhận
- Đầu vào đa phương thức: Chấp nhận cả đầu vào văn bản và hình ảnh cho quy trình làm việc phong phú hơn
- Khả năng mở rộng tiết kiệm chi phí: Rẻ hơn đáng kể so với GPT-5.4 trong khi vẫn giữ khả năng suy luận mạnh
- Tối ưu pipeline tác tử: Lý tưởng cho kiến trúc đa mô hình nơi mô hình lớn lập kế hoạch và mô hình mini thực thi
Hiệu năng benchmark của GPT-5.4 Mini
- Tiệm cận hiệu năng GPT-5.4 trên các tác vụ lập trình kiểu SWE-Bench (~94–95% hiệu năng của flagship) (ước tính xác thực chéo từ thảo luận phát hành)
- Cải thiện đáng kể so với GPT-5 Mini ở:
- độ chính xác suy luận
- độ tin cậy khi sử dụng công cụ
- khả năng hiểu đa phương thức
- Được thiết kế để vượt trội so với các thế hệ “mini” trước đây trong quy trình tác tử và các benchmark lập trình
- đo tốc độ: những người thử API sớm báo cáo ~180–190 tokens/sec trên GPT-5.4 Mini (so với ~55–120 t/s cho các biến thể GPT-5 mini cũ tùy chế độ ưu tiên).
👉 Điểm mấu chốt: GPT-5.4 Mini mang lại hiệu năng gần mức tiên phong với chi phí và độ trễ chỉ bằng một phần nhỏ, lý tưởng cho các hệ thống có thể mở rộng.

Trường hợp sử dụng tiêu biểu
- Trợ lý và trình chỉnh sửa mã (plugin IDE, Copilot): phân tích ngữ cảnh nhanh, khám phá codebase và gợi ý hoàn thành nhanh khiến GPT-5.4 Mini lý tưởng cho gợi ý trong trình soạn thảo nơi thời gian tới token đầu tiên rất quan trọng. GitHub Copilot là một tích hợp sớm.
- Tác tử phụ / tác vụ được ủy quyền: nơi tác tử chính ủy thác các nhiệm vụ ngắn, nhanh (định dạng, bước suy luận nhỏ, tìm kiếm kiểu grep) cho một worker rẻ và nhanh. OpenAI định vị mini/nano cho các vai trò này.
- Tự động hóa API khối lượng lớn: tạo mã hàng loạt, phân loại ticket tự động, tóm tắt log ở quy mô lớn, nơi chi phí mỗi lần gọi và độ trễ là ràng buộc chính. Số liệu thông lượng từ cộng đồng cho thấy lợi ích vận hành rõ rệt đối với dòng mini.
- Đóng gói công cụ và chuỗi công cụ: gọi công cụ nhanh nơi mô hình điều phối lệnh gọi tới các công cụ bên ngoài (search, grep, run tests) và trả về đầu ra gọn, có thể hành động. Họ GPT-5.4 bao gồm khả năng “computer use” được cải thiện.
Cách truy cập API GPT-5.4 Mini
Bước 1: Đăng ký để nhận API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy API key thông tin xác thực cho giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu đến API GPT-5.4 Mini
Chọn endpoint “gpt-5.4-mini” để gửi yêu cầu API và thiết lập phần nội dung yêu cầu. Phương thức và thân yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Website cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng CometAPI key thực tế từ tài khoản của bạn. base url là Chat Completions và Responses.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là phần mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để nhận câu trả lời được tạo. Sau khi xử lý, API phản hồi với trạng thái tác vụ và dữ liệu đầu ra.