Thông số kỹ thuật của GPT-5.4 Mini
| Hạng mục | GPT-5.4 Mini (ước tính từ nguồn chính thức + đối chiếu chéo) |
|---|---|
| Họ mô hình | Dòng GPT-5.4 (biến thể “mini” tiết kiệm chi phí) |
| Nhà cung cấp | OpenAI |
| Loại đầu vào | Văn bản, Hình ảnh |
| Loại đầu ra | Văn bản |
| Cửa sổ ngữ cảnh | 400,000 tokens |
| Số token đầu ra tối đa | 128,000 tokens |
| Mốc kiến thức | ~May 31, 2024 (kế thừa dòng mini) |
| Hỗ trợ suy luận | Có (nhẹ so với GPT-5.4 đầy đủ) |
| Hỗ trợ công cụ | Gọi hàm, tìm kiếm web, tìm kiếm tệp, tác tử (suy ra từ họ GPT-5) |
| Định vị | Mô hình tốc độ cao, tiết kiệm chi phí, tiệm cận đầu bảng |
GPT-5.4 Mini là gì?
GPT-5.4 Mini là một biến thể tốc độ cao, tiết kiệm chi phí của GPT-5.4 được thiết kế cho các khối lượng công việc lớn nhạy cảm với độ trễ. Mô hình mang một phần đáng kể khả năng suy luận, viết mã và đa phương thức của GPT-5.4 vào một mô hình nhỏ hơn, nhanh hơn, được tối ưu cho hệ thống ở quy mô sản xuất.
So với các mô hình “mini” trước đây, GPT-5.4 Mini được định vị là một mô hình nhỏ tiệm cận đầu bảng, nghĩa là nó tiến gần tới hiệu năng cấp flagship trong khi giảm mạnh chi phí và thời gian phản hồi.
Các tính năng chính của GPT-5.4 Mini
- Suy luận tốc độ cao: Tối ưu cho ứng dụng độ trễ thấp như chatbot, copilot và hệ thống thời gian thực
- Cửa sổ ngữ cảnh lớn (400K): Hỗ trợ tài liệu dài, quy trình nhiều bước và bộ nhớ tác tử
- Hỗ trợ viết mã & tác tử mạnh: Thiết kế cho việc dùng công cụ, suy luận nhiều bước và nhiệm vụ do tác tử phụ đảm nhiệm
- Đầu vào đa phương thức: Chấp nhận cả văn bản và hình ảnh cho quy trình phong phú hơn
- Mở rộng tiết kiệm chi phí: Rẻ hơn đáng kể so với GPT-5.4 trong khi vẫn giữ năng lực suy luận mạnh
- Tối ưu pipeline tác tử: Lý tưởng cho kiến trúc đa mô hình nơi mô hình lớn lập kế hoạch và mô hình mini thực thi
Hiệu năng benchmark của GPT-5.4 Mini
- Tiệm cận hiệu năng GPT-5.4 trên các nhiệm vụ mã hóa kiểu SWE-Bench (~94–95% hiệu năng của flagship) (ước tính đối chiếu chéo từ các thảo luận phát hành)
- Cải thiện đáng kể so với GPT-5 Mini về:
- độ chính xác suy luận
- độ tin cậy khi sử dụng công cụ
- khả năng hiểu đa phương thức
- Được thiết kế để vượt trội các thế hệ “mini” trước trong quy trình tác tử và các benchmark mã hóa
- đo tốc độ: những người thử nghiệm API sớm báo cáo ~180–190 token/giây trên GPT-5.4 Mini (so với ~55–120 t/s cho các biến thể GPT-5 mini cũ tùy chế độ ưu tiên).
👉 Điểm mấu chốt: GPT-5.4 Mini mang lại hiệu năng tiệm cận đầu bảng với chi phí và độ trễ chỉ bằng một phần, rất phù hợp cho hệ thống có khả năng mở rộng.

Tình huống sử dụng tiêu biểu
- Trợ lý và trình soạn thảo mã (plugin IDE, Copilot): phân tích ngữ cảnh nhanh, khám phá codebase, và gợi ý hoàn thành nhanh khiến GPT-5.4 Mini lý tưởng cho đề xuất trong trình soạn thảo nơi thời gian tới token đầu tiên rất quan trọng. GitHub Copilot là tích hợp sớm.
- Tác tử phụ / nhân công được ủy quyền: nơi một tác tử chính giao các nhiệm vụ ngắn, nhanh (định dạng, bước suy luận nhỏ, tìm kiếm kiểu grep) cho một tác tử rẻ, nhanh. OpenAI định vị mini/nano cho các vai trò này.
- Tự động hóa API khối lượng lớn: tạo mã hàng loạt, phân loại ticket tự động, tóm tắt log ở quy mô lớn nơi chi phí mỗi lần gọi và độ trễ là ràng buộc chính. Các số liệu thông lượng từ cộng đồng cho thấy lợi thế vận hành đáng kể cho mini.
- Bọc công cụ và chuỗi công cụ: các lần gọi công cụ nhanh nơi mô hình điều phối lời gọi tới công cụ bên ngoài (tìm kiếm, grep, chạy kiểm thử) và trả về đầu ra ngắn gọn, có thể hành động. Họ GPT-5.4 bao gồm khả năng “sử dụng máy tính” được cải thiện.
Cách truy cập API GPT-5.4 Mini
Bước 1: Đăng ký lấy API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI của bạn. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu tới API GPT-5.4 Mini
Chọn endpoint “gpt-5.4-mini” để gửi yêu cầu API và thiết lập thân yêu cầu. Phương thức và thân yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Website cũng cung cấp Apifox test để bạn tiện sử dụng. Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base url là Chat Completions và Responses.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.