Thông số kỹ thuật của GPT-5.4 Mini

Hạng mục	GPT-5.4 Mini (ước tính từ nguồn chính thức + đối chiếu chéo)
Họ mô hình	Dòng GPT-5.4 (biến thể “mini” tiết kiệm chi phí)
Nhà cung cấp	OpenAI
Loại đầu vào	Văn bản, Hình ảnh
Loại đầu ra	Văn bản
Cửa sổ ngữ cảnh	400,000 tokens
Số token đầu ra tối đa	128,000 tokens
Mốc kiến thức	~May 31, 2024 (kế thừa dòng mini)
Hỗ trợ suy luận	Có (nhẹ so với GPT-5.4 đầy đủ)
Hỗ trợ công cụ	Gọi hàm, tìm kiếm web, tìm kiếm tệp, tác tử (suy ra từ họ GPT-5)
Định vị	Mô hình tốc độ cao, tiết kiệm chi phí, tiệm cận đầu bảng

GPT-5.4 Mini là gì?

GPT-5.4 Mini là một biến thể tốc độ cao, tiết kiệm chi phí của GPT-5.4 được thiết kế cho các khối lượng công việc lớn nhạy cảm với độ trễ. Mô hình mang một phần đáng kể khả năng suy luận, viết mã và đa phương thức của GPT-5.4 vào một mô hình nhỏ hơn, nhanh hơn, được tối ưu cho hệ thống ở quy mô sản xuất.

So với các mô hình “mini” trước đây, GPT-5.4 Mini được định vị là một mô hình nhỏ tiệm cận đầu bảng, nghĩa là nó tiến gần tới hiệu năng cấp flagship trong khi giảm mạnh chi phí và thời gian phản hồi.

Các tính năng chính của GPT-5.4 Mini

Suy luận tốc độ cao: Tối ưu cho ứng dụng độ trễ thấp như chatbot, copilot và hệ thống thời gian thực
Cửa sổ ngữ cảnh lớn (400K): Hỗ trợ tài liệu dài, quy trình nhiều bước và bộ nhớ tác tử
Hỗ trợ viết mã & tác tử mạnh: Thiết kế cho việc dùng công cụ, suy luận nhiều bước và nhiệm vụ do tác tử phụ đảm nhiệm
Đầu vào đa phương thức: Chấp nhận cả văn bản và hình ảnh cho quy trình phong phú hơn
Mở rộng tiết kiệm chi phí: Rẻ hơn đáng kể so với GPT-5.4 trong khi vẫn giữ năng lực suy luận mạnh
Tối ưu pipeline tác tử: Lý tưởng cho kiến trúc đa mô hình nơi mô hình lớn lập kế hoạch và mô hình mini thực thi

Hiệu năng benchmark của GPT-5.4 Mini

Tiệm cận hiệu năng GPT-5.4 trên các nhiệm vụ mã hóa kiểu SWE-Bench (~94–95% hiệu năng của flagship) (ước tính đối chiếu chéo từ các thảo luận phát hành)
Cải thiện đáng kể so với GPT-5 Mini về:
- độ chính xác suy luận
- độ tin cậy khi sử dụng công cụ
- khả năng hiểu đa phương thức
Được thiết kế để vượt trội các thế hệ “mini” trước trong quy trình tác tử và các benchmark mã hóa
đo tốc độ: những người thử nghiệm API sớm báo cáo ~180–190 token/giây trên GPT-5.4 Mini (so với ~55–120 t/s cho các biến thể GPT-5 mini cũ tùy chế độ ưu tiên).

👉 Điểm mấu chốt: GPT-5.4 Mini mang lại hiệu năng tiệm cận đầu bảng với chi phí và độ trễ chỉ bằng một phần, rất phù hợp cho hệ thống có khả năng mở rộng.

GPT-5.4 mini

Tình huống sử dụng tiêu biểu

Trợ lý và trình soạn thảo mã (plugin IDE, Copilot): phân tích ngữ cảnh nhanh, khám phá codebase, và gợi ý hoàn thành nhanh khiến GPT-5.4 Mini lý tưởng cho đề xuất trong trình soạn thảo nơi thời gian tới token đầu tiên rất quan trọng. GitHub Copilot là tích hợp sớm.
Tác tử phụ / nhân công được ủy quyền: nơi một tác tử chính giao các nhiệm vụ ngắn, nhanh (định dạng, bước suy luận nhỏ, tìm kiếm kiểu grep) cho một tác tử rẻ, nhanh. OpenAI định vị mini/nano cho các vai trò này.
Tự động hóa API khối lượng lớn: tạo mã hàng loạt, phân loại ticket tự động, tóm tắt log ở quy mô lớn nơi chi phí mỗi lần gọi và độ trễ là ràng buộc chính. Các số liệu thông lượng từ cộng đồng cho thấy lợi thế vận hành đáng kể cho mini.
Bọc công cụ và chuỗi công cụ: các lần gọi công cụ nhanh nơi mô hình điều phối lời gọi tới công cụ bên ngoài (tìm kiếm, grep, chạy kiểm thử) và trả về đầu ra ngắn gọn, có thể hành động. Họ GPT-5.4 bao gồm khả năng “sử dụng máy tính” được cải thiện.

Cách truy cập API GPT-5.4 Mini

Bước 1: Đăng ký lấy API Key

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI của bạn. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

cometapi-key

Bước 2: Gửi yêu cầu tới API GPT-5.4 Mini

Chọn endpoint “gpt-5.4-mini” để gửi yêu cầu API và thiết lập thân yêu cầu. Phương thức và thân yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Website cũng cung cấp Apifox test để bạn tiện sử dụng. Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base url là Chat Completions và Responses.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.

Thông số kỹ thuật của GPT-5.4 Mini

Hạng mục	GPT-5.4 Mini (ước tính từ nguồn chính thức + đối chiếu chéo)
Họ mô hình	Dòng GPT-5.4 (biến thể “mini” tiết kiệm chi phí)
Nhà cung cấp	OpenAI
Loại đầu vào	Văn bản, Hình ảnh
Loại đầu ra	Văn bản
Cửa sổ ngữ cảnh	400,000 tokens
Số token đầu ra tối đa	128,000 tokens
Mốc kiến thức	~May 31, 2024 (kế thừa dòng mini)
Hỗ trợ suy luận	Có (nhẹ so với GPT-5.4 đầy đủ)
Hỗ trợ công cụ	Gọi hàm, tìm kiếm web, tìm kiếm tệp, tác tử (suy ra từ họ GPT-5)
Định vị	Mô hình tốc độ cao, tiết kiệm chi phí, tiệm cận đầu bảng

GPT-5.4 Mini là gì?

Các tính năng chính của GPT-5.4 Mini

Suy luận tốc độ cao: Tối ưu cho ứng dụng độ trễ thấp như chatbot, copilot và hệ thống thời gian thực
Cửa sổ ngữ cảnh lớn (400K): Hỗ trợ tài liệu dài, quy trình nhiều bước và bộ nhớ tác tử
Hỗ trợ viết mã & tác tử mạnh: Thiết kế cho việc dùng công cụ, suy luận nhiều bước và nhiệm vụ do tác tử phụ đảm nhiệm
Đầu vào đa phương thức: Chấp nhận cả văn bản và hình ảnh cho quy trình phong phú hơn
Mở rộng tiết kiệm chi phí: Rẻ hơn đáng kể so với GPT-5.4 trong khi vẫn giữ năng lực suy luận mạnh
Tối ưu pipeline tác tử: Lý tưởng cho kiến trúc đa mô hình nơi mô hình lớn lập kế hoạch và mô hình mini thực thi

Hiệu năng benchmark của GPT-5.4 Mini

Tiệm cận hiệu năng GPT-5.4 trên các nhiệm vụ mã hóa kiểu SWE-Bench (~94–95% hiệu năng của flagship) (ước tính đối chiếu chéo từ các thảo luận phát hành)
Cải thiện đáng kể so với GPT-5 Mini về:
- độ chính xác suy luận
- độ tin cậy khi sử dụng công cụ
- khả năng hiểu đa phương thức
Được thiết kế để vượt trội các thế hệ “mini” trước trong quy trình tác tử và các benchmark mã hóa
đo tốc độ: những người thử nghiệm API sớm báo cáo ~180–190 token/giây trên GPT-5.4 Mini (so với ~55–120 t/s cho các biến thể GPT-5 mini cũ tùy chế độ ưu tiên).

GPT-5.4 mini

Tình huống sử dụng tiêu biểu

Trợ lý và trình soạn thảo mã (plugin IDE, Copilot): phân tích ngữ cảnh nhanh, khám phá codebase, và gợi ý hoàn thành nhanh khiến GPT-5.4 Mini lý tưởng cho đề xuất trong trình soạn thảo nơi thời gian tới token đầu tiên rất quan trọng. GitHub Copilot là tích hợp sớm.
Tác tử phụ / nhân công được ủy quyền: nơi một tác tử chính giao các nhiệm vụ ngắn, nhanh (định dạng, bước suy luận nhỏ, tìm kiếm kiểu grep) cho một tác tử rẻ, nhanh. OpenAI định vị mini/nano cho các vai trò này.
Tự động hóa API khối lượng lớn: tạo mã hàng loạt, phân loại ticket tự động, tóm tắt log ở quy mô lớn nơi chi phí mỗi lần gọi và độ trễ là ràng buộc chính. Các số liệu thông lượng từ cộng đồng cho thấy lợi thế vận hành đáng kể cho mini.
Bọc công cụ và chuỗi công cụ: các lần gọi công cụ nhanh nơi mô hình điều phối lời gọi tới công cụ bên ngoài (tìm kiếm, grep, chạy kiểm thử) và trả về đầu ra ngắn gọn, có thể hành động. Họ GPT-5.4 bao gồm khả năng “sử dụng máy tính” được cải thiện.

Cách truy cập API GPT-5.4 Mini

Bước 1: Đăng ký lấy API Key

cometapi-key

Bước 2: Gửi yêu cầu tới API GPT-5.4 Mini

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.

version
gpt-5.4-mini
gpt-5.4-mini-2026-03-17

version
gpt-5.4-mini
gpt-5.4-mini-2026-03-17

GPT-5.4 mini

Thêm mô hình

GPT-5.4 mini

Thêm mô hình