GPT-5 mini là một trọng lượng nhẹ, biến thể được tối ưu hóa về chi phí của mô hình GPT-5 hàng đầu của OpenAI, được thiết kế để cung cấp chất lượng cao khả năng suy luận và đa phương thức với độ trễ và chi phí thấp hơn.
Thông tin cơ bản và các tính năng chính
GPT-5 mini là của OpenAI tối ưu hóa chi phí và độ trễ thành viên của gia đình GPT-5, nhằm mục đích cung cấp nhiều thế mạnh đa phương thức và hướng dẫn của GPT-5 tại chi phí thấp hơn đáng kể cho mục đích sử dụng sản xuất quy mô lớn. Nó nhắm mục tiêu vào các môi trường nơi thông lượng, giá mỗi mã thông báo có thể dự đoán đượcvà phản hồi nhanh là những hạn chế chính trong khi vẫn cung cấp các khả năng đa năng mạnh mẽ.
- Tên Model:
gpt-5-mini - Cửa sổ ngữ cảnh: 400 000 mã thông báo
- Mã thông báo đầu ra tối đa: 128 000
- Các tính năng chính: tốc độ, thông lượng, hiệu quả chi phí, đầu ra xác định cho lời nhắc ngắn gọn
Chi tiết kỹ thuật — kiến trúc, suy luận và điều khiển
Đường dẫn suy luận và triển khai được tối ưu hóa. Tăng tốc thực tế đến từ hợp nhất hạt nhân, song song tenxơ được điều chỉnh cho đồ thị nhỏ hơnvà thời gian chạy suy luận thích hợp hơn các vòng lặp “suy nghĩ” nội bộ ngắn hơn Trừ khi nhà phát triển yêu cầu phân tích sâu hơn. Đó là lý do tại sao mini đạt được hiệu suất tính toán trên mỗi lệnh gọi thấp hơn đáng kể và độ trễ có thể dự đoán được cho lưu lượng truy cập lớn. Sự đánh đổi này là có chủ đích: tính toán thấp hơn cho mỗi lần chuyển tiếp → chi phí thấp hơn và độ trễ trung bình thấp hơn.
Kiểm soát của nhà phát triển. GPT-5 mini hiển thị các thông số như verbosity (kiểm soát chi tiết/chiều dài) và reasoning_effort (tốc độ giao dịch so với độ sâu), cộng với sự mạnh mẽ gọi công cụ hỗ trợ (gọi hàm, chuỗi công cụ song song và xử lý lỗi có cấu trúc), cho phép hệ thống sản xuất điều chỉnh độ chính xác so với chi phí một cách chính xác.
Hiệu suất chuẩn — số liệu tiêu đề và cách diễn giải
GPT-5 mini thường ngồi trong vòng ~85–95% của GPT-5 cao trên các tiêu chuẩn chung trong khi cải thiện đáng kể độ trễ/giá. Các tài liệu ra mắt nền tảng cho thấy điểm tuyệt đối rất cao đối với GPT-5 cao (AIME ≈ 94.6% được báo cáo cho phiên bản cao cấp nhất), với phiên bản mini có giá thấp hơn một chút nhưng vẫn dẫn đầu ngành về mức giá.
Trên một loạt các tiêu chuẩn chuẩn hóa và nội bộ, GPT-5 mini đạt được:
- Sự thông minh (AIME '25): 91.1% (so với 94.6% đối với GPT-5 cao)
- Đa phương thức (MMMU): 81.6% (so với 84.2% đối với mức cao GPT-5)
- Lập trình (Đã xác minh bằng SWE): 71.0% (so với 74.9% đối với GPT-5 cao)
- Hướng dẫn làm theo (Scale MultiChallenge): 62.3% (so với 69.6%)
- Gọi hàm (τ²-bench telecom): 74.1% (so với 96.7%)
- Tỷ lệ ảo giác (LongFact-Concepts): 0.7% (càng thấp càng tốt)()
Những kết quả này chứng minh GPT-5 mini mạnh mẽ sự đánh đổi giữa hiệu suất, chi phí và tốc độ.
Hạn chế
Các hạn chế đã biết: GPT-5 mini giảm khả năng suy luận sâu sắc so với GPT-5 đầy đủ, độ nhạy cao hơn với các dấu hiệu mơ hồ và nguy cơ ảo giác vẫn còn.
- Giảm khả năng suy luận sâu sắc: Đối với các nhiệm vụ suy luận dài hạn, nhiều bước, mô hình suy luận đầy đủ hoặc các biến thể "suy nghĩ" hoạt động tốt hơn mô hình mini.
- Ảo giác và sự tự tin thái quá: Mini làm giảm ảo giác so với các mô hình rất nhỏ nhưng không loại bỏ được ảo giác; kết quả đầu ra phải được xác thực trong các luồng có rủi ro cao (pháp lý, lâm sàng, tuân thủ).
- Độ nhạy ngữ cảnh: Các chuỗi ngữ cảnh rất dài và có tính phụ thuộc lẫn nhau cao sẽ được phục vụ tốt hơn bởi các biến thể GPT-5 đầy đủ với cửa sổ ngữ cảnh lớn hơn hoặc mô hình "suy nghĩ".
- Giới hạn về an toàn và chính sách: Các biện pháp bảo vệ an toàn và giới hạn tốc độ/mức sử dụng áp dụng cho các mẫu GPT-5 khác cũng được áp dụng cho mini; các nhiệm vụ nhạy cảm cần có sự giám sát của con người.
Các trường hợp sử dụng được đề xuất (mini nổi trội)
- Các tác nhân đàm thoại khối lượng lớn: độ trễ thấp, chi phí có thể dự đoán được. Từ khoá: thông lượng.
- Tóm tắt tài liệu và đa phương thức: tóm tắt ngữ cảnh dài, báo cáo hình ảnh + văn bản. Từ khoá: ngữ cảnh dài.
- Công cụ phát triển ở quy mô lớn: Kiểm tra mã CI, tự động xem xét, tạo mã nhẹ. Từ khoá: mã hóa tiết kiệm chi phí.
- Điều phối tác nhân: gọi công cụ với các chuỗi song song khi không cần suy luận sâu. Từ khoá: gọi công cụ.
Cách gọi gpt-5-mini API từ CometAPI
gpt-5-mini Giá API trong CometAPI,giảm giá 20% so với giá chính thức:
| Mã thông báo đầu vào | $0.20 |
| Mã thông báo đầu ra | $1.60 |
Các bước cần thiết
- Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước
- Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Thêm mã thông báo” tại mã thông báo API trong trung tâm cá nhân, nhận khóa mã thông báo: sk-xxxxx và gửi.
- Lấy url của trang web này: https://api.cometapi.com/
Phương pháp sử dụng
- Chọn hàng
gpt-5-mini“ / “gpt-5-mini-2025-08-07” điểm cuối để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API của trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn. - Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
- Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi.
- . Xử lý phản hồi API để nhận được câu trả lời đã tạo.
CometAPI cung cấp một API REST hoàn toàn tương thích—cho việc di chuyển liền mạch. Chi tiết chính để Tài liệu API:
- Tham số cốt lõi:
prompt,max_tokens_to_sample,temperature,stop_sequences - Điểm cuối: https://api.cometapi.com/v1/chat/completions
- Thông số mô hình: "
gpt-5-mini“ / “gpt-5-mini-2025-08-07" - Xác thực:
Bearer YOUR_CometAPI_API_KEY - Loại-Nội dung:
application/json.
Hướng dẫn gọi API: gpt-5-chat-latest phải được gọi bằng cách sử dụng tiêu chuẩn /v1/chat/completions format. Đối với các mô hình khác (gpt-5, gpt-5-mini, gpt-5-nano và các phiên bản cũ của chúng), sử dụng the /v1/responses format được khuyến khích. Hiện tại có hai chế độ khả dụng.
Xem thêm GPT-5 Mẫu


