gpt-image-1-mini là một mô hình hình ảnh đa phương thức được tối ưu hóa chi phí từ OpenAI chấp nhận đầu vào văn bản và hình ảnh và sản xuất đầu ra hình ảnh. Nó được định vị là phiên bản nhỏ hơn, rẻ hơn của họ GPT-Image-1 đầy đủ của OpenAI — được thiết kế cho mục đích sản xuất thông lượng cao, trong đó chi phí và độ trễ là những hạn chế quan trọng. Mô hình này được thiết kế cho các tác vụ như tạo văn bản thành hình ảnh, chỉnh sửa hình ảnh / tô màuvà quy trình làm việc kết hợp hình ảnh tham chiếu.
Đặc tính nổi bật
- Tạo văn bản → hình ảnh: chuyển đổi lời nhắc bằng ngôn ngữ tự nhiên thành hình ảnh kèm theo hướng dẫn chi tiết.
- Chỉnh sửa hình ảnh / tô màu: chấp nhận hình ảnh tham chiếu và mặt nạ để thực hiện chỉnh sửa mục tiêu.
- Thiết kế tối ưu hóa chi phí (“mini”): dấu chân nhỏ hơn mà OpenAI và các nhà quan sát mô tả là rẻ hơn nhiều trên mỗi hình ảnh so với mô hình lớn (thông điệp OpenAI/DevDay và các báo cáo ban đầu cho biết rẻ hơn khoảng 80%).
- Kiểm soát đầu ra linh hoạt: hỗ trợ kích thước, định dạng đầu ra (JPEG/PNG/WEBP), nén và nút điều chỉnh chất lượng (thấp/trung bình/cao/tự động trong sổ tay hướng dẫn).
Chi tiết kỹ thuật (kiến trúc và khả năng)
- Họ mô hình & đầu vào/đầu ra: thành viên của gpt-hình-ảnh-1 gia đình; chấp nhận lời nhắc văn bản và đầu vào hình ảnh (để chỉnh sửa) và trả về kết quả hình ảnh đã tạo. Chất lượng/kích thước tham số điều khiển độ phân giải (tối đa điển hình ~1536×1024 trong họ này—xem tài liệu để biết kích thước được hỗ trợ chính xác).
- Sự đánh đổi trong hoạt động: được thiết kế như một mô hình có dấu chân nhỏ hơn—đánh đổi một số độ trung thực cao cấp để lấy thông lượng và chi phí cải tiến trong khi vẫn duy trì tính năng nhắc nhở và chỉnh sửa mạnh mẽ.
- An toàn và siêu dữ liệu: tuân theo các quy định về an toàn hình ảnh của OpenAI và nhúng các tùy chọn siêu dữ liệu C2PA để xác định nguồn gốc khi có sẵn.
Đầu vào và đầu ra — hỗ trợ sử dụng chuẩn:
- Văn bản nhắc nhở (chuỗi) để tạo ra một hình ảnh mới.
- Hình ảnh + mặt nạ để thực hiện chỉnh sửa/vẽ lại theo mục tiêu.
- Hình ảnh tham khảo để kiểm soát phong cách hoặc bố cục.
Những điều này được hiển thị thông qua API Hình ảnh (tên mô hìnhgpt-image-1-mini).
Hạn chế
- Độ trung thực đỉnh thấp hơn: so với mô hình gpt-image-1 lớn, mini có thể mất đi một số chi tiết nhỏ và tính chân thực của ảnh (sự đánh đổi dự kiến về chi phí).
- Hiển thị văn bản và các chi tiết nhỏ: giống như nhiều mô hình hình ảnh, nó có thể vật lộn với văn bản nhỏ dễ đọc, biểu đồ dày đặc hoặc kết cấu siêu mịn; dự kiến sẽ phải xử lý hậu kỳ hoặc sử dụng các mô hình có dung lượng cao hơn cho những nhu cầu đó.
- Chỉnh sửa phạm vi: tính năng chỉnh sửa/vẽ hình ảnh có sẵn nhưng đề xuất một số hạn chế chỉnh sửa so với các công cụ web ChatGPT tương tác—việc chỉnh sửa có hiệu quả đối với nhiều tác vụ nhưng có thể yêu cầu tinh chỉnh lặp đi lặp lại.
- Các ràng buộc về an toàn và chính sách: Các đầu ra phải tuân theo các quy định kiểm duyệt/an toàn của OpenAI (nội dung khiêu dâm, hạn chế nội dung có bản quyền, đầu ra không được phép). Nhà phát triển có thể kiểm soát mức độ nhạy cảm của quy trình kiểm duyệt thông qua các tham số API được cung cấp.
Các trường hợp sử dụng được đề xuất
- Tạo nội dung khối lượng lớn (tài sản tiếp thị, hình thu nhỏ, nghệ thuật khái niệm nhanh) — nơi chi phí cho mỗi hình ảnh là chính.
- Chỉnh sửa theo chương trình / tạo mẫu — sơn hàng loạt hoặc tạo biến thể từ tài sản cơ sở.
- Các ứng dụng tương tác có hạn chế về ngân sách — giao diện trò chuyện hoặc công cụ thiết kế tích hợp trong đó tốc độ phản hồi và chi phí quan trọng hơn độ trung thực tuyệt đối.
- Tạo mẫu và tạo hình ảnh A/B — tạo ra nhiều hình ảnh ứng viên một cách nhanh chóng và chọn lọc nâng cấp hoặc chạy lại trên các mô hình lớn hơn cho các ứng viên lọt vào vòng chung kết.
Cách gọi API gpt-image-1-mini từ CometAPI
gpt-image-1-mini Giá API trong CometAPI,giảm giá 20% so với giá chính thức:
| Mã thông báo đầu vào | $2.00 |
| Mã thông báo đầu ra | $6.40 |
Các bước cần thiết
- Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước.
- Đăng nhập vào Bảng điều khiển CometAPI.
- Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Thêm mã thông báo” tại mã thông báo API trong trung tâm cá nhân, nhận khóa mã thông báo: sk-xxxxx và gửi.

Phương pháp sử dụng
- Chọn điểm cuối "gpt-image-1-mini" để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn.
- Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
- Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi.
- . Xử lý phản hồi API để nhận được câu trả lời đã tạo.
CometAPI cung cấp một API REST hoàn toàn tương thích—cho việc di chuyển liền mạch. Chi tiết chính để thế hệ hình ảnh:
- URL cơ sở: https://api.cometapi.com/v1/images/generations
- Tên Model: gpt-image-1-mini
- Xác thực:
Bearer YOUR_CometAPI_API_KEYcú đội đầu - Loại-Nội dung:
application/json.
Chỉnh sửa hình ảnh (gpt-image-1): https://api.cometapi.com/v1/images/edits
Xem thêm API GPT-image-1


