Tính năng chính
- Tạo ảnh từ văn bản: chuyển lời nhắc ngôn ngữ tự nhiên thành hình ảnh với khả năng tuân thủ chỉ dẫn cao.
- Chỉnh sửa ảnh / inpainting: nhận ảnh tham chiếu và mặt nạ để thực hiện chỉnh sửa có mục tiêu.
- Thiết kế tối ưu chi phí (“mini”): dấu chân nhỏ hơn mà OpenAI và giới quan sát mô tả là rẻ hơn nhiều trên mỗi ảnh so với mô hình lớn (thông điệp OpenAI/DevDay và báo cáo ban đầu cho biết rẻ hơn khoảng ~80%).
- Điều khiển đầu ra linh hoạt: hỗ trợ kích thước, định dạng đầu ra (JPEG/PNG/WEBP), nén và nút điều chỉnh chất lượng (low/medium/high/auto trong cookbook).
Chi tiết kỹ thuật (kiến trúc & khả năng)
- Họ mô hình & vào/ra: thành viên của họ gpt-image-1; nhận text prompts và image inputs (để chỉnh sửa) và trả về ảnh được tạo. Tham số Quality/size điều khiển độ phân giải (giới hạn điển hình ~1536×1024 trong họ này—xem tài liệu để biết kích cỡ được hỗ trợ chính xác).
- Đánh đổi vận hành: được thiết kế với dấu chân nhỏ—đánh đổi một phần độ trung thực cao nhất để cải thiện thông lượng và chi phí, đồng thời vẫn giữ khả năng tuân thủ chỉ dẫn và tính năng chỉnh sửa mạnh.
- An toàn & siêu dữ liệu: tuân theo hàng rào an toàn hình ảnh của OpenAI và nhúng tùy chọn siêu dữ liệu C2PA cho nguồn gốc khi khả dụng.
Đầu vào & đầu ra — cách dùng chuẩn hỗ trợ:
- Text prompt (string) để tạo ảnh mới.
- Image + mask để chỉnh sửa/inpainting có mục tiêu.
- Reference images để điều khiển phong cách hoặc bố cục.
Các mục này được cung cấp qua Images API (tên mô hìnhgpt-image-1-mini).
Hạn chế
- Độ trung thực đỉnh thấp hơn: so với mô hình gpt-image-1 lớn, bản mini có thể mất một số chi tiết siêu nhỏ và tính chân thực cao cấp (đánh đổi dự kiến cho chi phí).
- Kết xuất chữ & chi tiết rất nhỏ: như nhiều mô hình tạo ảnh, có thể gặp khó với chữ nhỏ dễ đọc, biểu đồ dày đặc hoặc kết cấu siêu mịn; hãy dự trù hậu xử lý hoặc dùng mô hình dung lượng cao hơn cho các nhu cầu đó.
- Phạm vi chỉnh sửa: tính năng chỉnh sửa/inpainting ảnh khả dụng nhưng ám chỉ một số hạn chế chỉnh sửa so với công cụ ChatGPT web tương tác—chỉnh sửa hiệu quả cho nhiều tác vụ nhưng có thể cần tinh chỉnh lặp.
- Ràng buộc an toàn & chính sách: đầu ra chịu sự kiểm duyệt/hàng rào an toàn của OpenAI (nội dung nhạy cảm, hạn chế bản quyền, nội dung bị cấm). Nhà phát triển có thể điều chỉnh độ nhạy kiểm duyệt qua tham số API nơi được hỗ trợ.
Trường hợp sử dụng khuyến nghị
- Tạo nội dung khối lượng lớn (tư liệu marketing, ảnh thu nhỏ, phác thảo ý tưởng nhanh) — nơi chi phí mỗi ảnh là ưu tiên chính.
- Chỉnh sửa / tạo mẫu theo chương trình — inpainting hàng loạt hoặc tạo biến thể từ tài nguyên cơ sở.
- Ứng dụng tương tác với ràng buộc ngân sách — giao diện trò chuyện hoặc công cụ thiết kế tích hợp, nơi tốc độ phản hồi và chi phí quan trọng hơn độ trung thực tối đa.
- Tạo mẫu & tạo ảnh A/B — tạo nhanh nhiều ảnh ứng viên và chọn lọc nâng cấp độ phân giải hoặc chạy lại trên mô hình lớn hơn cho các phương án cuối cùng.
- Cách truy cập API gpt-image-1-mini
Bước 1: Đăng ký lấy API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Nhận API key truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới API gpt-image-1-mini
Chọn endpoint “\**gpt-image-1-mini \**” để gửi yêu cầu API và thiết lập request body. Phương thức request và request body được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp Apifox test để bạn tiện sử dụng. Thay <YOUR_API_KEY> bằng CometAPI key thực tế trong tài khoản của bạn.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.