How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 mang lại cải thiện tốc độ lên đến 4× so với GPT Image 1, giúp giảm đáng kể độ trễ cho các quy trình sáng tạo mang tính lặp.

Does GPT Image 1.5 support multi-turn conversational editing?

Có, thông qua Responses API, GPT Image 1.5 hỗ trợ quy trình chỉnh sửa nhiều lượt, cho phép bạn tinh chỉnh hình ảnh theo từng bước bằng cách cung cấp hướng dẫn tiếp theo đồng thời giữ nguyên ngữ cảnh.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 hỗ trợ 1024×1024 (vuông), 1536×1024 (ngang), và 1024×1536 (dọc). Tùy chọn chất lượng gồm low, medium, high và auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Có, GPT Image 1.5 chấp nhận nhiều ảnh đầu vào để ghép và tham chiếu phong cách. 5 ảnh đầu tiên được giữ với độ trung thực cao hơn khi sử dụng chế độ high input_fidelity.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 nhấn mạnh độ trung thực khi chỉnh sửa và tốc độ lặp, trong khi Nano Banana Pro được đánh giá cao về tính chân thực như trong studio. Cả hai đều cạnh tranh sát sao—hãy lựa chọn dựa trên nhu cầu quy trình làm việc của bạn.

Does GPT Image 1.5 support transparent backgrounds?

Có, đặt tham số background thành 'transparent' với định dạng xuất PNG hoặc WebP. Tính trong suốt hoạt động tốt nhất ở mức chất lượng medium hoặc high.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 chấp nhận prompt dài tối đa 32,000 ký tự, cho phép hướng dẫn rất chi tiết và được ràng buộc cho các tác vụ tạo ảnh phức tạp.

API GPT Image 1.5 Giá Phải Chăng | text-to-image

GPT-Image-1.5 API là gì?

GPT-Image-1.5 là thành viên mới nhất của dòng GPT Image của OpenAI và là mô hình đứng sau trải nghiệm Images được làm mới của ChatGPT. Mục tiêu của nó là đưa việc tạo ảnh từ các thử nghiệm mang tính mới lạ trở thành công cụ sáng tạo cấp sản xuất: độ chân thực cao hơn, khả năng kiểm soát tinh vi hơn cho các chỉnh sửa lặp, và suy luận nhanh hơn để hỗ trợ các quy trình tương tác và doanh nghiệp.

gpt-image-1.5 API là một endpoint mô hình hình ảnh đa phương thức, nhận một hoặc nhiều đầu vào hình ảnh (định danh tệp hoặc bytes) cùng với một prompt văn bản và trả về hình ảnh được tạo hoặc hình ảnh đã chỉnh sửa. Nó hỗ trợ:

Tạo ảnh từ văn bản (tạo từ prompt),
Chỉnh sửa ảnh / in-painting / compositing (áp dụng hướng dẫn lên ảnh hiện có, cho phép nhiều đầu vào hình ảnh), và
Quy trình chỉnh sửa lặp, đa lượt thông qua Responses API (cho phép giao diện “tinh chỉnh & lặp lại”).

API xử lý prompt hình ảnh khác với các giới hạn cũ của DALL·E: các mô hình ảnh GPT chấp nhận prompt văn bản dài hơn đáng kể (hướng dẫn 32k ký tự), giúp khả thi các chỉ dẫn phức tạp, nhiều ràng buộc.

Tính năng chính (thực tiễn)

Khả năng chỉnh sửa cải thiện / tính nhất quán qua nhiều lượt: giữ nguyên diện mạo nhân vật, ánh sáng và các thuộc tính hình ảnh chủ chốt trong suốt các lần chỉnh sửa lặp. Điều này khiến “cùng một mô hình, chỉnh sửa lặp lại” đáng tin cậy hơn cho các quy trình như danh mục sản phẩm hoặc tài sản thương hiệu.
Thông lượng nhanh hơn — tăng tốc 4× so với GPT Image 1, nhằm giảm độ trễ cho các quy trình sáng tạo lặp.
Tối ưu chi phí — chi phí vào/ra hình ảnh giảm khoảng 20% so với GPT Image 1, hạ chi phí lặp trên mỗi ảnh cho người dùng khối lượng lớn.
Compositing đa ảnh & tham chiếu phong cách — nhận nhiều ảnh tham chiếu để ghép cảnh hoặc chuyển phong cách/ánh sáng.
Nút điều chỉnh chất lượng/độ trung thực — các tham số API cân bằng tốc độ và độ trung thực (dùng chất lượng thấp cho tạo hàng loạt; chất lượng cao cho tài sản sản xuất).
Chỉnh sửa đa lượt / tích hợp với Responses API — cho phép quy trình theo từng bước (yêu cầu thay đổi, rồi “tinh chỉnh” trong khi giữ trạng thái).

Khả năng kỹ thuật

Giới hạn prompt văn bản (mô hình hình ảnh): lên đến 32,000 ký tự (lưu ý: OpenAI tài liệu hóa đây là mức cho phép độ dài văn bản cho các mô hình ảnh GPT). Dùng cho các prompt dài, nhiều ràng buộc.
Đầu vào hình ảnh: chấp nhận File IDs (ưu tiên cho luồng đa lượt) hoặc bytes thô; có thể cung cấp nhiều ảnh để compositing và tham chiếu.
Đầu ra: PNG/JPEG hoặc các tạo phẩm hình ảnh mặc định của nền tảng do API trả về (hoặc dưới dạng tệp đính kèm trong ChatGPT). Đầu ra có thể gồm nhiều ảnh ứng viên và hỗ trợ các yêu cầu lặp để tinh chỉnh một kết quả.
Chế độ tạo: text-to-image, chỉnh sửa hình ảnh (inpaint/mở rộng theo hướng dẫn), và biến thể. Chỉnh sửa đa lượt hỗ trợ các chỉ dẫn kiểu “thêm/bớt/kết hợp”.
Chỉnh sửa hiểu ngữ lệnh: các mô hình được tối ưu cho độ trung thực với hướng dẫn (giữ các bất biến được chỉ định như “không thay đổi logo”, “giữ dáng và ánh sáng”). Các mẫu kỹ thuật prompt (lặp lại rõ ràng các bất biến ở mỗi lượt) giúp giảm trôi nghĩa.

Hiệu năng benchmark

Vị trí trên bảng xếp hạng: Một báo cáo tổng hợp dẫn GPT Image 1.5 dẫn đầu xếp hạng text-to-image với ~1264 điểm trên bảng xếp hạng của Artificial Analysis, vượt mô hình kế tiếp với biên độ có thể đo lường.
Chỉ số cấp tác vụ (chỉnh sửa & bảo toàn): bản tóm tắt chỉ số đánh giá của Microsoft Foundry cho thấy GPT-Image-1.5 đạt tỷ lệ thành công sửa đổi nhị phân gần như hoàn hảo (100% trong BinaryEval một lượt) và điểm bảo toàn khuôn mặt cao (khoảng 90% trên thước đo AuraFace) trong bảng so sánh với đối thủ và các mô hình OpenAI trước đây. Các chỉ số so sánh đó đặt GPT-Image-1.5 vượt trước một số đối thủ về khả năng bảo toàn và độ trung thực chỉnh sửa.

GPT Image 1.5

GPT-Image-1.5 so sánh thế nào với các đối thủ

So với GPT Image 1 (thế hệ trước của OpenAI): nhanh hơn (tới 4×), rẻ hơn (~20% chi phí IO hình ảnh thấp hơn), và độ trung thực chỉnh sửa mạnh hơn — nhắm đến việc chuyển từ “prototype/demo” sang quy trình tạo ảnh “thân thiện sản xuất”.
So với các mô hình hình ảnh Nano Banana Pro / Gemini của Google: GPT-Image-1.5 và dòng Nano Banana Pro / Gemini 3 của Google là các đối thủ sát sao — mỗi bên mạnh ở những lớp prompt khác nhau. Thông điệp của OpenAI nhấn mạnh độ trung thực khi chỉnh sửa và tốc độ lặp; giải pháp của Google được khen ngợi về tính chân thực ở cấp độ studio trong một số ví dụ.
So với Qwen Image và các mô hình mở/đóng khác: GPT-Image-1.5 vượt Qwen Image ở nhiều chỉ số chỉnh sửa và bảo toàn trong đánh giá một lượt, nhưng khác biệt thu hẹp trong các bài kiểm tra đa lượt hoặc theo miền chuyên biệt khác.

GPT-Image-1.5 mạnh ở đâu

Hình ảnh sản phẩm thương mại điện tử: biến thể hàng loạt, thay nền, danh mục sản phẩm nhất quán từ một bức ảnh (giữ thương hiệu/logo).
Sản xuất tài sản sáng tạo & marketing: lặp ý tưởng nhanh, mockup chân thực, chuyển phong cách có kiểm soát.
Chỉnh ảnh & quy trình biên tập: thử đồ tóc/áo quần chân thực, chỉnh sửa chọn lọc nhưng vẫn giữ nhận dạng và ánh sáng.
Tích hợp công cụ thiết kế: cắm vào các nền tảng thiết kế hoặc CMS để tạo biến thể ảnh theo nhu cầu (nút điều chỉnh độ trung thực giúp kiểm soát chi phí).
Pipeline compositing nhiều bước: đầu vào đa ảnh cho phép compositing và tạo theo tham chiếu cho các cảnh phức tạp.

Cách truy cập GPT Image 1.5 API

Bước 1: Đăng ký lấy API Key

Đăng nhập vào cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI. Lấy API key thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy token key: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu tới GPT Image 1.5 API

Chọn endpoint “gpt-image-1.5” để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Website cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng CometAPI key thực của bạn từ tài khoản. URL cơ sở là Images (https://api.cometapi.com/v1/images/generations) và [Image Editing]

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mô hình sẽ phản hồi . Xử lý phản hồi API để nhận câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để nhận câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.

Xem thêm Gemini 3 Pro Preview API

Giá Comet (USD / M Tokens)	Giá Chính Thức (USD / M Tokens)	Giảm giá
Đầu vào:$6.4/M Đầu ra:$25.6/M	Đầu vào:$8/M Đầu ra:$32/M	-20%

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

GPT-Image-1.5 API là gì?

Tạo ảnh từ văn bản (tạo từ prompt),
Chỉnh sửa ảnh / in-painting / compositing (áp dụng hướng dẫn lên ảnh hiện có, cho phép nhiều đầu vào hình ảnh), và
Quy trình chỉnh sửa lặp, đa lượt thông qua Responses API (cho phép giao diện “tinh chỉnh & lặp lại”).

Tính năng chính (thực tiễn)

Khả năng chỉnh sửa cải thiện / tính nhất quán qua nhiều lượt: giữ nguyên diện mạo nhân vật, ánh sáng và các thuộc tính hình ảnh chủ chốt trong suốt các lần chỉnh sửa lặp. Điều này khiến “cùng một mô hình, chỉnh sửa lặp lại” đáng tin cậy hơn cho các quy trình như danh mục sản phẩm hoặc tài sản thương hiệu.
Thông lượng nhanh hơn — tăng tốc 4× so với GPT Image 1, nhằm giảm độ trễ cho các quy trình sáng tạo lặp.
Tối ưu chi phí — chi phí vào/ra hình ảnh giảm khoảng 20% so với GPT Image 1, hạ chi phí lặp trên mỗi ảnh cho người dùng khối lượng lớn.
Compositing đa ảnh & tham chiếu phong cách — nhận nhiều ảnh tham chiếu để ghép cảnh hoặc chuyển phong cách/ánh sáng.
Nút điều chỉnh chất lượng/độ trung thực — các tham số API cân bằng tốc độ và độ trung thực (dùng chất lượng thấp cho tạo hàng loạt; chất lượng cao cho tài sản sản xuất).
Chỉnh sửa đa lượt / tích hợp với Responses API — cho phép quy trình theo từng bước (yêu cầu thay đổi, rồi “tinh chỉnh” trong khi giữ trạng thái).

Khả năng kỹ thuật

Giới hạn prompt văn bản (mô hình hình ảnh): lên đến 32,000 ký tự (lưu ý: OpenAI tài liệu hóa đây là mức cho phép độ dài văn bản cho các mô hình ảnh GPT). Dùng cho các prompt dài, nhiều ràng buộc.
Đầu vào hình ảnh: chấp nhận File IDs (ưu tiên cho luồng đa lượt) hoặc bytes thô; có thể cung cấp nhiều ảnh để compositing và tham chiếu.
Đầu ra: PNG/JPEG hoặc các tạo phẩm hình ảnh mặc định của nền tảng do API trả về (hoặc dưới dạng tệp đính kèm trong ChatGPT). Đầu ra có thể gồm nhiều ảnh ứng viên và hỗ trợ các yêu cầu lặp để tinh chỉnh một kết quả.
Chế độ tạo: text-to-image, chỉnh sửa hình ảnh (inpaint/mở rộng theo hướng dẫn), và biến thể. Chỉnh sửa đa lượt hỗ trợ các chỉ dẫn kiểu “thêm/bớt/kết hợp”.
Chỉnh sửa hiểu ngữ lệnh: các mô hình được tối ưu cho độ trung thực với hướng dẫn (giữ các bất biến được chỉ định như “không thay đổi logo”, “giữ dáng và ánh sáng”). Các mẫu kỹ thuật prompt (lặp lại rõ ràng các bất biến ở mỗi lượt) giúp giảm trôi nghĩa.

Hiệu năng benchmark

Vị trí trên bảng xếp hạng: Một báo cáo tổng hợp dẫn GPT Image 1.5 dẫn đầu xếp hạng text-to-image với ~1264 điểm trên bảng xếp hạng của Artificial Analysis, vượt mô hình kế tiếp với biên độ có thể đo lường.
Chỉ số cấp tác vụ (chỉnh sửa & bảo toàn): bản tóm tắt chỉ số đánh giá của Microsoft Foundry cho thấy GPT-Image-1.5 đạt tỷ lệ thành công sửa đổi nhị phân gần như hoàn hảo (100% trong BinaryEval một lượt) và điểm bảo toàn khuôn mặt cao (khoảng 90% trên thước đo AuraFace) trong bảng so sánh với đối thủ và các mô hình OpenAI trước đây. Các chỉ số so sánh đó đặt GPT-Image-1.5 vượt trước một số đối thủ về khả năng bảo toàn và độ trung thực chỉnh sửa.

GPT Image 1.5

GPT-Image-1.5 so sánh thế nào với các đối thủ

So với GPT Image 1 (thế hệ trước của OpenAI): nhanh hơn (tới 4×), rẻ hơn (~20% chi phí IO hình ảnh thấp hơn), và độ trung thực chỉnh sửa mạnh hơn — nhắm đến việc chuyển từ “prototype/demo” sang quy trình tạo ảnh “thân thiện sản xuất”.
So với các mô hình hình ảnh Nano Banana Pro / Gemini của Google: GPT-Image-1.5 và dòng Nano Banana Pro / Gemini 3 của Google là các đối thủ sát sao — mỗi bên mạnh ở những lớp prompt khác nhau. Thông điệp của OpenAI nhấn mạnh độ trung thực khi chỉnh sửa và tốc độ lặp; giải pháp của Google được khen ngợi về tính chân thực ở cấp độ studio trong một số ví dụ.
So với Qwen Image và các mô hình mở/đóng khác: GPT-Image-1.5 vượt Qwen Image ở nhiều chỉ số chỉnh sửa và bảo toàn trong đánh giá một lượt, nhưng khác biệt thu hẹp trong các bài kiểm tra đa lượt hoặc theo miền chuyên biệt khác.

GPT-Image-1.5 mạnh ở đâu

Hình ảnh sản phẩm thương mại điện tử: biến thể hàng loạt, thay nền, danh mục sản phẩm nhất quán từ một bức ảnh (giữ thương hiệu/logo).
Sản xuất tài sản sáng tạo & marketing: lặp ý tưởng nhanh, mockup chân thực, chuyển phong cách có kiểm soát.
Chỉnh ảnh & quy trình biên tập: thử đồ tóc/áo quần chân thực, chỉnh sửa chọn lọc nhưng vẫn giữ nhận dạng và ánh sáng.
Tích hợp công cụ thiết kế: cắm vào các nền tảng thiết kế hoặc CMS để tạo biến thể ảnh theo nhu cầu (nút điều chỉnh độ trung thực giúp kiểm soát chi phí).
Pipeline compositing nhiều bước: đầu vào đa ảnh cho phép compositing và tạo theo tham chiếu cho các cảnh phức tạp.

Cách truy cập GPT Image 1.5 API

Bước 1: Đăng ký lấy API Key

Bước 2: Gửi yêu cầu tới GPT Image 1.5 API

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mô hình sẽ phản hồi . Xử lý phản hồi API để nhận câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để nhận câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.

Xem thêm Gemini 3 Pro Preview API

GPT Image 1.5

Playground cho GPT Image 1.5

GPT-Image-1.5 API là gì?

Tính năng chính (thực tiễn)

Khả năng kỹ thuật

Hiệu năng benchmark

GPT-Image-1.5 so sánh thế nào với các đối thủ

GPT-Image-1.5 mạnh ở đâu

Cách truy cập GPT Image 1.5 API

Bước 1: Đăng ký lấy API Key

Bước 2: Gửi yêu cầu tới GPT Image 1.5 API

Bước 3: Truy xuất và xác minh kết quả

Câu Hỏi Thường Gặp

Giá cả cho GPT Image 1.5

Mã mẫu và API cho GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Các phiên bản của GPT Image 1.5

GPT Image 1.5

Playground cho GPT Image 1.5

GPT-Image-1.5 API là gì?

Tính năng chính (thực tiễn)

Khả năng kỹ thuật

Hiệu năng benchmark

GPT-Image-1.5 so sánh thế nào với các đối thủ

GPT-Image-1.5 mạnh ở đâu

Cách truy cập GPT Image 1.5 API

Bước 1: Đăng ký lấy API Key

Bước 2: Gửi yêu cầu tới GPT Image 1.5 API

Bước 3: Truy xuất và xác minh kết quả

Câu Hỏi Thường Gặp

Giá cả cho GPT Image 1.5

Mã mẫu và API cho GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Các phiên bản của GPT Image 1.5