Mô hìnhGiáDoanh nghiệp
500+ API Mô hình AI, Tất cả trong Một API. Chỉ cần CometAPI
API Mô hình
Nhà phát triển
Bắt đầu nhanhTài liệuBảng Điều Khiển API
Công ty
Về chúng tôiDoanh nghiệp
Tài nguyên
Mô hình AIBlogNhật ký thay đổiHỗ trợ
Điều khoản Dịch vụChính sách Bảo mật
© 2026 CometAPI · All rights reserved
Home/Models/OpenAI/GPT Image 1.5
O

GPT Image 1.5

Đầu vào:$6.4/M
Đầu ra:$25.6/M
GPT-Image-1.5 là mô hình hình ảnh của OpenAI trong GPT Image family . Đây là một mô hình GPT đa phương thức gốc, được thiết kế để tạo hình ảnh từ lời nhắc bằng văn bản và thực hiện các chỉnh sửa hình ảnh đầu vào với độ trung thực cao, đồng thời tuân thủ chặt chẽ hướng dẫn của người dùng.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API
Phiên bản

API GPT-Image-1.5 là gì?

GPT-Image-1.5 là thành viên mới nhất trong dòng GPT Image của OpenAI và là mô hình đứng sau trải nghiệm Images được làm mới của ChatGPT. Nó được thiết kế để đưa việc tạo ảnh từ các thử nghiệm mang tính mới lạ sang công cụ sáng tạo cấp độ sản xuất: chân thực hơn, kiểm soát tinh chỉnh tốt hơn cho các lần chỉnh sửa lặp, và suy luận nhanh hơn để hỗ trợ quy trình làm việc tương tác và doanh nghiệp.

API gpt-image-1.5 là một endpoint mô hình ảnh đa phương thức, chấp nhận một hoặc nhiều đầu vào hình ảnh (mã định danh tệp hoặc byte) cùng với một lời nhắc văn bản và trả về ảnh được tạo hoặc ảnh đã chỉnh sửa. Nó hỗ trợ:

  • Tạo ảnh từ văn bản (tạo từ prompt),
  • Chỉnh sửa ảnh / in-painting / ghép ảnh (áp dụng hướng dẫn lên các ảnh hiện có, cho phép nhiều đầu vào ảnh), và
  • Quy trình chỉnh sửa lặp nhiều lượt thông qua Responses API (cho phép giao diện người dùng kiểu “tinh chỉnh & lặp lại”).

API xử lý prompt hình ảnh khác với các giới hạn cũ của DALL·E: các mô hình ảnh GPT chấp nhận prompt văn bản dài hơn đáng kể (theo hướng dẫn 32k ký tự), giúp khả thi với các chỉ dẫn phức tạp và nhiều ràng buộc.

Các tính năng chính (thực tế)

  • Khả năng chỉnh sửa được cải thiện / tính nhất quán nhiều lượt: giữ nguyên ngoại hình nhân vật, ánh sáng và các thuộc tính hình ảnh quan trọng qua các lần chỉnh sửa lặp. Điều này giúp “cùng một mẫu, chỉnh sửa lặp lại” đáng tin cậy hơn cho các quy trình như danh mục sản phẩm hoặc tài sản thương hiệu.
  • Thông lượng nhanh hơn — cải thiện tốc độ 4× so với GPT Image 1, nhằm giảm độ trễ cho các quy trình sáng tạo lặp.
  • Tối ưu chi phí — chi phí đầu vào/đầu ra hình ảnh giảm khoảng 20% so với GPT Image 1, giúp giảm chi phí lặp trên mỗi ảnh cho người dùng khối lượng lớn.
  • Ghép nhiều ảnh & tham chiếu phong cách — chấp nhận nhiều ảnh tham chiếu để ghép cảnh hoặc chuyển phong cách/ánh sáng.
  • Các tham số chất lượng/độ trung thực — tham số API cho phép đánh đổi giữa tốc độ và độ trung thực (dùng chất lượng thấp cho tạo hàng loạt; chất lượng cao cho tài sản sản xuất).
  • Chỉnh sửa nhiều lượt / tích hợp Responses API — cho phép quy trình từng bước (yêu cầu thay đổi, sau đó “tinh chỉnh” nhưng vẫn giữ trạng thái).

Khả năng kỹ thuật

  • Giới hạn prompt văn bản (mô hình ảnh): tối đa 32.000 ký tự (lưu ý: OpenAI ghi nhận đây là giới hạn độ dài văn bản cho các mô hình ảnh GPT). Hãy dùng điều này cho các prompt dài và nhiều ràng buộc.
  • Đầu vào ảnh: chấp nhận File ID (ưu tiên cho các luồng nhiều lượt) hoặc byte thô; có thể cung cấp nhiều ảnh để ghép và tham chiếu.
  • Đầu ra: các tạo tác ảnh PNG/JPEG hoặc mặc định nền tảng do API trả về (hoặc dưới dạng tệp đính kèm trong ChatGPT). Đầu ra có thể bao gồm nhiều ảnh ứng viên và hỗ trợ các yêu cầu lặp để tinh chỉnh kết quả.
  • Chế độ tạo: tạo ảnh từ văn bản, chỉnh sửa ảnh (inpaint/mở rộng với hướng dẫn), và biến thể. Chỉnh sửa nhiều lượt hỗ trợ các hướng dẫn kiểu “thêm/bớt/kết hợp”.
  • Chỉnh sửa nhận biết chỉ dẫn: mô hình được tối ưu cho độ trung thực với chỉ dẫn (giữ nguyên các bất biến được chỉ định như “không thay đổi logo”, “giữ nguyên tư thế và ánh sáng”). Các mẫu prompt engineering (lặp lại rõ ràng các bất biến ở mỗi vòng) giúp giảm lệch nghĩa.

Hiệu năng benchmark

  • Vị trí trên bảng xếp hạng: Một báo cáo tổng hợp cho biết GPT Image 1.5 dẫn đầu bảng xếp hạng chuyển văn bản thành ảnh với ~1264 điểm trên bảng xếp hạng Artificial Analysis, vượt mô hình kế tiếp với khoảng cách đáng kể.
  • Các chỉ số theo tác vụ (chỉnh sửa & bảo toàn): bản tóm tắt chỉ số đánh giá của Microsoft Foundry cho thấy GPT-Image-1.5 đạt gần như hoàn hảo về tỷ lệ thành công chỉnh sửa nhị phân (100% trên BinaryEval một lượt) và điểm bảo toàn khuôn mặt mạnh (khoảng 90% trên các thước đo AuraFace) trong bảng so sánh của họ với các đối thủ và các mô hình OpenAI trước đó. Các chỉ số so sánh đó cho thấy GPT-Image-1.5 vượt một số đối thủ về khả năng bảo toàn và độ trung thực khi chỉnh sửa.

GPT Image 1.5

GPT-Image-1.5 so với các đối thủ

  • So với GPT Image 1 (thế hệ trước của OpenAI): nhanh hơn (tối đa 4×), rẻ hơn (chi phí IO hình ảnh thấp hơn ~20%), và độ trung thực khi chỉnh sửa tốt hơn — hướng tới việc chuyển từ quy trình ảnh “nguyên mẫu/demo” sang “thân thiện với sản xuất”.
  • So với các mô hình ảnh Nano Banana Pro / Gemini của Google: GPT-Image-1.5 và dòng Nano Banana Pro / Gemini 3 của Google là các đối thủ rất sát nhau — mỗi bên có điểm mạnh ở các nhóm prompt khác nhau. Thông điệp của OpenAI nhấn mạnh vào độ trung thực khi chỉnh sửa và tốc độ lặp; sản phẩm của Google được khen ngợi về độ chân thực cấp studio trong một số ví dụ.
  • So với Qwen Image và các mô hình nguồn mở/đóng khác: GPT-Image-1.5 vượt Qwen Image trên một số chỉ số chỉnh sửa và bảo toàn trong các đánh giá một lượt, nhưng khác biệt thu hẹp lại trong các bài kiểm tra nhiều lượt hoặc các miền chuyên biệt khác.

Điểm mạnh của GPT-Image-1.5

  • Hình ảnh sản phẩm thương mại điện tử: biến thể hàng loạt, thay nền, danh mục sản phẩm nhất quán từ một ảnh duy nhất (bảo toàn thương hiệu/logo).
  • Sản xuất tài sản sáng tạo & marketing: lặp ý tưởng nhanh, mockup chân thực, chuyển phong cách có kiểm soát.
  • Chỉnh sửa ảnh & quy trình biên tập: thử quần áo/kiểu tóc chân thực, chỉnh sửa chọn lọc nhưng vẫn giữ nguyên danh tính và ánh sáng.
  • Tích hợp công cụ thiết kế: tích hợp vào nền tảng thiết kế hoặc CMS để tạo các biến thể ảnh theo yêu cầu (các tham số độ trung thực giúp kiểm soát chi phí).
  • Pipeline ghép nhiều bước: đầu vào nhiều ảnh cho phép ghép và tạo dựa trên tham chiếu cho các cảnh phức tạp.

Cách truy cập API GPT Image 1.5

Bước 1: Đăng ký API Key

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI của bạn. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Add Token” tại phần API token trong trung tâm cá nhân, lấy token key: sk-xxxxx và gửi đi.

Bước 2: Gửi yêu cầu đến API GPT Image 1.5

Chọn endpoint “gpt-image-1.5” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Website của chúng tôi cũng cung cấp bài kiểm tra Apifox để thuận tiện cho bạn. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base url là Images (https://api.cometapi.com/v1/images/generations) và [Image Editing]

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi . Xử lý phản hồi API để nhận được câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để nhận được câu trả lời được tạo. Sau khi xử lý, API phản hồi với trạng thái tác vụ và dữ liệu đầu ra.

Xem thêm Gemini 3 Pro Preview API

Câu Hỏi Thường Gặp

How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 mang lại cải thiện tốc độ lên đến 4× so với GPT Image 1, giúp giảm đáng kể độ trễ cho các quy trình sáng tạo lặp.

Does GPT Image 1.5 support multi-turn conversational editing?

Có, thông qua Responses API, GPT Image 1.5 hỗ trợ quy trình chỉnh sửa nhiều lượt, nơi bạn có thể tinh chỉnh hình ảnh theo từng bước bằng cách cung cấp hướng dẫn tiếp theo trong khi vẫn giữ ngữ cảnh.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 hỗ trợ 1024×1024 (vuông), 1536×1024 (ngang) và 1024×1536 (dọc). Các tùy chọn chất lượng bao gồm low, medium, high và auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Có, GPT Image 1.5 chấp nhận nhiều ảnh đầu vào để phối ghép và tham chiếu phong cách. 5 ảnh đầu tiên được giữ với độ trung thực cao hơn khi sử dụng chế độ input_fidelity high.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 nhấn mạnh độ trung thực khi chỉnh sửa và tốc độ lặp, trong khi Nano Banana Pro được đánh giá cao về tính chân thực kiểu studio. Cả hai đều cạnh tranh sát sao—hãy chọn dựa trên nhu cầu quy trình của bạn.

Does GPT Image 1.5 support transparent backgrounds?

Có, hãy đặt tham số background thành 'transparent' với định dạng xuất PNG hoặc WebP. Tính trong suốt hoạt động tốt nhất ở cài đặt chất lượng medium hoặc high.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 chấp nhận lời nhắc văn bản dài tới 32,000 ký tự, cho phép hướng dẫn có độ chi tiết và ràng buộc cao cho các tác vụ tạo ảnh phức tạp.

Giá cả cho GPT Image 1.5

Khám phá mức giá cạnh tranh cho GPT Image 1.5, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT Image 1.5 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$6.4/M
Đầu ra:$25.6/M
Đầu vào:$8/M
Đầu ra:$32/M
-20%

Mã mẫu và API cho GPT Image 1.5

API gpt-image-1.5 là một endpoint mô hình hình ảnh đa phương thức chấp nhận một hoặc nhiều đầu vào hình ảnh (mã định danh tệp hoặc byte) cùng với một lời nhắc văn bản và trả về các hình ảnh được tạo hoặc hình ảnh đã được chỉnh sửa. API này hỗ trợ:
POST
/v1/images/generations
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI

# Set your API key if not set globally
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Create output/ folder
folder_path = "output"
os.makedirs(folder_path, exist_ok=True)

# Generate the image using gpt-image-1.5
result = client.images.generate(
    model="gpt-image-1.5",
    prompt="A cute baby sea otter",
    n=1,
    size="1024x1024"
)

# Save the image to a file
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
with open(os.path.join(folder_path, "gpt-image-1.5-output.png"), "wb") as f:
    f.write(image_bytes)

print("Image saved to: output/gpt-image-1.5-output.png")

Python Code Example

import base64
import os
from openai import OpenAI

# Set your API key if not set globally
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Create output/ folder
folder_path = "output"
os.makedirs(folder_path, exist_ok=True)

# Generate the image using gpt-image-1.5
result = client.images.generate(
    model="gpt-image-1.5",
    prompt="A cute baby sea otter",
    n=1,
    size="1024x1024"
)

# Save the image to a file
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
with open(os.path.join(folder_path, "gpt-image-1.5-output.png"), "wb") as f:
    f.write(image_bytes)

print("Image saved to: output/gpt-image-1.5-output.png")

JavaScript Code Example

import OpenAI from "openai";
import { writeFile, mkdir } from "fs/promises";
import path from "path";
import { fileURLToPath } from "url";

const __dirname = path.dirname(fileURLToPath(import.meta.url));

// Set your API key if not set globally
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const client = new OpenAI({
  apiKey: COMETAPI_KEY,
  baseURL: "https://api.cometapi.com/v1",
});

// Create output/ folder
const folderPath = path.join(__dirname, "../output");
await mkdir(folderPath, { recursive: true });

// Generate the image using gpt-image-1.5
const result = await client.images.generate({
  model: "gpt-image-1.5",
  prompt: "A cute baby sea otter",
  n: 1,
  size: "1024x1024",
});

// Save the image to a file
const imageBuffer = Buffer.from(result.data[0].b64_json, "base64");
await writeFile(path.join(folderPath, "gpt-image-1.5-output.png"), imageBuffer);

console.log("Image saved to: output/gpt-image-1.5-output.png");

Curl Code Example

#!/bin/bash

# Set your API key if not set globally
COMETAPI_KEY="${COMETAPI_KEY:-<YOUR_COMETAPI_KEY>}"

# Create output/ folder
mkdir -p output

# Generate the image using gpt-image-1.5
response=$(curl -s https://api.cometapi.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-image-1.5",
    "prompt": "A cute baby sea otter",
    "n": 1,
    "size": "1024x1024"
  }')

# Extract base64 image data from response
if command -v jq &> /dev/null; then
  image_data=$(echo "$response" | jq -r '.data[0].b64_json')
else
  image_data=$(echo "$response" | sed -n 's/.*"b64_json":"\([^"]*\)".*/\1/p')
fi

if [ -n "$image_data" ] && [ "$image_data" != "null" ]; then
  # Decode base64 and save to file (macOS uses -D, Linux uses -d)
  echo "$image_data" | base64 -d > output/gpt-image-1.5-output.png 2>/dev/null || echo "$image_data" | base64 -D > output/gpt-image-1.5-output.png
  echo "Image saved to: output/gpt-image-1.5-output.png"
else
  echo "Error: Failed to generate image"
  echo "$response"
fi

Các phiên bản của GPT Image 1.5

Lý do GPT Image 1.5 có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.
version
gpt-image-1.5
gpt-image-1.5-2025-12-16