Home/Models/OpenAI/GPT Image 1.5
O

GPT Image 1.5

입력:$6.4/M
출력:$25.6/M
GPT-Image-1.5는 GPT Image family에 속한 OpenAI의 이미지 모델입니다. 텍스트 프롬프트로부터 이미지를 생성하고, 사용자 지시를 면밀히 따르면서 입력 이미지에 대한 고충실도 편집을 수행하도록 설계된 네이티브 멀티모달 GPT 모델입니다.
새로운
상업적 사용
개요
기능
가격
API
버전

GPT-Image-1.5 API란 무엇인가요?

GPT-Image-1.5는 OpenAI의 GPT Image 제품군의 최신 구성원이자, ChatGPT의 새롭게 개편된 Images 경험을 뒷받침하는 모델입니다. 이 모델은 이미지 생성을 단순한 실험 단계에서 프로덕션급 창작 도구로 끌어올리도록 설계되었습니다. 더 높은 사진 실사성, 반복 편집에 대한 더 정교한 제어, 인터랙티브 및 엔터프라이즈 워크플로를 지원하는 더 빠른 추론 속도를 제공합니다.

gpt-image-1.5 API는 하나 이상의 이미지 입력(파일 식별자 또는 바이트)과 텍스트 프롬프트를 받아 생성 이미지 또는 편집 이미지를 반환하는 멀티모달 이미지 모델 엔드포인트입니다. 다음을 지원합니다:

  • 텍스트-투-이미지 생성(프롬프트로부터 생성),
  • 이미지 편집 / 인페인팅 / 합성(기존 이미지에 지시 사항 적용, 다중 이미지 입력 허용), 그리고
  • Responses API를 통한 반복적 멀티턴 편집 워크플로(상태를 유지하면서 “tweak & iterate” UI 구현).

이 API는 이미지 프롬프트를 기존 DALL·E의 제한과 다르게 처리합니다. GPT 이미지 모델은 훨씬 더 긴 텍스트 프롬프트(32k자 가이드라인)를 허용하여, 복잡하고 제약이 많은 지시도 처리할 수 있습니다.

주요 기능(실무)

  • 편집 용이성/멀티턴 일관성 향상: 반복 편집 전반에서 캐릭터 외형, 조명, 핵심 시각 속성을 잘 보존합니다. 동일 모델로 반복 편집하는 워크플로(예: 상품 카탈로그, 브랜드 에셋)에 더욱 신뢰성을 제공합니다.
  • 처리량 향상 — GPT Image 1 대비 4× 속도 향상으로, 반복적 창작 워크플로의 지연 시간을 낮추는 데 초점을 맞췄습니다.
  • 비용 최적화 — 이미지 입출력 비용이 GPT Image 1 대비 약 20% 절감되어, 대량 반복 생성 시 이미지당 비용을 낮춥니다.
  • 다중 이미지 합성 및 스타일 참조 — 여러 참조 이미지를 받아 장면 합성이나 스타일/조명 전이를 지원합니다.
  • 품질/정확도 조절 옵션 — 속도와 충실도를 절충하는 API 파라미터 제공(대량 생성에는 낮은 품질, 프로덕션 에셋에는 높은 품질 권장).
  • 멀티턴 편집/Responses API 연동 — 단계별 워크플로를 지원(변경 요청 후 상태를 보존한 채 “미세 조정” 수행).

기술적 역량

  • 텍스트 프롬프트 한도(이미지 모델): 최대 32,000자(OpenAI는 이를 GPT 이미지 모델의 텍스트 길이 허용치로 문서화). 제약이 많은 장문의 프롬프트에 활용하세요.
  • 이미지 입력: File ID(멀티턴 플로에 권장) 또는 원시 바이트를 허용하며, 합성/참조를 위해 여러 이미지를 함께 제공할 수 있습니다.
  • 출력: PNG/JPEG 또는 플랫폼 기본 이미지 아티팩트를 API가 반환(또는 ChatGPT 내 첨부물 형태). 다수의 후보 이미지를 포함할 수 있으며, 반복 요청으로 출력을 정교화할 수 있습니다.
  • 생성 모드: 텍스트-투-이미지, 이미지 편집(지시에 따른 인페인트/확장), 변형(variants). 멀티턴 편집은 “add/subtract/combine” 스타일의 지시를 지원합니다.
  • 지시 인식형 편집: “로고 변경 금지”, “자세/조명 유지” 같은 불변 조건을 보존하도록 최적화. 프롬프트 엔지니어링 패턴(각 반복에서 불변 조건을 명시적으로 재확인)이 의미적 드리프트를 줄입니다.

벤치마크 성능

  • 리더보드 순위: 한 통합 보고서에 따르면 GPT Image 1.5는 Artificial Analysis 리더보드의 텍스트-투-이미지 순위에서 ~1264점으로 선두를 기록했으며, 차순위 모델과도 유의미한 격차를 보였습니다.
  • 태스크별 지표(편집 & 보존): Microsoft Foundry의 평가 요약에 따르면, GPT-Image-1.5는 단일 턴 BinaryEval에서 100%에 달하는 이진 수정 성공률과 AuraFace 기준 약 **90%**의 얼굴 보존 점수를 기록했습니다. 비교 표에서 경쟁 모델 및 이전 OpenAI 모델 대비 보존/편집 충실도 측면에서 앞서는 것으로 나타났습니다.

GPT Image 1.5

동급 대비 GPT-Image-1.5의 위치

  • 대비: GPT Image 1(이전 OpenAI 세대): 더 빠름(최대 4×), 더 저렴함(이미지 I/O 비용 약 20% 절감), 더 강한 편집 충실도 — “프로토타입/데모” 단계에서 “프로덕션 친화적” 이미지 워크플로로의 전환을 목표.
  • 대비: Google의 Nano Banana Pro / Gemini 이미지 모델: GPT-Image-1.5와 Google의 Nano Banana Pro / Gemini 3 제품군은 근접한 경쟁 구도 — 프롬프트 유형에 따라 각기 강점이 다름. OpenAI는 편집 충실도와 반복 속도를 강조하고, Google은 일부 사례에서 스튜디오급 사실감으로 호평.
  • 대비: Qwen Image 및 기타 오픈/클로즈드 모델: 단일 턴 평가에서 편집/보존 지표 다수에서 GPT-Image-1.5가 Qwen Image를 앞서는 경향을 보이나, 멀티턴 또는 도메인 특화 테스트에서는 격차가 좁혀질 수 있음.

GPT-Image-1.5가 강한 분야

  • 전자상거래 상품 이미징: 대량 변형, 배경 교체, 단일 사진으로 일관된 상품 카탈로그 제작(브랜드/로고 보존).
  • 크리에이티브 및 마케팅 에셋 제작: 빠른 콘셉트 반복, 포토리얼 모형, 통제 가능한 스타일 전이.
  • 사진 리터칭 및 에디토리얼 워크플로: 현실적인 의상/헤어스타일 착용 시뮬레이션, 정체성과 조명을 보존하는 선택적 리터칭.
  • 디자인 도구 통합: 디자인 플랫폼이나 CMS에 연결해 온디맨드 이미지 변형 제공(충실도 조절 옵션으로 비용 관리).
  • 다단계 합성 파이프라인: 다중 이미지 입력으로 복잡한 장면 합성과 참조 기반 생성을 구현.

GPT Image 1.5 API에 접근하는 방법

Step 1: API 키 발급

cometapi.com에 로그인하세요. 아직 사용자라면 먼저 등록해 주세요. CometAPI 콘솔에 로그인하여 인터페이스 접근 자격인 API 키를 받습니다. 개인센터의 API 토큰에서 “Add Token”을 클릭해 토큰 키(sk-xxxxx)를 발급받아 제출하세요.

Step 2: GPT Image 1.5 API로 요청 보내기

“gpt-image-1.5” 엔드포인트를 선택해 API 요청을 전송하고 요청 본문을 설정합니다. 요청 메서드와 요청 본문은 웹사이트의 API 문서에서 확인할 수 있습니다. 웹사이트에서는 편의를 위한 Apifox 테스트도 제공합니다. 계정에서 발급받은 실제 CometAPI 키로 <YOUR_API_KEY>를 교체하세요. base url은 Images (https://api.cometapi.com/v1/images/generations) 및 [Image Editing] 입니다.

content 필드에 질문이나 요청을 입력하세요 — 여기에 대해 모델이 응답합니다. API 응답을 처리하여 생성된 결과를 얻으세요.

Step 3: 결과 조회 및 검증

API 응답을 처리하여 생성된 결과를 얻습니다. 처리 후, API는 작업 상태와 출력 데이터를 함께 반환합니다.

함께 보기 Gemini 3 Pro Preview API

자주 묻는 질문

How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 delivers up to 4× speed improvements over GPT Image 1, significantly reducing latency for iterative creative workflows.

Does GPT Image 1.5 support multi-turn conversational editing?

Yes, through the Responses API, GPT Image 1.5 supports multi-turn editing workflows where you can iteratively refine images by providing follow-up instructions while preserving context.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 supports 1024×1024 (square), 1536×1024 (landscape), and 1024×1536 (portrait). Quality options include low, medium, high, and auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Yes, GPT Image 1.5 accepts multiple input images for compositing and style reference. The first 5 images are preserved with higher fidelity when using high input_fidelity mode.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 emphasizes editing fidelity and iteration speed, while Nano Banana Pro is praised for studio realism. Both are closely competitive—choose based on your workflow needs.

Does GPT Image 1.5 support transparent backgrounds?

Yes, set the background parameter to 'transparent' with PNG or WebP output formats. Transparency works best at medium or high quality settings.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 accepts prompts up to 32,000 characters, enabling highly detailed and constrained instructions for complex image generation tasks.

GPT Image 1.5의 기능

[모델 이름]의 성능과 사용성을 향상시키도록 설계된 주요 기능을 살펴보세요. 이러한 기능이 프로젝트에 어떻게 도움이 되고 사용자 경험을 개선할 수 있는지 알아보세요.

GPT Image 1.5 가격

[모델명]의 경쟁력 있는 가격을 살펴보세요. 다양한 예산과 사용 요구에 맞게 설계되었습니다. 유연한 요금제로 사용한 만큼만 지불하므로 요구사항이 증가함에 따라 쉽게 확장할 수 있습니다. [모델명]이 비용을 관리 가능한 수준으로 유지하면서 프로젝트를 어떻게 향상시킬 수 있는지 알아보세요.
코멧 가격 (USD / M Tokens)공식 가격 (USD / M Tokens)
입력:$6.4/M
출력:$25.6/M
입력:$8/M
출력:$32/M

GPT Image 1.5의 샘플 코드 및 API

gpt-image-1.5 API는 하나 이상의 이미지 입력(파일 식별자 또는 바이트)과 텍스트 프롬프트를 받아 생성된 이미지 또는 편집된 이미지를 반환하는 멀티모달 이미지 모델 엔드포인트입니다. 다음을 지원합니다:
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI

# Set your API key if not set globally
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Create output/ folder
folder_path = "output"
os.makedirs(folder_path, exist_ok=True)

# Generate the image using gpt-image-1.5
result = client.images.generate(
    model="gpt-image-1.5",
    prompt="A cute baby sea otter",
    n=1,
    size="1024x1024"
)

# Save the image to a file
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
with open(os.path.join(folder_path, "gpt-image-1.5-output.png"), "wb") as f:
    f.write(image_bytes)

print("Image saved to: output/gpt-image-1.5-output.png")

GPT Image 1.5의 버전

GPT Image 1.5에 여러 스냅샷이 존재하는 이유는 업데이트 후 출력 변동으로 인해 일관성을 유지하기 위해 이전 스냅샷을 보관하거나, 개발자에게 적응 및 마이그레이션을 위한 전환 기간을 제공하거나, 글로벌 또는 지역별 엔드포인트에 따라 다양한 스냅샷을 제공하여 사용자 경험을 최적화하기 위한 것 등이 포함될 수 있습니다. 버전 간 상세한 차이점은 공식 문서를 참고해 주시기 바랍니다.
version
gpt-image-1.5
gpt-image-1.5-2025-12-16

더 많은 모델