Home/Models/OpenAI/GPT Image 1.5
O

GPT Image 1.5

Енгізу:$6.4/M
Шығыс:$25.6/M
GPT-Image-1.5 — GPT Image family-дегі OpenAI-дің кескін моделі. Ол мәтіндік промпттерден кескіндерді генерациялауға және енгізілген кескіндерге жоғары дәлдікпен өңдеулерді орындауға арналған, пайдаланушы нұсқауларын мұқият әрі дәл ұстанатын нативті көпмодальды GPT моделі.
Жаңа
Коммерциялық пайдалану
Playground
Шолу
Мүмкіндіктер
Баға белгілеу
API
Нұсқалар

GPT-Image-1.5 API деген не?

GPT-Image-1.5 — OpenAI-дың GPT Image отбасындағы ең жаңа мүшесі және ChatGPT-тің жаңартылған Images тәжірибесінің артындағы модель. Ол сурет генерациясын жаңалық-эксперимент деңгейінен өндірістік деңгейдегі креативтік құралдарға көшіру үшін жасалған: жоғары фотореализм, итерациялық өңдеулерге арналған нәзік басқару және интерактивті әрі кәсіптік жұмыс ағымдарын қолдау үшін жылдамырақ инференс.

gpt-image-1.5 API — бұл бір немесе бірнеше сурет енгізулерін (файл идентификаторлары немесе байттар) және мәтіндік prompt қабылдап, жасалған немесе өңделген суреттерді қайтаратын мультимодальды сурет моделі endpoint-ы. Ол мыналарды қолдайды:

  • Мәтіннен суретке генерациялау (prompt негізінде жасау),
  • Суретті өңдеу / инпейнтинг / композитинг (бар суреттерге нұсқауларды қолдану, бірнеше сурет енгізулеріне рұқсат етіледі), және
  • Responses API арқылы итерациялық, көп-кезеңді өңдеу жұмыс ағындары (“tweak & iterate” UI-ларын іске қосады).

API суретке арналған prompt-тарды ескі DALL·E шектеулерінен өзгеше өңдейді: GPT сурет модельдері едәуір ұзын мәтіндік prompt-тарды қабылдайды (32k-таңбалық нұсқаулық), бұл күрделі, шектеуі көп нұсқауларды іске асыруға мүмкіндік береді.

Негізгі мүмкіндіктер (практикалық)

  • Өңдеудің жақсартылған мүмкіндігі / көп-кезеңді тұрақтылық: итерациялық өңдеулер барысында кейіпкердің келбетін, жарықтандыруды және негізгі визуалды атрибуттарды сақтайды. Бұл “бір модель, қайталанған өңдеулер” сценарийін өнім каталогтары немесе бренд активтері сияқты жұмыс ағындары үшін сенімдірек етеді.
  • Жоғары өткізу қабілеті — 4× жылдамдық өсімі GPT Image 1-мен салыстырғанда, итерациялық креативтік жұмыс ағындарындағы кідірісті азайтуға бағытталған.
  • Құнды оңтайландыру — сурет кіріс/шығыс құны GPT Image 1-ге қарағанда шамамен 20% төмендеп, жоғары көлемді пайдаланушылар үшін бір суретке шаққандағы итерация құнын азайтады.
  • Көп суретті композитинг және стильге сілтеме — көріністерді композитинг жасауға немесе стиль/жарықты көшіруге бірнеше анықтамалық суреттерді қабылдайды.
  • Сапа/дәлдік реттеулері — жылдамдық пен дәлдік арасындағы ымыраны басқаратын API параметрлері (жаппай генерация үшін төмен сапа; өндірістік активтер үшін жоғары сапа).
  • Көп-кезеңді өңдеу / Responses API интеграциясы — кезең-кезеңімен жұмыс ағындарын іске қосады (өзгерістер сұрау, содан кейін күйді сақтай отырып “түзетулер енгізу”).

Техникалық мүмкіндіктер

  • Мәтіндік prompt шегі (сурет модельдері): 32,000 таңбаға дейін (ескертпе: OpenAI мұны GPT сурет модельдері үшін рұқсат етілген мәтін ұзындығы ретінде құжаттайды). Мұны ұзын, шектеуі көп prompt-тар үшін қолданыңыз.
  • Сурет енгізулері: Файл ID-ларын (көп-кезеңді ағындар үшін ұсынылады) немесе шикі байттарды қабылдайды; композитингке және анықтама ретінде бірнеше сурет беруге болады.
  • Шығулар: API қайтаратын PNG/JPEG немесе платформа бойынша әдепкі сурет артефактілері (немесе ChatGPT ішінде тіркемелер ретінде). Шығарылымдар бірнеше кандидат суреттерден тұруы мүмкін және нәтижені нақтылау үшін итерациялық сұрауларды қолдайды.
  • Генерация режимдері: мәтіннен суретке, суретті өңдеу (нұсқаулармен бояу/кеңейту), және варианттар. Көп-кезеңді өңдеу “қосу/азайту/біріктіру” стильіндегі нұсқауларды қолдайды.
  • Нұсқауларға сезімтал өңдеу: модельдер нұсқаулардың дәлдігіне оңтайландырылған (мысалы, “логотипті өзгертпеңіз”, “поза мен жарықты сақтаңыз” сияқты көрсетілген инварианттарды сақтау). Prompt-инжиниринг үлгілері (әр итерацияда инварианттарды айқын қайталау) семантикалық ауытқуды азайтады.

Бенчмарк өнімділігі

  • Көшбасшылар тақтасы: бір агрегатталған есепте Artificial Analysis көшбасшылар тақтасында GPT Image 1.5 мәтіннен-суретке рейтингінде ~1264 ұпаймен алда деп көрсетілген, келесі модельден өлшенетін айырмамен озық.
  • Тапсырма деңгейіндегі метрикалар (өңдеу және сақталу): Microsoft Foundry бағалау метрикаларының шолуы GPT-Image-1.5-тің бір айналымдық BinaryEval бойынша 100% деңгейіндегі дерлік мінсіз бинарлық өзгерту табысына және AuraFace өлшемдері бойынша шамамен 90% бет-сақтау ұпайларына қол жеткізгенін көрсетеді; салыстыру кестесінде бәсекелестер мен алдыңғы OpenAI модельдерімен қатар. Бұл салыстырмалы метрикалар GPT-Image-1.5-ті сақталу және өңдеу дәлдігі бойынша кейбір қарсыластарынан алда қояды.

GPT Image 1.5

GPT-Image-1.5-тің баламалармен салыстырмасы

  • GPT Image 1-пен салыстырғанда: жылдамырақ (4×-қа дейін), арзанырақ (~20% төмен image IO құны), және өңдеу дәлдігі күштірек — “прототип/демо”-дан “өндірістікке ыңғайлы” сурет жұмыс ағындарына көшуге бағытталған.
  • Google’s Nano Banana Pro / Gemini сурет модельдерімен салыстырғанда: GPT-Image-1.5 және Google-дың Nano Banana Pro / Gemini 3 отбасы жақын бәсекелестер — әрқайсысының түрлі prompt кластары бойынша күшті жақтары бар. OpenAI коммуникациясы өңдеу дәлдігі мен итерация жылдамдығын ерекшелесе, Google ұсынған шешім кейбір мысалдарда студиялық деңгейдегі реализм үшін мақталған.
  • Qwen Image және өзге ашық/жабық модельдермен салыстырғанда: GPT-Image-1.5 бір айналымдық бағалауларда өңдеу және сақталудың бірнеше метрикасы бойынша Qwen Image-ден озды, бірақ көп-кезеңді немесе доменге тән сынақтарда айырмашылық азаяды.

GPT-Image-1.5 мықты тұстары

  • Электрондық коммерциядағы өнім суреттері: жаппай варианттар, артқы фондарды ауыстыру, бір суреттен тұрақты өнім каталогтары (бренд/логотипті сақтау).
  • Креатив пен маркетинг активтерін өндіру: жылдам концепт итерациялары, фотореалистік мокаптар, бақыланатын стиль трансферлері.
  • Фото ретушь және редакциялық жұмыс ағындары: киім/шаш үлгісін шынайы өлшеп көру, тұлғалық ерекшеліктер мен жарықты сақтайтын селективті ретушь.
  • Дизайн құралдарымен интеграция: сұраныс бойынша сурет варианттары үшін дизайн платформаларына немесе CMS-ке қосу (дәлдік реттеулері шығынды басқаруға көмектеседі).
  • Көпқадамды композитинг конвейерлері: көп сурет енгізулері күрделі көріністер үшін композитингке және анықтамаға негізделген генерацияға мүмкіндік береді.

GPT Image 1.5 API-ге қалай қол жеткізуге болады

1-қадам: API кілтіне тіркелу

cometapi.com сайтына кіріңіз. Егер әлі пайдаланушымыз болмасаңыз, алдымен тіркеліңіз. CometAPI консоліне кіріңіз. Интерфейстің қолжетімділік дерегі ретінде API кілтін алыңыз. Жеке кабинеттегі API token бөлімінде “Add Token” түймесін басып, token кілтін алыңыз: sk-xxxxx және жіберіңіз.

2-қадам: GPT Image 1.5 API-ге сұраулар жіберу

API сұрауын жіберу үшін “gpt-image-1.5” endpoint-ын таңдаңыз және сұрау денесін орнатыңыз. Сұрау әдісі мен сұрау денесін біздің веб-сайттағы API құжатынан алуға болады. Қолайлылық үшін веб-сайтта Apifox сынағы да ұсынылған. <YOUR_API_KEY> мәнін аккаунтыңыздағы нақты CometAPI кілтімен ауыстырыңыз. base URL — Images (https://api.cometapi.com/v1/images/generations) және [Суретті өңдеу]

Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель осыған жауап береді. Генерацияланған жауапты алу үшін API жауабын өңдеңіз.

3-қадам: Нәтижелерді алу және тексеру

Генерацияланған жауапты алу үшін API жауабын өңдеңіз. Өңдеуден кейін API тапсырма күйін және шығыс деректерін қайтарады.

Сондай-ақ қараңыз Gemini 3 Pro Preview API

ЖҚС

How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 delivers up to 4× speed improvements over GPT Image 1, significantly reducing latency for iterative creative workflows.

Does GPT Image 1.5 support multi-turn conversational editing?

Yes, through the Responses API, GPT Image 1.5 supports multi-turn editing workflows where you can iteratively refine images by providing follow-up instructions while preserving context.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 supports 1024×1024 (square), 1536×1024 (landscape), and 1024×1536 (portrait). Quality options include low, medium, high, and auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Yes, GPT Image 1.5 accepts multiple input images for compositing and style reference. The first 5 images are preserved with higher fidelity when using high input_fidelity mode.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 emphasizes editing fidelity and iteration speed, while Nano Banana Pro is praised for studio realism. Both are closely competitive—choose based on your workflow needs.

Does GPT Image 1.5 support transparent backgrounds?

Yes, set the background parameter to 'transparent' with PNG or WebP output formats. Transparency works best at medium or high quality settings.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 accepts prompts up to 32,000 characters, enabling highly detailed and constrained instructions for complex image generation tasks.

GPT Image 1.5 үшін мүмкіндіктер

[Модель атауы] негізгі мүмкіндіктерін зерттеңіз, олар өнімділік пен пайдалану ыңғайлылығын арттыруға арналған. Бұл мүмкіндіктердің сіздің жобаларыңызға қалай пайда әкелетінін және пайдаланушы тәжірибесін қалай жақсартатынын біліңіз.

GPT Image 1.5 үшін баға белгілеу

[Модель атауы] үшін әртүрлі бюджеттер мен пайдалану қажеттіліктеріне сәйкес келетін бәсекеге қабілетті баға белгілеуді зерттеңіз. Біздің икемді жоспарларымыз сіз тек пайдаланған нәрсеңіз үшін ғана төлеуіңізді қамтамасыз етеді, бұл сіздің талаптарыңыз өскен сайын масштабтауды жеңілдетеді. [Модель атауы] шығындарды басқарылатын деңгейде ұстай отырып, сіздің жобаларыңызды қалай жақсарта алатынын біліңіз.
Комета бағасы (USD / M Tokens)Ресми баға (USD / M Tokens)Жеңілдік
Енгізу:$6.4/M
Шығыс:$25.6/M
Енгізу:$8/M
Шығыс:$32/M
-20%

GPT Image 1.5 үшін үлгі код және API

gpt-image-1.5 API — бір немесе бірнеше сурет кірістерін (файл идентификаторлары немесе байттар) және мәтіндік промптты қабылдап, генерацияланған немесе өңделген суреттерді қайтаратын көпмодальды сурет моделі үшін эндпоинт болып табылады. Ол қолдайды:
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI

# Set your API key if not set globally
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Create output/ folder
folder_path = "output"
os.makedirs(folder_path, exist_ok=True)

# Generate the image using gpt-image-1.5
result = client.images.generate(
    model="gpt-image-1.5",
    prompt="A cute baby sea otter",
    n=1,
    size="1024x1024"
)

# Save the image to a file
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
with open(os.path.join(folder_path, "gpt-image-1.5-output.png"), "wb") as f:
    f.write(image_bytes)

print("Image saved to: output/gpt-image-1.5-output.png")

GPT Image 1.5 нұсқалары

GPT Image 1.5 бірнеше снупшоттарының болуының себептеріне мыналар жатады: жаңартулардан кейінгі шығыстардың өзгеруі, бұрынғы снупшоттарды тұрақтылықты сақтау үшін қолдану, әзірлеушілерге бейімделу және көшіру үшін өту кезеңін ұсыну, сондай-ақ әртүрлі снупшоттардың жаһалдық немесе аймақтық эндпоинттерге сәйкес келуі арқылы пайдаланушы тәжірибесін оңтайландыру. Нұсқалар арасындағы егжей-тегжейлі айырмашылықтар үшін ресми құжаттамаға жүгініңіз.
version
gpt-image-1.5
gpt-image-1.5-2025-12-16

Көбірек модельдер