Hva er GPT-Image-1.5 API?
GPT-Image-1.5 er det nyeste medlemmet i OpenAIs GPT Image-familie og modellen bak ChatGPTs fornyede Images-opplevelse. Den er utviklet for å flytte bildegenerering fra nyhetseksperimenter til produksjonsklare kreative verktøy: høyere fotorealisme, finere kontroll for iterative redigeringer og raskere inferens for å støtte interaktive arbeidsflyter og bedriftsbruk.
gpt-image-1.5 API er et multimodalt endepunkt for bildemodeller som tar imot ett eller flere bildeinndata (filidentifikatorer eller byte) samt en tekstprompt og returnerer genererte eller redigerte bilder. Det støtter:
- Tekst-til-bilde-generering (opprett fra prompt),
- Bilderedigering / inpainting / kompositering (bruk instruksjoner på eksisterende bilder, flere bildeinndata er tillatt), og
- Iterative redigeringsarbeidsflyter i flere omganger gjennom Responses API (muliggjør «juster og iterer»-grensesnitt).
API-et behandler bildeprompter annerledes enn de gamle DALL·E-begrensningene: GPT-bildemodeller godtar betydelig lengre tekstprompter (retningslinjen på 32k tegn), noe som gjør komplekse instruksjoner med mange begrensninger gjennomførbare.
Hovedfunksjoner (praktisk)
- Forbedret redigerbarhet / konsistens over flere omganger: bevarer karakterutseende, lyssetting og viktige visuelle attributter på tvers av iterative redigeringer. Dette gjør «samme modell, gjentatte redigeringer» mer pålitelig for arbeidsflyter som produktkataloger eller merkevareressurser.
- Raskere gjennomstrømming — 4× hastighetsforbedringer sammenlignet med GPT Image 1, med mål om å redusere ventetid i iterative kreative arbeidsflyter.
- Kostnadsoptimaliseringer — kostnader for bildeinn/ut redusert med omtrent 20 % sammenlignet med GPT Image 1, noe som senker kostnaden per bildeiterasjon for brukere med høyt volum.
- Kompositering med flere bilder og stilreferanser — godtar flere referansebilder for å komponere scener eller overføre stil/lyssetting.
- Kvalitets-/fidelitetsinnstillinger — API-parametere som balanserer hastighet mot kvalitet (bruk lavere kvalitet for masseproduksjon; høyere kvalitet for produksjonsressurser).
- Flertrinnsredigering / integrasjon med Responses API — muliggjør trinnvise arbeidsflyter (be om endringer, og deretter «gjør justeringer» mens tilstanden bevares).
Tekniske egenskaper
- Grense for tekstprompt (bildemodeller): opptil 32 000 tegn (merk: OpenAI dokumenterer dette som tillatt tekstlengde for GPT-bildemodeller). Bruk dette for lange, instruksjonstunge prompter.
- Bildeinndata: godtar File IDs (foretrukket for flertrinnsflyter) eller rå byte; flere bilder kan oppgis for kompositering og referanse.
- Utdata: PNG/JPEG eller plattformens standard bildeartefakter returnert av API-et (eller som vedlegg i ChatGPT). Utdata kan inkludere flere kandidatbilder og støtte iterative forespørsler for å forbedre et resultat.
- Genereringsmoduser: tekst-til-bilde, bilderedigering (inpaint/utvid med instruksjoner) og varianter. Flertrinnsredigering støtter instruksjoner i stil med «legg til / trekk fra / kombiner».
- Instruksjonsbevisst redigering: modellene er optimalisert for å følge instruksjoner nøyaktig (bevare spesifiserte invarianter som «ikke endre logoen», «behold positur og lyssetting»). Prompt-teknikker (eksplisitte invarianter gjentatt i hver iterasjon) reduserer semantisk drift.
Ytelse i benchmark
- Plassering på ledertavler: Én aggregert rapport oppga GPT Image 1.5 som ledende på tekst-til-bilde-rangeringer med ~1264 poeng på en Artificial Analysis-ledertavle, foran neste modell med en målbar margin.
- Måltall på oppgavenivå (redigering og bevaring): en Microsoft Foundry-oppsummering av evalueringsmålinger viser at GPT-Image-1.5 oppnådde nesten perfekt binær suksess for modifikasjoner (100 % på en enkeltrunde BinaryEval) og sterke skårer for ansiktsbevaring (rundt 90 % på AuraFace-målinger) i deres sammenligningstabell mot konkurrenter og tidligere OpenAI-modeller. Disse sammenlignende målingene plasserer GPT-Image-1.5 foran enkelte rivaler når det gjelder bevaring og redigeringsnøyaktighet.

Hvordan GPT-Image-1.5 sammenlignes med konkurrenter
- Sammenlignet med GPT Image 1 (forrige OpenAI-generasjon): raskere (opptil 4×), billigere (~20 % lavere kostnad for bilde-I/O) og sterkere redigeringsnøyaktighet — målrettet mot å gå fra «prototype/demo» til «produksjonsvennlige» bildearbeidsflyter.
- Sammenlignet med Googles Nano Banana Pro / Gemini-bildemodeller: GPT-Image-1.5 og Googles Nano Banana Pro / Gemini 3-familie er nære rivaler — hver har styrker i ulike promptklasser. OpenAIs budskap legger vekt på redigeringsnøyaktighet og iterasjonshastighet; Googles tilbud har fått ros for studiokvalitetsrealisme i noen eksempler.
- Sammenlignet med Qwen Image og andre åpne/lukkede modeller: GPT-Image-1.5 overgår Qwen Image på flere målinger for redigering og bevaring i enkeltrundeevalueringer, men forskjellene blir mindre i flertrinns- eller andre domenespesifikke tester.
Hvor GPT-Image-1.5 er sterk
- Produktbilder for e-handel: mange varianter, bakgrunnsbytter, konsistente produktkataloger fra ett enkelt bilde (bevaring av merkevare/logo).
- Produksjon av kreative ressurser og markedsføringsmateriell: raske konseptiterasjoner, fotorealistiske mockups, kontrollert stiloverføring.
- Fotoretusjering og redaksjonelle arbeidsflyter: realistiske prøvinger av klær/frisyrer, selektiv retusjering som bevarer identitet og lyssetting.
- Integrasjon i designverktøy: koble til designplattformer eller CMS for bildevarianter på forespørsel (fidelitetsinnstillinger bidrar til kostnadskontroll).
- Kompositeringspipeliner i flere trinn: flere bildeinndata muliggjør kompositering og referansebasert generering for komplekse scener.
Hvordan få tilgang til GPT Image 1.5 API
Trinn 1: Registrer deg for API-nøkkel
Logg inn på cometapi.com. Hvis du ikke er bruker hos oss ennå, må du først registrere deg. Logg inn på CometAPI-konsollen. Hent tilgangslegitimasjonen API key for grensesnittet. Klikk på «Add Token» under API token i det personlige senteret, hent token-nøkkelen: sk-xxxxx og send inn.
Trinn 2: Send forespørsler til GPT Image 1.5 API
Velg endepunktet «gpt-image-1.5» for å sende API-forespørselen og angi forespørselskroppen. Forespørselsmetoden og forespørselskroppen finnes i API-dokumentasjonen på nettstedet vårt. Nettstedet vårt tilbyr også Apifox-test for enkelhets skyld. Erstatt <YOUR_API_KEY> med din faktiske CometAPI-nøkkel fra kontoen din. base url er Images (https://api.cometapi.com/v1/images/generations) og [Image Editing]
Sett inn spørsmålet eller forespørselen din i content-feltet — dette er det modellen vil svare på. Behandle API-responsen for å få det genererte svaret.
Trinn 3: Hent og verifiser resultater
Behandle API-responsen for å få det genererte svaret. Etter behandling svarer API-et med oppgavestatus og utdata.
Se også Gemini 3 Pro Preview API