Hva er GPT-Image-1.5 API-et?
GPT-Image-1.5 er det nyeste medlemmet av OpenAIs GPT Image-familie og modellen bak ChatGPTs fornyede Images-opplevelse. Den er designet for å flytte bildegenerering fra nyhetsverdi-eksperimenter til produksjonsklare kreative verktøy: høyere fotorealisme, finere kontroll for iterative redigeringer og raskere inferens for å støtte interaktive og bedriftsrettede arbeidsflyter.
gpt-image-1.5 API er et multimodalt bildeendepunkt som aksepterer ett eller flere bildeinput (filidentifikatorer eller bytes) pluss en tekstprompt og returnerer genererte bilder eller redigerte bilder. Det støtter:
- Tekst-til-bilde-generering (lag fra prompt),
- Bilderedigering / inpainting / kompositering (anvend instruksjoner på eksisterende bilder, flere bildeinput tillatt), og
- Iterative, fleromgangs redigeringsarbeidsflyter via Responses API (muliggjør “tweak & iterate”-grensesnitt).
API-et behandler bildeprompter annerledes enn gamle DALL·E-begrensninger: GPT-bildemodeller aksepterer betydelig lengre tekstprompter (retningslinjen på 32k tegn), noe som gjør komplekse, restriksjonstunge instruksjoner mulig.
Hovedfunksjoner (praktisk)
- Forbedret redigerbarhet / fleromgangskonsistens: bevarer karakterutseende, lyssetting og sentrale visuelle attributter på tvers av iterative redigeringer. Dette gjør “samme modell, gjentatte redigeringer” mer pålitelig for arbeidsflyter som produktkataloger eller merkevareaktiva.
- Raskere gjennomstrømning — 4× hastighetsforbedringer over GPT Image 1, med mål om lavere ventetid for iterative kreative arbeidsflyter.
- Kostnadsoptimaliseringer — kostnader for bilde-inn/ut redusert med omtrent 20 % sammenlignet med GPT Image 1, noe som senker kost per bildeiterasjon for brukere med høyt volum.
- Kompositering med flere bilder og stilreferanser — aksepter flere referansebilder for å komposittere scener eller overføre stil/lyssetting.
- Brytere for kvalitet/trofasthet — API-parametere som avveier hastighet mot trofasthet (bruk lavere kvalitet for masseproduksjon; høyere kvalitet for produksjonsaktiva).
- Fleromgangs redigering / integrasjon med Responses API — muliggjør trinnvise arbeidsflyter (be om endringer, deretter “finjuster” mens tilstand bevares).
Tekniske egenskaper
- Grense for tekstprompt (bildemodeller): opptil 32,000 tegn (merk: OpenAI dokumenterer dette som tekstlengde-tillatelsen for GPT-bildemodeller). Bruk dette for lange, restriksjonstunge prompter.
- Bildeinput: aksepterer fil-ID-er (foretrukket for fleromgangsforløp) eller rå bytes; flere bilder kan oppgis for kompositering og referanse.
- Utdata: PNG/JPEG eller plattformens standard bildefiler returnert av API-et (eller som vedlegg i ChatGPT). Utdata kan inkludere flere kandidatbilder og støtte iterative forespørsler for å raffinere et resultat.
- Generasjonsmodi: tekst-til-bilde, bilderedigering (inpaint/utvid med instruksjoner) og varianter. Fleromgangs redigering støtter instruksjoner av typen “legg til/trekk fra/kombiner”.
- Instruksjonsbevisst redigering: modellene er optimalisert for instruksjonstrofasthet (bevarer spesifiserte invariabler som “ikke endre logoen”, “behold posering og lys”). Prompt-mønstre (eksplisitte invariabler gjentatt hver iterasjon) reduserer semantisk drift.
Benchmark-ytelse
- Plassering på ledertavle: En samlet rapport siterte GPT Image 1.5 som ledende i tekst-til-bilde-rangeringer med ~1264 poeng på en Artificial Analysis-ledertavle, foran neste modell med en målbar margin.
- Oppgavenivå-metrikker (redigering og bevaring): En Microsoft Foundry-oppsummering av evalueringsmetrikker viser at GPT-Image-1.5 oppnådde tilnærmet perfekt binær modifikasjonssuksess (100 % på en ettstegs BinaryEval) og sterke ansiktsbevaringsskårer (omtrent 90 % på AuraFace-mål) i deres sammenligningstabell mot konkurrenter og tidligere OpenAI-modeller. Disse sammenlignende metrikkene plasserer GPT-Image-1.5 foran noen rivaler på bevaring og redigeringstrofasthet.

Hvordan GPT-Image-1.5 sammenlignes med jevnbyrdige
- Vs. GPT Image 1 (forrige OpenAI-generasjon): raskere (opptil 4×), billigere (~20 % lavere bilde-IO-kostnad) og sterkere redigeringstrofasthet — rettet mot å gå fra “prototype/demo” til “produksjonsvennlige” bildearbeidsflyter.
- Vs. Googles Nano Banana Pro / Gemini-bildemodeller: GPT-Image-1.5 og Googles Nano Banana Pro / Gemini 3-familie er nære rivaler — hver har styrker i ulike promptklasser. OpenAIs budskap vektlegger redigeringstrofasthet og iterasjonshastighet; Googles tilbud har blitt rost for studiokvalitets realisme i noen eksempler.
- Vs. Qwen Image og andre åpne/lukkede modeller: GPT-Image-1.5 overgår Qwen Image på flere redigerings- og bevaringsmetrikker i ettstegs-evalueringer, men forskjellene snevres inn i fleromgangs- eller andre domenespesifikke tester.
Hvor GPT-Image-1.5 er sterk
- E-handels produktavbildning: massevarianter, bakgrunnsbytter, konsistente produktkataloger fra ett enkelt foto (bevaring av merke/logo).
- Produksjon av kreative og markedsføringsaktiva: raske konseptiterasjoner, fotorealistiske mockups, kontrollert stiloverføring.
- Fotoretusjering og redaksjonelle arbeidsflyter: realistiske kles-/frisyreprøvinger, selektiv retusjering som bevarer identitet og lyssetting.
- Integrasjon i designverktøy: koble til designplattformer eller CMS for bilder på forespørsel (brytere for trofasthet hjelper med kostnadskontroll).
- Flerstegs kompositeringspipeliner: multi-bildeinput muliggjør kompositering og referansebasert generering for komplekse scener.
Slik får du tilgang til GPT Image 1.5 API
Trinn 1: Registrer deg for API-nøkkel
Logg inn på cometapi.com. Hvis du ikke er bruker ennå, registrer deg først. Logg inn på CometAPI-konsollen. Hent tilgangslegitimasjonen API-nøkkel for grensesnittet. Klikk “Add Token” ved API token i personlig senter, hent token-nøkkel: sk-xxxxx og send inn.
Trinn 2: Send forespørsler til GPT Image 1.5 API
Velg gpt-image-1.5-endepunktet for å sende API-forespørselen og angi forespørselsteksten. Forespørselsmetoden og forespørselsteksten hentes fra API-dokumentasjonen på nettstedet vårt. Nettstedet vårt tilbyr også Apifox-test for enkelhets skyld. Bytt ut <YOUR_API_KEY> med din faktiske CometAPI-nøkkel fra kontoen din. base url is Images (https://api.cometapi.com/v1/images/generations) and [Image Editing]
Sett inn spørsmålet eller forespørselen din i content-feltet—det er dette modellen svarer på . Behandle API-responsen for å hente det genererte svaret.
Trinn 3: Hent og verifiser resultater
Behandle API-responsen for å hente det genererte svaret. Etter behandling svarer API-et med oppgavestatus og utdata.
Se også Gemini 3 Pro Preview API