Hva er GPT-Image-1.5 API-et?

GPT-Image-1.5 er det nyeste medlemmet av OpenAIs GPT Image-familie og modellen bak ChatGPTs fornyede Images-opplevelse. Den er designet for å flytte bildegenerering fra nyhetsverdi-eksperimenter til produksjonsklare kreative verktøy: høyere fotorealisme, finere kontroll for iterative redigeringer og raskere inferens for å støtte interaktive og bedriftsrettede arbeidsflyter.

gpt-image-1.5 API er et multimodalt bildeendepunkt som aksepterer ett eller flere bildeinput (filidentifikatorer eller bytes) pluss en tekstprompt og returnerer genererte bilder eller redigerte bilder. Det støtter:

Tekst-til-bilde-generering (lag fra prompt),
Bilderedigering / inpainting / kompositering (anvend instruksjoner på eksisterende bilder, flere bildeinput tillatt), og
Iterative, fleromgangs redigeringsarbeidsflyter via Responses API (muliggjør “tweak & iterate”-grensesnitt).

API-et behandler bildeprompter annerledes enn gamle DALL·E-begrensninger: GPT-bildemodeller aksepterer betydelig lengre tekstprompter (retningslinjen på 32k tegn), noe som gjør komplekse, restriksjonstunge instruksjoner mulig.

Hovedfunksjoner (praktisk)

Forbedret redigerbarhet / fleromgangskonsistens: bevarer karakterutseende, lyssetting og sentrale visuelle attributter på tvers av iterative redigeringer. Dette gjør “samme modell, gjentatte redigeringer” mer pålitelig for arbeidsflyter som produktkataloger eller merkevareaktiva.
Raskere gjennomstrømning — 4× hastighetsforbedringer over GPT Image 1, med mål om lavere ventetid for iterative kreative arbeidsflyter.
Kostnadsoptimaliseringer — kostnader for bilde-inn/ut redusert med omtrent 20 % sammenlignet med GPT Image 1, noe som senker kost per bildeiterasjon for brukere med høyt volum.
Kompositering med flere bilder og stilreferanser — aksepter flere referansebilder for å komposittere scener eller overføre stil/lyssetting.
Brytere for kvalitet/trofasthet — API-parametere som avveier hastighet mot trofasthet (bruk lavere kvalitet for masseproduksjon; høyere kvalitet for produksjonsaktiva).
Fleromgangs redigering / integrasjon med Responses API — muliggjør trinnvise arbeidsflyter (be om endringer, deretter “finjuster” mens tilstand bevares).

Tekniske egenskaper

Grense for tekstprompt (bildemodeller): opptil 32,000 tegn (merk: OpenAI dokumenterer dette som tekstlengde-tillatelsen for GPT-bildemodeller). Bruk dette for lange, restriksjonstunge prompter.
Bildeinput: aksepterer fil-ID-er (foretrukket for fleromgangsforløp) eller rå bytes; flere bilder kan oppgis for kompositering og referanse.
Utdata: PNG/JPEG eller plattformens standard bildefiler returnert av API-et (eller som vedlegg i ChatGPT). Utdata kan inkludere flere kandidatbilder og støtte iterative forespørsler for å raffinere et resultat.
Generasjonsmodi: tekst-til-bilde, bilderedigering (inpaint/utvid med instruksjoner) og varianter. Fleromgangs redigering støtter instruksjoner av typen “legg til/trekk fra/kombiner”.
Instruksjonsbevisst redigering: modellene er optimalisert for instruksjonstrofasthet (bevarer spesifiserte invariabler som “ikke endre logoen”, “behold posering og lys”). Prompt-mønstre (eksplisitte invariabler gjentatt hver iterasjon) reduserer semantisk drift.

Benchmark-ytelse

Plassering på ledertavle: En samlet rapport siterte GPT Image 1.5 som ledende i tekst-til-bilde-rangeringer med ~1264 poeng på en Artificial Analysis-ledertavle, foran neste modell med en målbar margin.
Oppgavenivå-metrikker (redigering og bevaring): En Microsoft Foundry-oppsummering av evalueringsmetrikker viser at GPT-Image-1.5 oppnådde tilnærmet perfekt binær modifikasjonssuksess (100 % på en ettstegs BinaryEval) og sterke ansiktsbevaringsskårer (omtrent 90 % på AuraFace-mål) i deres sammenligningstabell mot konkurrenter og tidligere OpenAI-modeller. Disse sammenlignende metrikkene plasserer GPT-Image-1.5 foran noen rivaler på bevaring og redigeringstrofasthet.

GPT Image 1.5

Hvordan GPT-Image-1.5 sammenlignes med jevnbyrdige

Vs. GPT Image 1 (forrige OpenAI-generasjon): raskere (opptil 4×), billigere (~20 % lavere bilde-IO-kostnad) og sterkere redigeringstrofasthet — rettet mot å gå fra “prototype/demo” til “produksjonsvennlige” bildearbeidsflyter.
Vs. Googles Nano Banana Pro / Gemini-bildemodeller: GPT-Image-1.5 og Googles Nano Banana Pro / Gemini 3-familie er nære rivaler — hver har styrker i ulike promptklasser. OpenAIs budskap vektlegger redigeringstrofasthet og iterasjonshastighet; Googles tilbud har blitt rost for studiokvalitets realisme i noen eksempler.
Vs. Qwen Image og andre åpne/lukkede modeller: GPT-Image-1.5 overgår Qwen Image på flere redigerings- og bevaringsmetrikker i ettstegs-evalueringer, men forskjellene snevres inn i fleromgangs- eller andre domenespesifikke tester.

Hvor GPT-Image-1.5 er sterk

E-handels produktavbildning: massevarianter, bakgrunnsbytter, konsistente produktkataloger fra ett enkelt foto (bevaring av merke/logo).
Produksjon av kreative og markedsføringsaktiva: raske konseptiterasjoner, fotorealistiske mockups, kontrollert stiloverføring.
Fotoretusjering og redaksjonelle arbeidsflyter: realistiske kles-/frisyreprøvinger, selektiv retusjering som bevarer identitet og lyssetting.
Integrasjon i designverktøy: koble til designplattformer eller CMS for bilder på forespørsel (brytere for trofasthet hjelper med kostnadskontroll).
Flerstegs kompositeringspipeliner: multi-bildeinput muliggjør kompositering og referansebasert generering for komplekse scener.

Slik får du tilgang til GPT Image 1.5 API

Trinn 1: Registrer deg for API-nøkkel

Logg inn på cometapi.com. Hvis du ikke er bruker ennå, registrer deg først. Logg inn på CometAPI-konsollen. Hent tilgangslegitimasjonen API-nøkkel for grensesnittet. Klikk “Add Token” ved API token i personlig senter, hent token-nøkkel: sk-xxxxx og send inn.

Trinn 2: Send forespørsler til GPT Image 1.5 API

Velg gpt-image-1.5-endepunktet for å sende API-forespørselen og angi forespørselsteksten. Forespørselsmetoden og forespørselsteksten hentes fra API-dokumentasjonen på nettstedet vårt. Nettstedet vårt tilbyr også Apifox-test for enkelhets skyld. Bytt ut <YOUR_API_KEY> med din faktiske CometAPI-nøkkel fra kontoen din. base url is Images (https://api.cometapi.com/v1/images/generations) and [Image Editing]

Sett inn spørsmålet eller forespørselen din i content-feltet—det er dette modellen svarer på . Behandle API-responsen for å hente det genererte svaret.

Trinn 3: Hent og verifiser resultater

Behandle API-responsen for å hente det genererte svaret. Etter behandling svarer API-et med oppgavestatus og utdata.

Se også Gemini 3 Pro Preview API

GPT Image 1.5

Hva er GPT-Image-1.5 API-et?

Hovedfunksjoner (praktisk)

Tekniske egenskaper

Benchmark-ytelse

Hvordan GPT-Image-1.5 sammenlignes med jevnbyrdige

Hvor GPT-Image-1.5 er sterk

Slik får du tilgang til GPT Image 1.5 API

Trinn 1: Registrer deg for API-nøkkel

Trinn 2: Send forespørsler til GPT Image 1.5 API

Trinn 3: Hent og verifiser resultater

FAQ

How fast is GPT Image 1.5 compared to GPT Image 1?

Does GPT Image 1.5 support multi-turn conversational editing?

What resolutions and quality settings does GPT Image 1.5 support?

Can GPT Image 1.5 use multiple reference images for compositing?

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

Does GPT Image 1.5 support transparent backgrounds?

What is the maximum text prompt length for GPT Image 1.5?

Funksjoner for GPT Image 1.5

Priser for GPT Image 1.5

Eksempelkode og API for GPT Image 1.5

Versjoner av GPT Image 1.5

Flere modeller

version
gpt-image-1.5
gpt-image-1.5-2025-12-16