Hvad er GPT-Image-1.5 API'et?

GPT-Image-1.5 er det nyeste medlem af OpenAI’s GPT Image-familie og modellen bag ChatGPT’s fornyede Images-oplevelse. Den er designet til at flytte billedgenerering fra nyhedsprægede eksperimenter til produktionsklare, kreative værktøjer: højere fotorealisme, finere kontrol til iterative redigeringer og hurtigere inferens for at understøtte interaktive og virksomhedsarbejdsgange.

gpt-image-1.5 API er et multimodalt billedmodel-endepunkt, der accepterer ét eller flere billedinput (fil-id’er eller bytes) plus en tekstprompt og returnerer genererede eller redigerede billeder. Det understøtter:

Tekst-til-billede-generering (opret ud fra prompt),
Billedredigering / in-painting / komposittering (anvend instruktioner på eksisterende billeder, flere billedinput er tilladt), og
Iterative redigeringsarbejdsgange over flere trin via Responses API (muliggør “tweak & iterate”-grænseflader).

API’et behandler billedprompter anderledes end de gamle DALL·E-begrænsninger: GPT-billedmodeller accepterer betydeligt længere tekstprompter (retningslinjen på 32.000 tegn), hvilket gør komplekse, restriktions-tunge instruktioner mulige.

Hovedfunktioner (praktisk)

Forbedret redigerbarhed / konsistens over flere trin: bevarer karakterudseende, lys og centrale visuelle attributter på tværs af iterative redigeringer. Dette gør “samme model, gentagne redigeringer” mere pålideligt til arbejdsgange som produktkataloger eller brandaktiver.
Hurtigere throughput — 4× hastighedsforbedringer i forhold til GPT Image 1, med fokus på lavere latenstid for iterative kreative arbejdsgange.
Omkostningsoptimeringer — input/output-omkostninger for billeder reduceret med omkring 20 % vs. GPT Image 1, hvilket sænker omkostninger pr. billediteration for brugere med høj volumen.
Komposittering af flere billeder og stilreferencer — accepterer flere referencebilleder til at komposittere scener eller overføre stil/lys.
Kvalitets-/fidelitetskontroller — API-parametre, der afvejer hastighed vs. fidelitet (brug lavere kvalitet til massegenerering; højere kvalitet til produktionsaktiver).
Redigering over flere trin / integration med Responses API — muliggør trinvis arbejdsgang (anmod om ændringer, og “lav justeringer”, mens tilstanden bevares).

Tekniske muligheder

Begrænsning for tekstprompter (billedmodeller): op til 32.000 tegn (bemærk: OpenAI dokumenterer dette som tekstlængde-tilladelsen for GPT-billedmodeller). Brug dette til lange, restriktions-tunge prompter.
Billedinput: accepterer fil-ID’er (foretrukket til flertrinsforløb) eller rå bytes; flere billeder kan angives til komposittering og reference.
Output: PNG/JPEG eller platformens standardbilledeartefakter returneret af API’et (eller som vedhæftninger i ChatGPT). Output kan inkludere flere kandidatsbilleder og understøtte iterative anmodninger for at forfine et resultat.
Genereringstilstande: tekst-til-billede, billedredigering (inpaint/udvid med instruktioner) og varianter. Redigering over flere trin understøtter “tilføj/fjern/kombinér”-instruktioner.
Instruktionsbevidst redigering: modellerne er optimeret til instruktionsfidelitet (bevarer specificerede invarianter som “ændr ikke logoet”, “bevar positur og lys”). Prompt-engineering-mønstre (eksplicitte invarianter gentaget ved hver iteration) reducerer semantisk drift.

Benchmark-ydeevne

Placering på leaderboard: En samlet rapport citerede GPT Image 1.5 som førende på tekst-til-billede-ranglisten med ~1264 point på en Artificial Analysis-leaderboard, foran den næste model med en målbar margen.
Opgaveniveau-metrikker (redigering og bevarelse): et Microsoft Foundry-resumé af evalueringsmetrikker viser, at GPT-Image-1.5 opnår næsten perfekt succesrate for binære ændringer (100 % på en enkelt-omgang BinaryEval) og stærke ansigtsbevarings-scorer (omkring 90 % på AuraFace-målinger) i deres sammenligningstabel mod konkurrenter og tidligere OpenAI-modeller. Disse sammenlignende metrikker placerer GPT-Image-1.5 foran nogle rivaler på bevarelse og redigeringsfidelitet.

GPT Image 1.5

Hvordan GPT-Image-1.5 sammenligner sig med konkurrenter

Vs. GPT Image 1 (tidligere OpenAI-generation): hurtigere (op til 4×), billigere (~20 % lavere image IO-omkostninger) og stærkere redigeringsfidelitet — målrettet mod at flytte fra “prototype/demo” til “produktionsvenlige” billedarbejdsgange.
Vs. Google’s Nano Banana Pro / Gemini-billedmodeller: GPT-Image-1.5 og Google’s Nano Banana Pro / Gemini 3-familien er tætte rivaler — hver har styrker i forskellige promptklasser. OpenAI’s budskaber fremhæver redigeringsfidelitet og iterationshastighed; Googles tilbud er blevet rost for studiokvalitetsrealisme i nogle eksempler.
Vs. Qwen Image og andre åbne/lukkede modeller: GPT-Image-1.5 overgår Qwen Image på flere redigerings- og bevaringsmetrikker i enkelt-omgangsevalueringer, men forskellene indsnævres i fler-omgangs- eller andre domænespecifikke tests.

Hvor GPT-Image-1.5 er stærk

E-handels produktbilledbehandling: massevarianter, baggrundsudskiftning, konsistente produktkataloger fra ét foto (bevarelse af brand/logo).
Produktion af kreative og marketingaktiver: hurtige koncept-iterationer, fotorealistiske mockups, kontrollerede stiloverførsler.
Fotoretouchering og redaktionelle arbejdsgange: realistiske afprøvninger af tøj/frisure, selektiv retouchering, der bevarer identitet og lys.
Integration med designværktøjer: tilslut til designplatforme eller CMS for on-demand billedevarianter (fidelitetskontroller hjælper med omkostningsstyring).
Flertrins kompositterings-pipelines: input med flere billeder muliggør komposittering og referencebaseret generering for komplekse scener.

Sådan får du adgang til GPT Image 1.5 API

Trin 1: Tilmeld dig for at få en API-nøgle

Log ind på cometapi.com. Hvis du ikke er bruger endnu, skal du først registrere dig. Log ind på din CometAPI-konsol. Hent grænsefladens adgangslegitimation API-nøgle. Klik på “Add Token” ved API-tokenet i personcenteret, få token-nøglen: sk-xxxxx og indsend.

Trin 2: Send forespørgsler til GPT Image 1.5 API

Vælg endepunktet “gpt-image-1.5” for at sende API-forespørgslen og angiv anmodningens body. Anmodningsmetoden og request body fås fra vores websites API-dokumentation. Vores website tilbyder også Apifox-test for din bekvemmelighed. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. basis-URL er Images (https://api.cometapi.com/v1/images/generations) og [Image Editing]

Indsæt dit spørgsmål eller din anmodning i content-feltet—det er dette, modellen svarer på. Behandl API-svaret for at få det genererede svar.

Trin 3: Hent og verificér resultater

Behandl API-svaret for at få det genererede svar. Efter behandlingen svarer API’et med opgavens status og outputdata.

Se også Gemini 3 Pro Preview API

Hvad er GPT-Image-1.5 API'et?

Tekst-til-billede-generering (opret ud fra prompt),
Billedredigering / in-painting / komposittering (anvend instruktioner på eksisterende billeder, flere billedinput er tilladt), og
Iterative redigeringsarbejdsgange over flere trin via Responses API (muliggør “tweak & iterate”-grænseflader).

Hovedfunktioner (praktisk)

Forbedret redigerbarhed / konsistens over flere trin: bevarer karakterudseende, lys og centrale visuelle attributter på tværs af iterative redigeringer. Dette gør “samme model, gentagne redigeringer” mere pålideligt til arbejdsgange som produktkataloger eller brandaktiver.
Hurtigere throughput — 4× hastighedsforbedringer i forhold til GPT Image 1, med fokus på lavere latenstid for iterative kreative arbejdsgange.
Omkostningsoptimeringer — input/output-omkostninger for billeder reduceret med omkring 20 % vs. GPT Image 1, hvilket sænker omkostninger pr. billediteration for brugere med høj volumen.
Komposittering af flere billeder og stilreferencer — accepterer flere referencebilleder til at komposittere scener eller overføre stil/lys.
Kvalitets-/fidelitetskontroller — API-parametre, der afvejer hastighed vs. fidelitet (brug lavere kvalitet til massegenerering; højere kvalitet til produktionsaktiver).
Redigering over flere trin / integration med Responses API — muliggør trinvis arbejdsgang (anmod om ændringer, og “lav justeringer”, mens tilstanden bevares).

Tekniske muligheder

Begrænsning for tekstprompter (billedmodeller): op til 32.000 tegn (bemærk: OpenAI dokumenterer dette som tekstlængde-tilladelsen for GPT-billedmodeller). Brug dette til lange, restriktions-tunge prompter.
Billedinput: accepterer fil-ID’er (foretrukket til flertrinsforløb) eller rå bytes; flere billeder kan angives til komposittering og reference.
Output: PNG/JPEG eller platformens standardbilledeartefakter returneret af API’et (eller som vedhæftninger i ChatGPT). Output kan inkludere flere kandidatsbilleder og understøtte iterative anmodninger for at forfine et resultat.
Genereringstilstande: tekst-til-billede, billedredigering (inpaint/udvid med instruktioner) og varianter. Redigering over flere trin understøtter “tilføj/fjern/kombinér”-instruktioner.
Instruktionsbevidst redigering: modellerne er optimeret til instruktionsfidelitet (bevarer specificerede invarianter som “ændr ikke logoet”, “bevar positur og lys”). Prompt-engineering-mønstre (eksplicitte invarianter gentaget ved hver iteration) reducerer semantisk drift.

Benchmark-ydeevne

Placering på leaderboard: En samlet rapport citerede GPT Image 1.5 som førende på tekst-til-billede-ranglisten med ~1264 point på en Artificial Analysis-leaderboard, foran den næste model med en målbar margen.
Opgaveniveau-metrikker (redigering og bevarelse): et Microsoft Foundry-resumé af evalueringsmetrikker viser, at GPT-Image-1.5 opnår næsten perfekt succesrate for binære ændringer (100 % på en enkelt-omgang BinaryEval) og stærke ansigtsbevarings-scorer (omkring 90 % på AuraFace-målinger) i deres sammenligningstabel mod konkurrenter og tidligere OpenAI-modeller. Disse sammenlignende metrikker placerer GPT-Image-1.5 foran nogle rivaler på bevarelse og redigeringsfidelitet.

GPT Image 1.5

Hvordan GPT-Image-1.5 sammenligner sig med konkurrenter

Vs. GPT Image 1 (tidligere OpenAI-generation): hurtigere (op til 4×), billigere (~20 % lavere image IO-omkostninger) og stærkere redigeringsfidelitet — målrettet mod at flytte fra “prototype/demo” til “produktionsvenlige” billedarbejdsgange.
Vs. Google’s Nano Banana Pro / Gemini-billedmodeller: GPT-Image-1.5 og Google’s Nano Banana Pro / Gemini 3-familien er tætte rivaler — hver har styrker i forskellige promptklasser. OpenAI’s budskaber fremhæver redigeringsfidelitet og iterationshastighed; Googles tilbud er blevet rost for studiokvalitetsrealisme i nogle eksempler.
Vs. Qwen Image og andre åbne/lukkede modeller: GPT-Image-1.5 overgår Qwen Image på flere redigerings- og bevaringsmetrikker i enkelt-omgangsevalueringer, men forskellene indsnævres i fler-omgangs- eller andre domænespecifikke tests.

Hvor GPT-Image-1.5 er stærk

E-handels produktbilledbehandling: massevarianter, baggrundsudskiftning, konsistente produktkataloger fra ét foto (bevarelse af brand/logo).
Produktion af kreative og marketingaktiver: hurtige koncept-iterationer, fotorealistiske mockups, kontrollerede stiloverførsler.
Fotoretouchering og redaktionelle arbejdsgange: realistiske afprøvninger af tøj/frisure, selektiv retouchering, der bevarer identitet og lys.
Integration med designværktøjer: tilslut til designplatforme eller CMS for on-demand billedevarianter (fidelitetskontroller hjælper med omkostningsstyring).
Flertrins kompositterings-pipelines: input med flere billeder muliggør komposittering og referencebaseret generering for komplekse scener.

Sådan får du adgang til GPT Image 1.5 API

Trin 1: Tilmeld dig for at få en API-nøgle

Trin 2: Send forespørgsler til GPT Image 1.5 API

Indsæt dit spørgsmål eller din anmodning i content-feltet—det er dette, modellen svarer på. Behandl API-svaret for at få det genererede svar.

Trin 3: Hent og verificér resultater

Behandl API-svaret for at få det genererede svar. Efter behandlingen svarer API’et med opgavens status og outputdata.

Se også Gemini 3 Pro Preview API

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

GPT Image 1.5

Flere modeller

GPT Image 1.5

Flere modeller