Hvad er GPT-Image-1.5 API'et?
GPT-Image-1.5 er det nyeste medlem af OpenAI’s GPT Image-familie og modellen bag ChatGPT’s fornyede Images-oplevelse. Den er designet til at flytte billedgenerering fra nyhedsprægede eksperimenter til produktionsklare, kreative værktøjer: højere fotorealisme, finere kontrol til iterative redigeringer og hurtigere inferens for at understøtte interaktive og virksomhedsarbejdsgange.
gpt-image-1.5 API er et multimodalt billedmodel-endepunkt, der accepterer ét eller flere billedinput (fil-id’er eller bytes) plus en tekstprompt og returnerer genererede eller redigerede billeder. Det understøtter:
- Tekst-til-billede-generering (opret ud fra prompt),
- Billedredigering / in-painting / komposittering (anvend instruktioner på eksisterende billeder, flere billedinput er tilladt), og
- Iterative redigeringsarbejdsgange over flere trin via Responses API (muliggør “tweak & iterate”-grænseflader).
API’et behandler billedprompter anderledes end de gamle DALL·E-begrænsninger: GPT-billedmodeller accepterer betydeligt længere tekstprompter (retningslinjen på 32.000 tegn), hvilket gør komplekse, restriktions-tunge instruktioner mulige.
Hovedfunktioner (praktisk)
- Forbedret redigerbarhed / konsistens over flere trin: bevarer karakterudseende, lys og centrale visuelle attributter på tværs af iterative redigeringer. Dette gør “samme model, gentagne redigeringer” mere pålideligt til arbejdsgange som produktkataloger eller brandaktiver.
- Hurtigere throughput — 4× hastighedsforbedringer i forhold til GPT Image 1, med fokus på lavere latenstid for iterative kreative arbejdsgange.
- Omkostningsoptimeringer — input/output-omkostninger for billeder reduceret med omkring 20 % vs. GPT Image 1, hvilket sænker omkostninger pr. billediteration for brugere med høj volumen.
- Komposittering af flere billeder og stilreferencer — accepterer flere referencebilleder til at komposittere scener eller overføre stil/lys.
- Kvalitets-/fidelitetskontroller — API-parametre, der afvejer hastighed vs. fidelitet (brug lavere kvalitet til massegenerering; højere kvalitet til produktionsaktiver).
- Redigering over flere trin / integration med Responses API — muliggør trinvis arbejdsgang (anmod om ændringer, og “lav justeringer”, mens tilstanden bevares).
Tekniske muligheder
- Begrænsning for tekstprompter (billedmodeller): op til 32.000 tegn (bemærk: OpenAI dokumenterer dette som tekstlængde-tilladelsen for GPT-billedmodeller). Brug dette til lange, restriktions-tunge prompter.
- Billedinput: accepterer fil-ID’er (foretrukket til flertrinsforløb) eller rå bytes; flere billeder kan angives til komposittering og reference.
- Output: PNG/JPEG eller platformens standardbilledeartefakter returneret af API’et (eller som vedhæftninger i ChatGPT). Output kan inkludere flere kandidatsbilleder og understøtte iterative anmodninger for at forfine et resultat.
- Genereringstilstande: tekst-til-billede, billedredigering (inpaint/udvid med instruktioner) og varianter. Redigering over flere trin understøtter “tilføj/fjern/kombinér”-instruktioner.
- Instruktionsbevidst redigering: modellerne er optimeret til instruktionsfidelitet (bevarer specificerede invarianter som “ændr ikke logoet”, “bevar positur og lys”). Prompt-engineering-mønstre (eksplicitte invarianter gentaget ved hver iteration) reducerer semantisk drift.
Benchmark-ydeevne
- Placering på leaderboard: En samlet rapport citerede GPT Image 1.5 som førende på tekst-til-billede-ranglisten med ~1264 point på en Artificial Analysis-leaderboard, foran den næste model med en målbar margen.
- Opgaveniveau-metrikker (redigering og bevarelse): et Microsoft Foundry-resumé af evalueringsmetrikker viser, at GPT-Image-1.5 opnår næsten perfekt succesrate for binære ændringer (100 % på en enkelt-omgang BinaryEval) og stærke ansigtsbevarings-scorer (omkring 90 % på AuraFace-målinger) i deres sammenligningstabel mod konkurrenter og tidligere OpenAI-modeller. Disse sammenlignende metrikker placerer GPT-Image-1.5 foran nogle rivaler på bevarelse og redigeringsfidelitet.

Hvordan GPT-Image-1.5 sammenligner sig med konkurrenter
- Vs. GPT Image 1 (tidligere OpenAI-generation): hurtigere (op til 4×), billigere (~20 % lavere image IO-omkostninger) og stærkere redigeringsfidelitet — målrettet mod at flytte fra “prototype/demo” til “produktionsvenlige” billedarbejdsgange.
- Vs. Google’s Nano Banana Pro / Gemini-billedmodeller: GPT-Image-1.5 og Google’s Nano Banana Pro / Gemini 3-familien er tætte rivaler — hver har styrker i forskellige promptklasser. OpenAI’s budskaber fremhæver redigeringsfidelitet og iterationshastighed; Googles tilbud er blevet rost for studiokvalitetsrealisme i nogle eksempler.
- Vs. Qwen Image og andre åbne/lukkede modeller: GPT-Image-1.5 overgår Qwen Image på flere redigerings- og bevaringsmetrikker i enkelt-omgangsevalueringer, men forskellene indsnævres i fler-omgangs- eller andre domænespecifikke tests.
Hvor GPT-Image-1.5 er stærk
- E-handels produktbilledbehandling: massevarianter, baggrundsudskiftning, konsistente produktkataloger fra ét foto (bevarelse af brand/logo).
- Produktion af kreative og marketingaktiver: hurtige koncept-iterationer, fotorealistiske mockups, kontrollerede stiloverførsler.
- Fotoretouchering og redaktionelle arbejdsgange: realistiske afprøvninger af tøj/frisure, selektiv retouchering, der bevarer identitet og lys.
- Integration med designværktøjer: tilslut til designplatforme eller CMS for on-demand billedevarianter (fidelitetskontroller hjælper med omkostningsstyring).
- Flertrins kompositterings-pipelines: input med flere billeder muliggør komposittering og referencebaseret generering for komplekse scener.
Sådan får du adgang til GPT Image 1.5 API
Trin 1: Tilmeld dig for at få en API-nøgle
Log ind på cometapi.com. Hvis du ikke er bruger endnu, skal du først registrere dig. Log ind på din CometAPI-konsol. Hent grænsefladens adgangslegitimation API-nøgle. Klik på “Add Token” ved API-tokenet i personcenteret, få token-nøglen: sk-xxxxx og indsend.
Trin 2: Send forespørgsler til GPT Image 1.5 API
Vælg endepunktet “gpt-image-1.5” for at sende API-forespørgslen og angiv anmodningens body. Anmodningsmetoden og request body fås fra vores websites API-dokumentation. Vores website tilbyder også Apifox-test for din bekvemmelighed. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. basis-URL er Images (https://api.cometapi.com/v1/images/generations) og [Image Editing]
Indsæt dit spørgsmål eller din anmodning i content-feltet—det er dette, modellen svarer på. Behandl API-svaret for at få det genererede svar.
Trin 3: Hent og verificér resultater
Behandl API-svaret for at få det genererede svar. Efter behandlingen svarer API’et med opgavens status og outputdata.
Se også Gemini 3 Pro Preview API