Hvad er GPT-Image-1.5 API?
GPT-Image-1.5 er det nyeste medlem af OpenAI’s GPT Image-familie og modellen bag ChatGPT’s fornyede Images-oplevelse. Den er designet til at flytte billedgenerering fra eksperimenter for nyhedens skyld til produktionsklar kreativ værktøjsbrug: højere fotorealisme, finere kontrol til iterative redigeringer og hurtigere inferens for at understøtte interaktive og virksomhedsrettede workflows.
gpt-image-1.5 API er et multimodalt billedmodel-endpoint, der accepterer et eller flere billedinput (filidentifikatorer eller bytes) plus en tekstprompt og returnerer genererede eller redigerede billeder. Det understøtter:
- Tekst-til-billede-generering (opret ud fra prompt),
- Billedredigering / in-painting / compositing (anvend instruktioner på eksisterende billeder, flere billedinput er tilladt), og
- Iterative redigeringsworkflows med flere omgange via Responses API (muliggør “tilpas & iterér”-brugerflader).
API’et behandler billedprompts anderledes end de gamle DALL·E-begrænsninger: GPT-billedmodeller accepterer betydeligt længere tekstprompts (retningslinjen på 32k tegn), hvilket gør komplekse, begrænsningstunge instruktioner mulige.
Hovedfunktioner (praktisk)
- Forbedret redigerbarhed / konsistens på tværs af flere omgange: bevarer figurudseende, belysning og centrale visuelle attributter på tværs af iterative redigeringer. Dette gør “samme model, gentagne redigeringer” mere pålideligt til workflows som produktkataloger eller brandaktiver.
- Hurtigere gennemløb — 4× hastighedsforbedringer i forhold til GPT Image 1, med fokus på at reducere latenstid i iterative kreative workflows.
- Omkostningsoptimeringer — omkostninger til billedinput/output reduceret med omkring 20% sammenlignet med GPT Image 1, hvilket sænker iterationsomkostningen pr. billede for brugere med høj volumen.
- Komposition af flere billeder & stylereferencer — accepterer flere referencebilleder til at sammensætte scener eller overføre stil/belysning.
- Kvalitets-/fidelitetskontroller — API-parametre, der afvejer hastighed mod fidelitet (brug lavere kvalitet til masseproduktion; højere kvalitet til produktionsaktiver).
- Flertrinsredigering / Responses API-integration — muliggør trinvise workflows (bed om ændringer, og derefter “lav justeringer”, mens tilstanden bevares).
Tekniske egenskaber
- Grænse for tekstprompt (billedmodeller): op til 32.000 tegn (bemærk: OpenAI dokumenterer dette som den tilladte tekstlængde for GPT-billedmodeller). Brug dette til lange prompts med mange begrænsninger.
- Billedinput: accepterer fil-ID’er (foretrukket til flertrinsforløb) eller rå bytes; flere billeder kan angives til komposition og reference.
- Output: PNG/JPEG eller platformens standard-billedartefakter returneret af API’et (eller som vedhæftninger i ChatGPT). Output kan inkludere flere kandidatbilleder og understøtter iterative anmodninger for at forfine et resultat.
- Genereringstilstande: tekst-til-billede, billedredigering (inpaint/udvid med instruktioner) og varianter. Flertrinsredigering understøtter instruktioner i stil med “tilføj/fjern/kombinér”.
- Instruktionsbevidst redigering: modellerne er optimeret til instruktionsfidelitet (bevarer specificerede invariabler som “ændr ikke logoet”, “bevar positur og belysning”). Prompt-engineering-mønstre (eksplicitte invariabler gentaget i hver iteration) reducerer semantisk drift.
Benchmark-ydeevne
- Placering på leaderboard: En samlet rapport angav GPT Image 1.5 som førende på tekst-til-billede-ranglister med ~1264 point på et Artificial Analysis-leaderboard, foran den næste model med en målbar margin.
- Målinger på opgaveniveau (redigering & bevaring): En Microsoft Foundry-opsummering af evalueringsmålinger viser, at GPT-Image-1.5 opnår næsten perfekt binær succes ved modifikation (100% på en single-turn BinaryEval) og stærke scores for ansigtsbevaring (omkring 90% på AuraFace-målinger) i deres sammenligningstabel mod konkurrenter og tidligere OpenAI-modeller. Disse sammenlignende målinger placerer GPT-Image-1.5 foran nogle konkurrenter inden for bevaring og redigeringsfidelitet.

Hvordan GPT-Image-1.5 sammenlignes med andre
- Vs. GPT Image 1 (tidligere OpenAI-generering): hurtigere (op til 4×), billigere (~20% lavere billed-I/O-omkostninger) og stærkere redigeringsfidelitet — målrettet overgangen fra “prototype/demo” til “produktionsvenlige” billedworkflows.
- Vs. Google’s Nano Banana Pro / Gemini-billedmodeller: GPT-Image-1.5 og Google’s Nano Banana Pro / Gemini 3-familie er tætte rivaler — hver har styrker i forskellige promptklasser. OpenAI’s budskab lægger vægt på redigeringsfidelitet og iterationshastighed; Google’s løsning er i nogle eksempler blevet rost for realisme på studieniveau.
- Vs. Qwen Image og andre åbne/lukkede modeller: GPT-Image-1.5 overgår Qwen Image på flere målinger for redigering og bevaring i single-turn-evalueringer, men forskellene bliver mindre i multi-turn eller andre domænespecifikke tests.
Hvor GPT-Image-1.5 er stærk
- Produktbilleder til e-handel: massevarianter, baggrundsudskiftninger, konsistente produktkataloger fra ét enkelt foto (bevarelse af brand/logo).
- Produktion af kreative aktiver og marketingmateriale: hurtige konceptiterationer, fotorealistiske mockups, kontrollerede stiloverførsler.
- Fotoretouchering og redaktionelle workflows: realistiske prøvevisninger af tøj/frisurer, selektiv retouchering, der bevarer identitet og belysning.
- Integration i designværktøjer: tilslut til designplatforme eller CMS for billedvarianter efter behov (fidelitetskontroller hjælper med omkostningsstyring).
- Flertrins-pipelines til komposition: billedinput fra flere kilder gør komposition og referencebaseret generering mulig for komplekse scener.
Sådan får du adgang til GPT Image 1.5 API
Trin 1: Tilmeld dig for at få en API-nøgle
Log ind på cometapi.com. Hvis du endnu ikke er bruger hos os, skal du først registrere dig. Log ind i din CometAPI-konsol. Hent API-nøglen som adgangsoplysning til grænsefladen. Klik på “Add Token” under API-token i det personlige center, hent token-nøglen: sk-xxxxx, og indsend den.
Trin 2: Send anmodninger til GPT Image 1.5 API
Vælg endpointet “gpt-image-1.5” for at sende API-anmodningen og angiv request body. Request-metoden og request body findes i vores API-dokumentation på websitet. Vores website tilbyder også Apifox-test for nemheds skyld. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. Base URL er Images (https://api.cometapi.com/v1/images/generations) og [Image Editing]
Indsæt dit spørgsmål eller din anmodning i content-feltet — det er dette, modellen vil svare på. Behandl API-svaret for at få det genererede svar.
Trin 3: Hent og verificér resultater
Behandl API-svaret for at få det genererede svar. Efter behandlingen svarer API’et med opgavestatus og outputdata.
Se også Gemini 3 Pro Preview API