O

GPT Image 1.5

Indtast:$6.4/M
Output:$25.6/M
GPT-Image-1.5 er OpenAIs billedmodel i GPT Image-familien. Det er en nativt multimodal GPT-model, der er designet til at generere billeder ud fra tekstprompter og til at udføre højpræcise redigeringer af inputbilleder, samtidig med at den nøje følger brugerens instruktioner.
Ny
Kommersiel brug

Hvad er GPT-Image-1.5 API'et?

GPT-Image-1.5 er det nyeste medlem af OpenAI’s GPT Image-familie og modellen bag ChatGPT’s fornyede Images-oplevelse. Den er designet til at flytte billedgenerering fra nyhedsprægede eksperimenter til produktionsklare, kreative værktøjer: højere fotorealisme, finere kontrol til iterative redigeringer og hurtigere inferens for at understøtte interaktive og virksomhedsarbejdsgange.

gpt-image-1.5 API er et multimodalt billedmodel-endepunkt, der accepterer ét eller flere billedinput (fil-id’er eller bytes) plus en tekstprompt og returnerer genererede eller redigerede billeder. Det understøtter:

  • Tekst-til-billede-generering (opret ud fra prompt),
  • Billedredigering / in-painting / komposittering (anvend instruktioner på eksisterende billeder, flere billedinput er tilladt), og
  • Iterative redigeringsarbejdsgange over flere trin via Responses API (muliggør “tweak & iterate”-grænseflader).

API’et behandler billedprompter anderledes end de gamle DALL·E-begrænsninger: GPT-billedmodeller accepterer betydeligt længere tekstprompter (retningslinjen på 32.000 tegn), hvilket gør komplekse, restriktions-tunge instruktioner mulige.

Hovedfunktioner (praktisk)

  • Forbedret redigerbarhed / konsistens over flere trin: bevarer karakterudseende, lys og centrale visuelle attributter på tværs af iterative redigeringer. Dette gør “samme model, gentagne redigeringer” mere pålideligt til arbejdsgange som produktkataloger eller brandaktiver.
  • Hurtigere throughput4× hastighedsforbedringer i forhold til GPT Image 1, med fokus på lavere latenstid for iterative kreative arbejdsgange.
  • Omkostningsoptimeringer — input/output-omkostninger for billeder reduceret med omkring 20 % vs. GPT Image 1, hvilket sænker omkostninger pr. billediteration for brugere med høj volumen.
  • Komposittering af flere billeder og stilreferencer — accepterer flere referencebilleder til at komposittere scener eller overføre stil/lys.
  • Kvalitets-/fidelitetskontroller — API-parametre, der afvejer hastighed vs. fidelitet (brug lavere kvalitet til massegenerering; højere kvalitet til produktionsaktiver).
  • Redigering over flere trin / integration med Responses API — muliggør trinvis arbejdsgang (anmod om ændringer, og “lav justeringer”, mens tilstanden bevares).

Tekniske muligheder

  • Begrænsning for tekstprompter (billedmodeller): op til 32.000 tegn (bemærk: OpenAI dokumenterer dette som tekstlængde-tilladelsen for GPT-billedmodeller). Brug dette til lange, restriktions-tunge prompter.
  • Billedinput: accepterer fil-ID’er (foretrukket til flertrinsforløb) eller rå bytes; flere billeder kan angives til komposittering og reference.
  • Output: PNG/JPEG eller platformens standardbilledeartefakter returneret af API’et (eller som vedhæftninger i ChatGPT). Output kan inkludere flere kandidatsbilleder og understøtte iterative anmodninger for at forfine et resultat.
  • Genereringstilstande: tekst-til-billede, billedredigering (inpaint/udvid med instruktioner) og varianter. Redigering over flere trin understøtter “tilføj/fjern/kombinér”-instruktioner.
  • Instruktionsbevidst redigering: modellerne er optimeret til instruktionsfidelitet (bevarer specificerede invarianter som “ændr ikke logoet”, “bevar positur og lys”). Prompt-engineering-mønstre (eksplicitte invarianter gentaget ved hver iteration) reducerer semantisk drift.

Benchmark-ydeevne

  • Placering på leaderboard: En samlet rapport citerede GPT Image 1.5 som førende på tekst-til-billede-ranglisten med ~1264 point på en Artificial Analysis-leaderboard, foran den næste model med en målbar margen.
  • Opgaveniveau-metrikker (redigering og bevarelse): et Microsoft Foundry-resumé af evalueringsmetrikker viser, at GPT-Image-1.5 opnår næsten perfekt succesrate for binære ændringer (100 % på en enkelt-omgang BinaryEval) og stærke ansigtsbevarings-scorer (omkring 90 % på AuraFace-målinger) i deres sammenligningstabel mod konkurrenter og tidligere OpenAI-modeller. Disse sammenlignende metrikker placerer GPT-Image-1.5 foran nogle rivaler på bevarelse og redigeringsfidelitet.

GPT Image 1.5

Hvordan GPT-Image-1.5 sammenligner sig med konkurrenter

  • Vs. GPT Image 1 (tidligere OpenAI-generation): hurtigere (op til 4×), billigere (~20 % lavere image IO-omkostninger) og stærkere redigeringsfidelitet — målrettet mod at flytte fra “prototype/demo” til “produktionsvenlige” billedarbejdsgange.
  • Vs. Google’s Nano Banana Pro / Gemini-billedmodeller: GPT-Image-1.5 og Google’s Nano Banana Pro / Gemini 3-familien er tætte rivaler — hver har styrker i forskellige promptklasser. OpenAI’s budskaber fremhæver redigeringsfidelitet og iterationshastighed; Googles tilbud er blevet rost for studiokvalitetsrealisme i nogle eksempler.
  • Vs. Qwen Image og andre åbne/lukkede modeller: GPT-Image-1.5 overgår Qwen Image på flere redigerings- og bevaringsmetrikker i enkelt-omgangsevalueringer, men forskellene indsnævres i fler-omgangs- eller andre domænespecifikke tests.

Hvor GPT-Image-1.5 er stærk

  • E-handels produktbilledbehandling: massevarianter, baggrundsudskiftning, konsistente produktkataloger fra ét foto (bevarelse af brand/logo).
  • Produktion af kreative og marketingaktiver: hurtige koncept-iterationer, fotorealistiske mockups, kontrollerede stiloverførsler.
  • Fotoretouchering og redaktionelle arbejdsgange: realistiske afprøvninger af tøj/frisure, selektiv retouchering, der bevarer identitet og lys.
  • Integration med designværktøjer: tilslut til designplatforme eller CMS for on-demand billedevarianter (fidelitetskontroller hjælper med omkostningsstyring).
  • Flertrins kompositterings-pipelines: input med flere billeder muliggør komposittering og referencebaseret generering for komplekse scener.

Sådan får du adgang til GPT Image 1.5 API

Trin 1: Tilmeld dig for at få en API-nøgle

Log ind på cometapi.com. Hvis du ikke er bruger endnu, skal du først registrere dig. Log ind på din CometAPI-konsol. Hent grænsefladens adgangslegitimation API-nøgle. Klik på “Add Token” ved API-tokenet i personcenteret, få token-nøglen: sk-xxxxx og indsend.

Trin 2: Send forespørgsler til GPT Image 1.5 API

Vælg endepunktet “gpt-image-1.5” for at sende API-forespørgslen og angiv anmodningens body. Anmodningsmetoden og request body fås fra vores websites API-dokumentation. Vores website tilbyder også Apifox-test for din bekvemmelighed. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. basis-URL er Images (https://api.cometapi.com/v1/images/generations) og [Image Editing]

Indsæt dit spørgsmål eller din anmodning i content-feltet—det er dette, modellen svarer på. Behandl API-svaret for at få det genererede svar.

Trin 3: Hent og verificér resultater

Behandl API-svaret for at få det genererede svar. Efter behandlingen svarer API’et med opgavens status og outputdata.

Se også Gemini 3 Pro Preview API

FAQ

Flere modeller