Home/Models/OpenAI/GPT Image 1.5
O

GPT Image 1.5

Indtast:$6.4/M
Output:$25.6/M
GPT-Image-1.5 è il modello di immagini di OpenAI nella famiglia GPT Image . È un modello GPT nativamente multimodale progettato per generare immagini da prompt testuali e per apportare modifiche ad alta fedeltà alle immagini di input, attenendosi strettamente alle istruzioni dell’utente.
Ny
Kommersiel brug
Playground
Oversigt
Funktioner
Priser
API
Versioner

Hvad er GPT-Image-1.5 API'et?

GPT-Image-1.5 er det nyeste medlem af OpenAI’s GPT Image-familie og modellen bag ChatGPT’s fornyede Images-oplevelse. Den er designet til at flytte billedgenerering fra nyhedsprægede eksperimenter til produktionsklare, kreative værktøjer: højere fotorealisme, finere kontrol til iterative redigeringer og hurtigere inferens for at understøtte interaktive og virksomhedsarbejdsgange.

gpt-image-1.5 API er et multimodalt billedmodel-endepunkt, der accepterer ét eller flere billedinput (fil-id’er eller bytes) plus en tekstprompt og returnerer genererede eller redigerede billeder. Det understøtter:

  • Tekst-til-billede-generering (opret ud fra prompt),
  • Billedredigering / in-painting / komposittering (anvend instruktioner på eksisterende billeder, flere billedinput er tilladt), og
  • Iterative redigeringsarbejdsgange over flere trin via Responses API (muliggør “tweak & iterate”-grænseflader).

API’et behandler billedprompter anderledes end de gamle DALL·E-begrænsninger: GPT-billedmodeller accepterer betydeligt længere tekstprompter (retningslinjen på 32.000 tegn), hvilket gør komplekse, restriktions-tunge instruktioner mulige.

Hovedfunktioner (praktisk)

  • Forbedret redigerbarhed / konsistens over flere trin: bevarer karakterudseende, lys og centrale visuelle attributter på tværs af iterative redigeringer. Dette gør “samme model, gentagne redigeringer” mere pålideligt til arbejdsgange som produktkataloger eller brandaktiver.
  • Hurtigere throughput — 4× hastighedsforbedringer i forhold til GPT Image 1, med fokus på lavere latenstid for iterative kreative arbejdsgange.
  • Omkostningsoptimeringer — input/output-omkostninger for billeder reduceret med omkring 20 % vs. GPT Image 1, hvilket sænker omkostninger pr. billediteration for brugere med høj volumen.
  • Komposittering af flere billeder og stilreferencer — accepterer flere referencebilleder til at komposittere scener eller overføre stil/lys.
  • Kvalitets-/fidelitetskontroller — API-parametre, der afvejer hastighed vs. fidelitet (brug lavere kvalitet til massegenerering; højere kvalitet til produktionsaktiver).
  • Redigering over flere trin / integration med Responses API — muliggør trinvis arbejdsgang (anmod om ændringer, og “lav justeringer”, mens tilstanden bevares).

Tekniske muligheder

  • Begrænsning for tekstprompter (billedmodeller): op til 32.000 tegn (bemærk: OpenAI dokumenterer dette som tekstlængde-tilladelsen for GPT-billedmodeller). Brug dette til lange, restriktions-tunge prompter.
  • Billedinput: accepterer fil-ID’er (foretrukket til flertrinsforløb) eller rå bytes; flere billeder kan angives til komposittering og reference.
  • Output: PNG/JPEG eller platformens standardbilledeartefakter returneret af API’et (eller som vedhæftninger i ChatGPT). Output kan inkludere flere kandidatsbilleder og understøtte iterative anmodninger for at forfine et resultat.
  • Genereringstilstande: tekst-til-billede, billedredigering (inpaint/udvid med instruktioner) og varianter. Redigering over flere trin understøtter “tilføj/fjern/kombinér”-instruktioner.
  • Instruktionsbevidst redigering: modellerne er optimeret til instruktionsfidelitet (bevarer specificerede invarianter som “ændr ikke logoet”, “bevar positur og lys”). Prompt-engineering-mønstre (eksplicitte invarianter gentaget ved hver iteration) reducerer semantisk drift.

Benchmark-ydeevne

  • Placering på leaderboard: En samlet rapport citerede GPT Image 1.5 som førende på tekst-til-billede-ranglisten med ~1264 point på en Artificial Analysis-leaderboard, foran den næste model med en målbar margen.
  • Opgaveniveau-metrikker (redigering og bevarelse): et Microsoft Foundry-resumé af evalueringsmetrikker viser, at GPT-Image-1.5 opnår næsten perfekt succesrate for binære ændringer (100 % på en enkelt-omgang BinaryEval) og stærke ansigtsbevarings-scorer (omkring 90 % på AuraFace-målinger) i deres sammenligningstabel mod konkurrenter og tidligere OpenAI-modeller. Disse sammenlignende metrikker placerer GPT-Image-1.5 foran nogle rivaler på bevarelse og redigeringsfidelitet.

GPT Image 1.5

Hvordan GPT-Image-1.5 sammenligner sig med konkurrenter

  • Vs. GPT Image 1 (tidligere OpenAI-generation): hurtigere (op til 4×), billigere (~20 % lavere image IO-omkostninger) og stærkere redigeringsfidelitet — målrettet mod at flytte fra “prototype/demo” til “produktionsvenlige” billedarbejdsgange.
  • Vs. Google’s Nano Banana Pro / Gemini-billedmodeller: GPT-Image-1.5 og Google’s Nano Banana Pro / Gemini 3-familien er tætte rivaler — hver har styrker i forskellige promptklasser. OpenAI’s budskaber fremhæver redigeringsfidelitet og iterationshastighed; Googles tilbud er blevet rost for studiokvalitetsrealisme i nogle eksempler.
  • Vs. Qwen Image og andre åbne/lukkede modeller: GPT-Image-1.5 overgår Qwen Image på flere redigerings- og bevaringsmetrikker i enkelt-omgangsevalueringer, men forskellene indsnævres i fler-omgangs- eller andre domænespecifikke tests.

Hvor GPT-Image-1.5 er stærk

  • E-handels produktbilledbehandling: massevarianter, baggrundsudskiftning, konsistente produktkataloger fra ét foto (bevarelse af brand/logo).
  • Produktion af kreative og marketingaktiver: hurtige koncept-iterationer, fotorealistiske mockups, kontrollerede stiloverførsler.
  • Fotoretouchering og redaktionelle arbejdsgange: realistiske afprøvninger af tøj/frisure, selektiv retouchering, der bevarer identitet og lys.
  • Integration med designværktøjer: tilslut til designplatforme eller CMS for on-demand billedevarianter (fidelitetskontroller hjælper med omkostningsstyring).
  • Flertrins kompositterings-pipelines: input med flere billeder muliggør komposittering og referencebaseret generering for komplekse scener.

Sådan får du adgang til GPT Image 1.5 API

Trin 1: Tilmeld dig for at få en API-nøgle

Log ind på cometapi.com. Hvis du ikke er bruger endnu, skal du først registrere dig. Log ind på din CometAPI-konsol. Hent grænsefladens adgangslegitimation API-nøgle. Klik på “Add Token” ved API-tokenet i personcenteret, få token-nøglen: sk-xxxxx og indsend.

Trin 2: Send forespørgsler til GPT Image 1.5 API

Vælg endepunktet “gpt-image-1.5” for at sende API-forespørgslen og angiv anmodningens body. Anmodningsmetoden og request body fås fra vores websites API-dokumentation. Vores website tilbyder også Apifox-test for din bekvemmelighed. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. basis-URL er Images (https://api.cometapi.com/v1/images/generations) og [Image Editing]

Indsæt dit spørgsmål eller din anmodning i content-feltet—det er dette, modellen svarer på. Behandl API-svaret for at få det genererede svar.

Trin 3: Hent og verificér resultater

Behandl API-svaret for at få det genererede svar. Efter behandlingen svarer API’et med opgavens status og outputdata.

Se også Gemini 3 Pro Preview API

FAQ

How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 delivers up to 4× speed improvements over GPT Image 1, significantly reducing latency for iterative creative workflows.

Does GPT Image 1.5 support multi-turn conversational editing?

Yes, through the Responses API, GPT Image 1.5 supports multi-turn editing workflows where you can iteratively refine images by providing follow-up instructions while preserving context.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 supports 1024×1024 (square), 1536×1024 (landscape), and 1024×1536 (portrait). Quality options include low, medium, high, and auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Yes, GPT Image 1.5 accepts multiple input images for compositing and style reference. The first 5 images are preserved with higher fidelity when using high input_fidelity mode.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 emphasizes editing fidelity and iteration speed, while Nano Banana Pro is praised for studio realism. Both are closely competitive—choose based on your workflow needs.

Does GPT Image 1.5 support transparent backgrounds?

Yes, set the background parameter to 'transparent' with PNG or WebP output formats. Transparency works best at medium or high quality settings.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 accepts prompts up to 32,000 characters, enabling highly detailed and constrained instructions for complex image generation tasks.

Funktioner til GPT Image 1.5

Udforsk de vigtigste funktioner i GPT Image 1.5, designet til at forbedre ydeevne og brugervenlighed. Opdag hvordan disse muligheder kan gavne dine projekter og forbedre brugeroplevelsen.

Priser for GPT Image 1.5

Udforsk konkurrencedygtige priser for GPT Image 1.5, designet til at passe til forskellige budgetter og brugsbehov. Vores fleksible planer sikrer, at du kun betaler for det, du bruger, hvilket gør det nemt at skalere, efterhånden som dine krav vokser. Opdag hvordan GPT Image 1.5 kan forbedre dine projekter, mens omkostningerne holdes håndterbare.
Comet-pris (USD / M Tokens)Officiel Pris (USD / M Tokens)Rabat
Indtast:$6.4/M
Output:$25.6/M
Indtast:$8/M
Output:$32/M
-20%

Eksempelkode og API til GPT Image 1.5

gpt-image-1.5 API'et er et endepunkt for en multimodal billedmodel, der accepterer et eller flere billedinput (filidentifikatorer eller bytes) samt en tekstprompt og returnerer genererede billeder eller redigerede billeder. Det understøtter:
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI

# Set your API key if not set globally
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Create output/ folder
folder_path = "output"
os.makedirs(folder_path, exist_ok=True)

# Generate the image using gpt-image-1.5
result = client.images.generate(
    model="gpt-image-1.5",
    prompt="A cute baby sea otter",
    n=1,
    size="1024x1024"
)

# Save the image to a file
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
with open(os.path.join(folder_path, "gpt-image-1.5-output.png"), "wb") as f:
    f.write(image_bytes)

print("Image saved to: output/gpt-image-1.5-output.png")

Versioner af GPT Image 1.5

Årsagen til, at GPT Image 1.5 har flere øjebliksbilleder kan omfatte potentielle faktorer såsom variationer i output efter opdateringer, der kræver ældre øjebliksbilleder for konsistens, at give udviklere en overgangsperiode til tilpasning og migration, og at forskellige øjebliksbilleder svarer til globale eller regionale slutpunkter for at optimere brugeroplevelsen. For detaljerede forskelle mellem versioner, henvises der til den officielle dokumentation.
version
gpt-image-1.5
gpt-image-1.5-2025-12-16

Flere modeller