Home/Models/OpenAI/GPT Image 1.5
O

GPT Image 1.5

Inndata:$6.4/M
Utdata:$25.6/M
GPT-Image-1.5 er OpenAIs bildemodell i GPT Image-familien. Den er en GPT-modell som er multimodal fra grunnen av, designet for å generere bilder fra tekstbeskrivelser og utføre svært presise redigeringer av inndatabilder, samtidig som den følger brukerinstruksjoner nøye.
Ny
Kommersiell bruk
Oversikt
Funksjoner
Priser
API
Versjoner

Hva er GPT-Image-1.5 API-et?

GPT-Image-1.5 er det nyeste medlemmet av OpenAIs GPT Image-familie og modellen bak ChatGPTs fornyede Images-opplevelse. Den er designet for å flytte bildegenerering fra nyhetsverdi-eksperimenter til produksjonsklare kreative verktøy: høyere fotorealisme, finere kontroll for iterative redigeringer og raskere inferens for å støtte interaktive og bedriftsrettede arbeidsflyter.

gpt-image-1.5 API er et multimodalt bildeendepunkt som aksepterer ett eller flere bildeinput (filidentifikatorer eller bytes) pluss en tekstprompt og returnerer genererte bilder eller redigerte bilder. Det støtter:

  • Tekst-til-bilde-generering (lag fra prompt),
  • Bilderedigering / inpainting / kompositering (anvend instruksjoner på eksisterende bilder, flere bildeinput tillatt), og
  • Iterative, fleromgangs redigeringsarbeidsflyter via Responses API (muliggjør “tweak & iterate”-grensesnitt).

API-et behandler bildeprompter annerledes enn gamle DALL·E-begrensninger: GPT-bildemodeller aksepterer betydelig lengre tekstprompter (retningslinjen på 32k tegn), noe som gjør komplekse, restriksjonstunge instruksjoner mulig.

Hovedfunksjoner (praktisk)

  • Forbedret redigerbarhet / fleromgangskonsistens: bevarer karakterutseende, lyssetting og sentrale visuelle attributter på tvers av iterative redigeringer. Dette gjør “samme modell, gjentatte redigeringer” mer pålitelig for arbeidsflyter som produktkataloger eller merkevareaktiva.
  • Raskere gjennomstrømning — 4× hastighetsforbedringer over GPT Image 1, med mål om lavere ventetid for iterative kreative arbeidsflyter.
  • Kostnadsoptimaliseringer — kostnader for bilde-inn/ut redusert med omtrent 20 % sammenlignet med GPT Image 1, noe som senker kost per bildeiterasjon for brukere med høyt volum.
  • Kompositering med flere bilder og stilreferanser — aksepter flere referansebilder for å komposittere scener eller overføre stil/lyssetting.
  • Brytere for kvalitet/trofasthet — API-parametere som avveier hastighet mot trofasthet (bruk lavere kvalitet for masseproduksjon; høyere kvalitet for produksjonsaktiva).
  • Fleromgangs redigering / integrasjon med Responses API — muliggjør trinnvise arbeidsflyter (be om endringer, deretter “finjuster” mens tilstand bevares).

Tekniske egenskaper

  • Grense for tekstprompt (bildemodeller): opptil 32,000 tegn (merk: OpenAI dokumenterer dette som tekstlengde-tillatelsen for GPT-bildemodeller). Bruk dette for lange, restriksjonstunge prompter.
  • Bildeinput: aksepterer fil-ID-er (foretrukket for fleromgangsforløp) eller rå bytes; flere bilder kan oppgis for kompositering og referanse.
  • Utdata: PNG/JPEG eller plattformens standard bildefiler returnert av API-et (eller som vedlegg i ChatGPT). Utdata kan inkludere flere kandidatbilder og støtte iterative forespørsler for å raffinere et resultat.
  • Generasjonsmodi: tekst-til-bilde, bilderedigering (inpaint/utvid med instruksjoner) og varianter. Fleromgangs redigering støtter instruksjoner av typen “legg til/trekk fra/kombiner”.
  • Instruksjonsbevisst redigering: modellene er optimalisert for instruksjonstrofasthet (bevarer spesifiserte invariabler som “ikke endre logoen”, “behold posering og lys”). Prompt-mønstre (eksplisitte invariabler gjentatt hver iterasjon) reduserer semantisk drift.

Benchmark-ytelse

  • Plassering på ledertavle: En samlet rapport siterte GPT Image 1.5 som ledende i tekst-til-bilde-rangeringer med ~1264 poeng på en Artificial Analysis-ledertavle, foran neste modell med en målbar margin.
  • Oppgavenivå-metrikker (redigering og bevaring): En Microsoft Foundry-oppsummering av evalueringsmetrikker viser at GPT-Image-1.5 oppnådde tilnærmet perfekt binær modifikasjonssuksess (100 % på en ettstegs BinaryEval) og sterke ansiktsbevaringsskårer (omtrent 90 % på AuraFace-mål) i deres sammenligningstabell mot konkurrenter og tidligere OpenAI-modeller. Disse sammenlignende metrikkene plasserer GPT-Image-1.5 foran noen rivaler på bevaring og redigeringstrofasthet.

GPT Image 1.5

Hvordan GPT-Image-1.5 sammenlignes med jevnbyrdige

  • Vs. GPT Image 1 (forrige OpenAI-generasjon): raskere (opptil 4×), billigere (~20 % lavere bilde-IO-kostnad) og sterkere redigeringstrofasthet — rettet mot å gå fra “prototype/demo” til “produksjonsvennlige” bildearbeidsflyter.
  • Vs. Googles Nano Banana Pro / Gemini-bildemodeller: GPT-Image-1.5 og Googles Nano Banana Pro / Gemini 3-familie er nære rivaler — hver har styrker i ulike promptklasser. OpenAIs budskap vektlegger redigeringstrofasthet og iterasjonshastighet; Googles tilbud har blitt rost for studiokvalitets realisme i noen eksempler.
  • Vs. Qwen Image og andre åpne/lukkede modeller: GPT-Image-1.5 overgår Qwen Image på flere redigerings- og bevaringsmetrikker i ettstegs-evalueringer, men forskjellene snevres inn i fleromgangs- eller andre domenespesifikke tester.

Hvor GPT-Image-1.5 er sterk

  • E-handels produktavbildning: massevarianter, bakgrunnsbytter, konsistente produktkataloger fra ett enkelt foto (bevaring av merke/logo).
  • Produksjon av kreative og markedsføringsaktiva: raske konseptiterasjoner, fotorealistiske mockups, kontrollert stiloverføring.
  • Fotoretusjering og redaksjonelle arbeidsflyter: realistiske kles-/frisyreprøvinger, selektiv retusjering som bevarer identitet og lyssetting.
  • Integrasjon i designverktøy: koble til designplattformer eller CMS for bilder på forespørsel (brytere for trofasthet hjelper med kostnadskontroll).
  • Flerstegs kompositeringspipeliner: multi-bildeinput muliggjør kompositering og referansebasert generering for komplekse scener.

Slik får du tilgang til GPT Image 1.5 API

Trinn 1: Registrer deg for API-nøkkel

Logg inn på cometapi.com. Hvis du ikke er bruker ennå, registrer deg først. Logg inn på CometAPI-konsollen. Hent tilgangslegitimasjonen API-nøkkel for grensesnittet. Klikk “Add Token” ved API token i personlig senter, hent token-nøkkel: sk-xxxxx og send inn.

Trinn 2: Send forespørsler til GPT Image 1.5 API

Velg gpt-image-1.5-endepunktet for å sende API-forespørselen og angi forespørselsteksten. Forespørselsmetoden og forespørselsteksten hentes fra API-dokumentasjonen på nettstedet vårt. Nettstedet vårt tilbyr også Apifox-test for enkelhets skyld. Bytt ut <YOUR_API_KEY> med din faktiske CometAPI-nøkkel fra kontoen din. base url is Images (https://api.cometapi.com/v1/images/generations) and [Image Editing]

Sett inn spørsmålet eller forespørselen din i content-feltet—det er dette modellen svarer på . Behandle API-responsen for å hente det genererte svaret.

Trinn 3: Hent og verifiser resultater

Behandle API-responsen for å hente det genererte svaret. Etter behandling svarer API-et med oppgavestatus og utdata.

Se også Gemini 3 Pro Preview API

FAQ

How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 delivers up to 4× speed improvements over GPT Image 1, significantly reducing latency for iterative creative workflows.

Does GPT Image 1.5 support multi-turn conversational editing?

Yes, through the Responses API, GPT Image 1.5 supports multi-turn editing workflows where you can iteratively refine images by providing follow-up instructions while preserving context.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 supports 1024×1024 (square), 1536×1024 (landscape), and 1024×1536 (portrait). Quality options include low, medium, high, and auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Yes, GPT Image 1.5 accepts multiple input images for compositing and style reference. The first 5 images are preserved with higher fidelity when using high input_fidelity mode.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 emphasizes editing fidelity and iteration speed, while Nano Banana Pro is praised for studio realism. Both are closely competitive—choose based on your workflow needs.

Does GPT Image 1.5 support transparent backgrounds?

Yes, set the background parameter to 'transparent' with PNG or WebP output formats. Transparency works best at medium or high quality settings.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 accepts prompts up to 32,000 characters, enabling highly detailed and constrained instructions for complex image generation tasks.

Funksjoner for GPT Image 1.5

Utforsk nøkkelfunksjonene til GPT Image 1.5, designet for å forbedre ytelse og brukervennlighet. Oppdag hvordan disse mulighetene kan være til nytte for prosjektene dine og forbedre brukeropplevelsen.

Priser for GPT Image 1.5

Utforsk konkurransedyktige priser for GPT Image 1.5, designet for å passe ulike budsjetter og bruksbehov. Våre fleksible planer sikrer at du bare betaler for det du bruker, noe som gjør det enkelt å skalere etter hvert som kravene dine vokser. Oppdag hvordan GPT Image 1.5 kan forbedre prosjektene dine samtidig som kostnadene holdes håndterbare.
Komet-pris (USD / M Tokens)Offisiell pris (USD / M Tokens)
Inndata:$6.4/M
Utdata:$25.6/M
Inndata:$8/M
Utdata:$32/M

Eksempelkode og API for GPT Image 1.5

gpt-image-1.5-API-et er et endepunkt for en multimodal bildemodell som aksepterer ett eller flere bildeinndata (filidentifikatorer eller bytes) pluss en tekstprompt og returnerer genererte bilder eller redigerte bilder. Det støtter:
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI

# Set your API key if not set globally
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Create output/ folder
folder_path = "output"
os.makedirs(folder_path, exist_ok=True)

# Generate the image using gpt-image-1.5
result = client.images.generate(
    model="gpt-image-1.5",
    prompt="A cute baby sea otter",
    n=1,
    size="1024x1024"
)

# Save the image to a file
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
with open(os.path.join(folder_path, "gpt-image-1.5-output.png"), "wb") as f:
    f.write(image_bytes)

print("Image saved to: output/gpt-image-1.5-output.png")

Versjoner av GPT Image 1.5

Grunnen til at GPT Image 1.5 har flere øyeblikksbilder kan inkludere potensielle faktorer som variasjoner i utdata etter oppdateringer som krever eldre øyeblikksbilder for konsistens, å gi utviklere en overgangsperiode for tilpasning og migrering, og ulike øyeblikksbilder som tilsvarer globale eller regionale endepunkter for å optimalisere brukeropplevelsen. For detaljerte forskjeller mellom versjoner, vennligst se den offisielle dokumentasjonen.
version
gpt-image-1.5
gpt-image-1.5-2025-12-16

Flere modeller