ModellerPriserBedrift
500+ AI-modell API, Alt I Én API. Bare I CometAPI
Modeller API
Utvikler
HurtigstartDokumentasjonAPI Dashbord
Selskap
Om ossBedrift
Ressurser
AI-modellerBloggEndringsloggStøtte
TjenestevilkårPersonvernerklæring
© 2026 CometAPI · All rights reserved
Home/Models/OpenAI/GPT Image 1.5
O

GPT Image 1.5

Inndata:$6.4/M
Utdata:$25.6/M
GPT-Image-1.5 er OpenAIs bildemodell i GPT Image-familien. Den er en GPT-modell som er multimodal fra grunnen av, designet for å generere bilder fra tekstbeskrivelser og utføre svært presise redigeringer av inndatabilder, samtidig som den følger brukerinstruksjoner nøye.
Ny
Kommersiell bruk
Playground
Oversikt
Funksjoner
Priser
API
Versjoner

Hva er GPT-Image-1.5 API?

GPT-Image-1.5 er det nyeste medlemmet i OpenAIs GPT Image-familie og modellen bak ChatGPTs fornyede Images-opplevelse. Den er utviklet for å flytte bildegenerering fra nyhetseksperimenter til produksjonsklare kreative verktøy: høyere fotorealisme, finere kontroll for iterative redigeringer og raskere inferens for å støtte interaktive arbeidsflyter og bedriftsbruk.

gpt-image-1.5 API er et multimodalt endepunkt for bildemodeller som tar imot ett eller flere bildeinndata (filidentifikatorer eller byte) samt en tekstprompt og returnerer genererte eller redigerte bilder. Det støtter:

  • Tekst-til-bilde-generering (opprett fra prompt),
  • Bilderedigering / inpainting / kompositering (bruk instruksjoner på eksisterende bilder, flere bildeinndata er tillatt), og
  • Iterative redigeringsarbeidsflyter i flere omganger gjennom Responses API (muliggjør «juster og iterer»-grensesnitt).

API-et behandler bildeprompter annerledes enn de gamle DALL·E-begrensningene: GPT-bildemodeller godtar betydelig lengre tekstprompter (retningslinjen på 32k tegn), noe som gjør komplekse instruksjoner med mange begrensninger gjennomførbare.

Hovedfunksjoner (praktisk)

  • Forbedret redigerbarhet / konsistens over flere omganger: bevarer karakterutseende, lyssetting og viktige visuelle attributter på tvers av iterative redigeringer. Dette gjør «samme modell, gjentatte redigeringer» mer pålitelig for arbeidsflyter som produktkataloger eller merkevareressurser.
  • Raskere gjennomstrømming — 4× hastighetsforbedringer sammenlignet med GPT Image 1, med mål om å redusere ventetid i iterative kreative arbeidsflyter.
  • Kostnadsoptimaliseringer — kostnader for bildeinn/ut redusert med omtrent 20 % sammenlignet med GPT Image 1, noe som senker kostnaden per bildeiterasjon for brukere med høyt volum.
  • Kompositering med flere bilder og stilreferanser — godtar flere referansebilder for å komponere scener eller overføre stil/lyssetting.
  • Kvalitets-/fidelitetsinnstillinger — API-parametere som balanserer hastighet mot kvalitet (bruk lavere kvalitet for masseproduksjon; høyere kvalitet for produksjonsressurser).
  • Flertrinnsredigering / integrasjon med Responses API — muliggjør trinnvise arbeidsflyter (be om endringer, og deretter «gjør justeringer» mens tilstanden bevares).

Tekniske egenskaper

  • Grense for tekstprompt (bildemodeller): opptil 32 000 tegn (merk: OpenAI dokumenterer dette som tillatt tekstlengde for GPT-bildemodeller). Bruk dette for lange, instruksjonstunge prompter.
  • Bildeinndata: godtar File IDs (foretrukket for flertrinnsflyter) eller rå byte; flere bilder kan oppgis for kompositering og referanse.
  • Utdata: PNG/JPEG eller plattformens standard bildeartefakter returnert av API-et (eller som vedlegg i ChatGPT). Utdata kan inkludere flere kandidatbilder og støtte iterative forespørsler for å forbedre et resultat.
  • Genereringsmoduser: tekst-til-bilde, bilderedigering (inpaint/utvid med instruksjoner) og varianter. Flertrinnsredigering støtter instruksjoner i stil med «legg til / trekk fra / kombiner».
  • Instruksjonsbevisst redigering: modellene er optimalisert for å følge instruksjoner nøyaktig (bevare spesifiserte invarianter som «ikke endre logoen», «behold positur og lyssetting»). Prompt-teknikker (eksplisitte invarianter gjentatt i hver iterasjon) reduserer semantisk drift.

Ytelse i benchmark

  • Plassering på ledertavler: Én aggregert rapport oppga GPT Image 1.5 som ledende på tekst-til-bilde-rangeringer med ~1264 poeng på en Artificial Analysis-ledertavle, foran neste modell med en målbar margin.
  • Måltall på oppgavenivå (redigering og bevaring): en Microsoft Foundry-oppsummering av evalueringsmålinger viser at GPT-Image-1.5 oppnådde nesten perfekt binær suksess for modifikasjoner (100 % på en enkeltrunde BinaryEval) og sterke skårer for ansiktsbevaring (rundt 90 % på AuraFace-målinger) i deres sammenligningstabell mot konkurrenter og tidligere OpenAI-modeller. Disse sammenlignende målingene plasserer GPT-Image-1.5 foran enkelte rivaler når det gjelder bevaring og redigeringsnøyaktighet.

GPT Image 1.5

Hvordan GPT-Image-1.5 sammenlignes med konkurrenter

  • Sammenlignet med GPT Image 1 (forrige OpenAI-generasjon): raskere (opptil 4×), billigere (~20 % lavere kostnad for bilde-I/O) og sterkere redigeringsnøyaktighet — målrettet mot å gå fra «prototype/demo» til «produksjonsvennlige» bildearbeidsflyter.
  • Sammenlignet med Googles Nano Banana Pro / Gemini-bildemodeller: GPT-Image-1.5 og Googles Nano Banana Pro / Gemini 3-familie er nære rivaler — hver har styrker i ulike promptklasser. OpenAIs budskap legger vekt på redigeringsnøyaktighet og iterasjonshastighet; Googles tilbud har fått ros for studiokvalitetsrealisme i noen eksempler.
  • Sammenlignet med Qwen Image og andre åpne/lukkede modeller: GPT-Image-1.5 overgår Qwen Image på flere målinger for redigering og bevaring i enkeltrundeevalueringer, men forskjellene blir mindre i flertrinns- eller andre domenespesifikke tester.

Hvor GPT-Image-1.5 er sterk

  • Produktbilder for e-handel: mange varianter, bakgrunnsbytter, konsistente produktkataloger fra ett enkelt bilde (bevaring av merkevare/logo).
  • Produksjon av kreative ressurser og markedsføringsmateriell: raske konseptiterasjoner, fotorealistiske mockups, kontrollert stiloverføring.
  • Fotoretusjering og redaksjonelle arbeidsflyter: realistiske prøvinger av klær/frisyrer, selektiv retusjering som bevarer identitet og lyssetting.
  • Integrasjon i designverktøy: koble til designplattformer eller CMS for bildevarianter på forespørsel (fidelitetsinnstillinger bidrar til kostnadskontroll).
  • Kompositeringspipeliner i flere trinn: flere bildeinndata muliggjør kompositering og referansebasert generering for komplekse scener.

Hvordan få tilgang til GPT Image 1.5 API

Trinn 1: Registrer deg for API-nøkkel

Logg inn på cometapi.com. Hvis du ikke er bruker hos oss ennå, må du først registrere deg. Logg inn på CometAPI-konsollen. Hent tilgangslegitimasjonen API key for grensesnittet. Klikk på «Add Token» under API token i det personlige senteret, hent token-nøkkelen: sk-xxxxx og send inn.

Trinn 2: Send forespørsler til GPT Image 1.5 API

Velg endepunktet «gpt-image-1.5» for å sende API-forespørselen og angi forespørselskroppen. Forespørselsmetoden og forespørselskroppen finnes i API-dokumentasjonen på nettstedet vårt. Nettstedet vårt tilbyr også Apifox-test for enkelhets skyld. Erstatt <YOUR_API_KEY> med din faktiske CometAPI-nøkkel fra kontoen din. base url er Images (https://api.cometapi.com/v1/images/generations) og [Image Editing]

Sett inn spørsmålet eller forespørselen din i content-feltet — dette er det modellen vil svare på. Behandle API-responsen for å få det genererte svaret.

Trinn 3: Hent og verifiser resultater

Behandle API-responsen for å få det genererte svaret. Etter behandling svarer API-et med oppgavestatus og utdata.

Se også Gemini 3 Pro Preview API

FAQ

How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 gir opptil 4× hastighetsforbedringer sammenlignet med GPT Image 1, noe som reduserer ventetiden betydelig for iterative kreative arbeidsflyter.

Does GPT Image 1.5 support multi-turn conversational editing?

Ja, gjennom Responses API støtter GPT Image 1.5 flertrinns redigeringsarbeidsflyter der du kan forbedre bilder iterativt ved å gi oppfølgingsinstruksjoner samtidig som konteksten bevares.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 støtter 1024×1024 (kvadrat), 1536×1024 (liggende) og 1024×1536 (stående). Kvalitetsalternativene inkluderer low, medium, high og auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Ja, GPT Image 1.5 godtar flere inndatabilder for kompositering og stilreferanse. De første 5 bildene bevares med høyere nøyaktighet når modusen high input_fidelity brukes.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 legger vekt på redigeringsnøyaktighet og iterasjonshastighet, mens Nano Banana Pro får ros for studiorealisme. Begge er svært konkurransedyktige – velg ut fra behovene i arbeidsflyten din.

Does GPT Image 1.5 support transparent backgrounds?

Ja, sett parameteren background til 'transparent' med utdataformatene PNG eller WebP. Transparens fungerer best med kvalitetsinnstillingene medium eller high.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 godtar ledetekster på opptil 32 000 tegn, noe som muliggjør svært detaljerte og avgrensede instruksjoner for komplekse oppgaver innen bildegenerering.

Priser for GPT Image 1.5

Utforsk konkurransedyktige priser for GPT Image 1.5, designet for å passe ulike budsjetter og bruksbehov. Våre fleksible planer sikrer at du bare betaler for det du bruker, noe som gjør det enkelt å skalere etter hvert som kravene dine vokser. Oppdag hvordan GPT Image 1.5 kan forbedre prosjektene dine samtidig som kostnadene holdes håndterbare.
Komet-pris (USD / M Tokens)Offisiell pris (USD / M Tokens)Rabatt
Inndata:$6.4/M
Utdata:$25.6/M
Inndata:$8/M
Utdata:$32/M
-20%

Eksempelkode og API for GPT Image 1.5

gpt-image-1.5-API-et er et multimodalt endepunkt for bildemodeller som tar imot én eller flere bildeinput (filidentifikatorer eller bytes) pluss en tekstprompt og returnerer genererte bilder eller redigerte bilder. Det støtter:
POST
/v1/images/generations
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI

# Set your API key if not set globally
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Create output/ folder
folder_path = "output"
os.makedirs(folder_path, exist_ok=True)

# Generate the image using gpt-image-1.5
result = client.images.generate(
    model="gpt-image-1.5",
    prompt="A cute baby sea otter",
    n=1,
    size="1024x1024"
)

# Save the image to a file
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
with open(os.path.join(folder_path, "gpt-image-1.5-output.png"), "wb") as f:
    f.write(image_bytes)

print("Image saved to: output/gpt-image-1.5-output.png")

Python Code Example

import base64
import os
from openai import OpenAI

# Set your API key if not set globally
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Create output/ folder
folder_path = "output"
os.makedirs(folder_path, exist_ok=True)

# Generate the image using gpt-image-1.5
result = client.images.generate(
    model="gpt-image-1.5",
    prompt="A cute baby sea otter",
    n=1,
    size="1024x1024"
)

# Save the image to a file
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)
with open(os.path.join(folder_path, "gpt-image-1.5-output.png"), "wb") as f:
    f.write(image_bytes)

print("Image saved to: output/gpt-image-1.5-output.png")

JavaScript Code Example

import OpenAI from "openai";
import { writeFile, mkdir } from "fs/promises";
import path from "path";
import { fileURLToPath } from "url";

const __dirname = path.dirname(fileURLToPath(import.meta.url));

// Set your API key if not set globally
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const client = new OpenAI({
  apiKey: COMETAPI_KEY,
  baseURL: "https://api.cometapi.com/v1",
});

// Create output/ folder
const folderPath = path.join(__dirname, "../output");
await mkdir(folderPath, { recursive: true });

// Generate the image using gpt-image-1.5
const result = await client.images.generate({
  model: "gpt-image-1.5",
  prompt: "A cute baby sea otter",
  n: 1,
  size: "1024x1024",
});

// Save the image to a file
const imageBuffer = Buffer.from(result.data[0].b64_json, "base64");
await writeFile(path.join(folderPath, "gpt-image-1.5-output.png"), imageBuffer);

console.log("Image saved to: output/gpt-image-1.5-output.png");

Curl Code Example

#!/bin/bash

# Set your API key if not set globally
COMETAPI_KEY="${COMETAPI_KEY:-<YOUR_COMETAPI_KEY>}"

# Create output/ folder
mkdir -p output

# Generate the image using gpt-image-1.5
response=$(curl -s https://api.cometapi.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-image-1.5",
    "prompt": "A cute baby sea otter",
    "n": 1,
    "size": "1024x1024"
  }')

# Extract base64 image data from response
if command -v jq &> /dev/null; then
  image_data=$(echo "$response" | jq -r '.data[0].b64_json')
else
  image_data=$(echo "$response" | sed -n 's/.*"b64_json":"\([^"]*\)".*/\1/p')
fi

if [ -n "$image_data" ] && [ "$image_data" != "null" ]; then
  # Decode base64 and save to file (macOS uses -D, Linux uses -d)
  echo "$image_data" | base64 -d > output/gpt-image-1.5-output.png 2>/dev/null || echo "$image_data" | base64 -D > output/gpt-image-1.5-output.png
  echo "Image saved to: output/gpt-image-1.5-output.png"
else
  echo "Error: Failed to generate image"
  echo "$response"
fi

Versjoner av GPT Image 1.5

Grunnen til at GPT Image 1.5 har flere øyeblikksbilder kan inkludere potensielle faktorer som variasjoner i utdata etter oppdateringer som krever eldre øyeblikksbilder for konsistens, å gi utviklere en overgangsperiode for tilpasning og migrering, og ulike øyeblikksbilder som tilsvarer globale eller regionale endepunkter for å optimalisere brukeropplevelsen. For detaljerte forskjeller mellom versjoner, vennligst se den offisielle dokumentasjonen.
version
gpt-image-1.5
gpt-image-1.5-2025-12-16