O

GPT Image 1.5

Invoer:$6.4/M
Uitvoer:$25.6/M
GPT-Image-1.5 is het afbeeldingsmodel van OpenAI in de GPT Image-familie . Het is een van nature multimodaal GPT-model dat is ontworpen om afbeeldingen te genereren op basis van tekstprompts en om invoerafbeeldingen met hoge getrouwheid te bewerken, terwijl het gebruikersinstructies nauwgezet volgt.
Nieuw
Commercieel gebruik

Wat is de GPT-Image-1.5-API?

GPT-Image-1.5 is het nieuwste lid van OpenAI’s GPT Image-familie en het model achter de vernieuwde Images-ervaring in ChatGPT. Het is ontworpen om afbeeldingsgeneratie te verplaatsen van novelty-experimenten naar creatieve tooling op productieniveau: hogere fotorealiteit, fijnere controle voor iteratieve bewerkingen en snellere inferentie om interactieve en enterprise-workflows te ondersteunen.

De gpt-image-1.5 API is een multimodaal afbeeldingsmodel-endpoint dat één of meer afbeeldingsinputs (bestands-ID’s of bytes) plus een tekstprompt accepteert en gegenereerde of bewerkte afbeeldingen retourneert. Het ondersteunt:

  • Tekst-naar-beeldgeneratie (creëren vanuit een prompt),
  • Afbeeldingsbewerking / inpainting / compositing (instructies toepassen op bestaande afbeeldingen, meerdere afbeeldingsinputs toegestaan), en
  • Iteratieve bewerkingsworkflows met meerdere beurten via de Responses API (maakt “tweak & iterate”-UI’s mogelijk).

De API behandelt afbeeldingsprompts anders dan de oude DALL·E-limieten: GPT-afbeeldingsmodellen accepteren aanzienlijk langere tekstprompts (de richtlijn van 32,000 tekens), waardoor complexe instructies met veel randvoorwaarden haalbaar worden.

Belangrijkste functies (praktisch)

  • Verbeterde bewerkbaarheid / consistentie over meerdere beurten: behoudt het uiterlijk van personages, belichting en sleutelvisuele attributen over iteratieve bewerkingen heen. Dit maakt “zelfde model, herhaalde bewerkingen” betrouwbaarder voor workflows zoals productcatalogi of merkassets.
  • Snellere throughput4× snelheidsverbeteringen ten opzichte van GPT Image 1, gericht op het verlagen van de latentie voor iteratieve creatieve workflows.
  • Kostenoptimalisaties — kosten voor afbeeldingsinvoer/-uitvoer met circa 20% verlaagd t.o.v. GPT Image 1, waardoor iteratiekosten per afbeelding voor high-volumegebruikers dalen.
  • Compositing met meerdere afbeeldingen & stijlreferentie — accepteert meerdere referentieafbeeldingen om scènes te componeren of stijl/belichting over te dragen.
  • Quality/fidelity-knoppen — API-parameters om snelheid tegenover getrouwheid af te wegen (gebruik lagere kwaliteit voor bulk-generatie; hogere kwaliteit voor productie-assets).
  • Bewerken over meerdere beurten / integratie met de Responses API — maakt stapsgewijze workflows mogelijk (vraag om wijzigingen en “maak tweaks” met behoud van state).

Technische mogelijkheden

  • Limiet voor tekstprompts (afbeeldingsmodellen): tot 32,000 tekens (opmerking: OpenAI documenteert dit als de tekstlengtelimiet voor GPT-afbeeldingsmodellen). Gebruik dit voor lange prompts met veel randvoorwaarden.
  • Afbeeldingsinputs: accepteert File ID’s (voorkeur voor flows met meerdere beurten) of ruwe bytes; meerdere afbeeldingen kunnen worden aangeleverd voor compositing en referentie.
  • Outputs: PNG/JPEG of platformspecifieke standaardafbeeldingsartefacten die door de API worden geretourneerd (of als bijlagen binnen ChatGPT). Outputs kunnen meerdere kandidaat-afbeeldingen bevatten en iteratieve verzoeken ondersteunen om een resultaat te verfijnen.
  • Generatiemodi: tekst-naar-beeld, afbeeldingsbewerking (inpaint/uitbreiden met instructies) en varianten. Bewerken over meerdere beurten ondersteunt instructies in de stijl van “add/subtract/combine”.
  • Instructiebewuste bewerking: modellen zijn geoptimaliseerd voor instructiegetrouwheid (behoud van gespecificeerde invarianten zoals “verander het logo niet”, “behoud de pose en belichting”). Prompt-engineeringpatronen (expliciete invarianten die bij elke iteratie worden herhaald) verminderen semantische drift.

Benchmarkprestaties

  • Positie op ranglijsten: een geaggregeerd rapport noemde GPT Image 1.5 als koploper in tekst-naar-beeld-rangschikkingen met ~1264 punten op een Artificial Analysis-leaderboard, vóór het volgende model met een meetbare marge.
  • Taakniveau-metrieken (bewerking & behoud): een Microsoft Foundry-samenvatting van evaluatiemetrieken laat zien dat GPT-Image-1.5 een bijna perfecte succesratio voor binaire modificaties behaalt (100% op een single-turn BinaryEval) en sterke gezichtsbewaringsscores (rond 90% op AuraFace-metingen) in hun vergelijkingstabel met concurrenten en eerdere OpenAI-modellen. Die vergelijkende metrieken plaatsen GPT-Image-1.5 voor op sommige concurrenten wat betreft behoud en bewerkingsgetrouwheid.

GPT Image 1.5

Hoe GPT-Image-1.5 zich verhoudt tot peers

  • Vs. GPT Image 1 (vorige OpenAI-generatie): sneller (tot 4×), goedkoper (~20% lagere image IO-kosten) en sterkere bewerkingsgetrouwheid — gericht op de overgang van “prototype/demo” naar “production-friendly” afbeeldingsworkflows.
  • Vs. Google’s Nano Banana Pro / Gemini-afbeeldingsmodellen: GPT-Image-1.5 en Google’s Nano Banana Pro / Gemini 3-familie zijn naaste rivalen — elk heeft sterke punten in verschillende promptklassen. De boodschap van OpenAI legt de nadruk op bewerkingsgetrouwheid en iteratiesnelheid; Google’s aanbod is in sommige voorbeelden geprezen om realisme op studiokwaliteit.
  • Vs. Qwen Image en andere open/closed modellen: GPT-Image-1.5 presteert beter dan Qwen Image op meerdere bewerkings- en behoudsmetrieken in single-turn-evaluaties, maar de verschillen nemen af in bewerkingen met meerdere beurten of andere domeinspecifieke tests.

Waar GPT-Image-1.5 sterk in is

  • E-commerce productafbeeldingen: bulkvarianten, achtergronden wisselen, consistente productcatalogi uit één enkele foto (behoud van merk/logo).
  • Productie van creatieve & marketingassets: snelle conceptiteraties, fotorealistische mock-ups, gecontroleerde stijltransfers.
  • Fotoretoucheren & editorial-workflows: realistische pasbeurten voor kleding/kapsel, selectieve retouchering die identiteit en belichting behoudt.
  • Integratie met designtools: plug-in in designplatformen of CMS voor on-demand afbeeldingsvarianten (fidelity-knoppen helpen bij kostenbeheersing).
  • Compositing-pijplijnen met meerdere stappen: inputs met meerdere afbeeldingen maken compositing en referentiegestuurde generatie voor complexe scènes mogelijk.

Toegang krijgen tot de GPT Image 1.5-API

Stap 1: Meld je aan voor een API-sleutel

Meld je aan bij cometapi.com. Als je nog geen gebruiker bent, registreer je dan eerst. Log in op je CometAPI-console. Haal de toegangsreferentie API-sleutel van de interface op. Klik op “Add Token” bij de API-token in het persoonlijk centrum, verkrijg de token key: sk-xxxxx en dien in.

Stap 2: Verzoeken sturen naar de GPT Image 1.5-API

Selecteer het “gpt-image-1.5”-endpoint om het API-verzoek te sturen en stel de request body in. De requestmethode en request body haal je uit de API-documentatie op onze website. Onze website biedt ook een Apifox-test voor je gemak. Vervang <YOUR_API_KEY> door je daadwerkelijke CometAPI-sleutel uit je account. basis-URL is Images (https://api.cometapi.com/v1/images/generations) en [Image Editing]

Voer je vraag of verzoek in het content-veld in—daarop reageert het model. Verwerk de API-respons om het gegenereerde antwoord te verkrijgen.

Stap 3: Resultaten ophalen en verifiëren

Verwerk de API-respons om het gegenereerde antwoord te verkrijgen. Na verwerking antwoordt de API met de taakstatus en uitvoerdata.

Zie ook Gemini 3 Pro Preview API

Veelgestelde vragen

Meer modellen