Wat is de GPT-Image-1.5 API?
GPT-Image-1.5 is het nieuwste lid van OpenAI’s GPT Image-familie en het model achter de vernieuwde Images-ervaring van ChatGPT. Het is ontworpen om beeldgeneratie van experimentele nieuwigheid naar creatieve tools van productiekwaliteit te brengen: hogere fotorealiteit, fijnere controle voor iteratieve bewerkingen en snellere inferentie ter ondersteuning van interactieve en enterprise-workflows.
De gpt-image-1.5 API is een multimodale afbeeldingsmodel-endpoint die één of meer afbeeldingsinvoeren accepteert (bestands-ID’s of bytes) plus een tekstprompt en gegenereerde of bewerkte afbeeldingen retourneert. Het ondersteunt:
- Tekst-naar-afbeeldinggeneratie (maken vanuit een prompt),
- Afbeeldingsbewerking / inpainting / compositing (instructies toepassen op bestaande afbeeldingen, meerdere afbeeldingsinvoeren toegestaan), en
- Iteratieve, multi-turn bewerkingsworkflows via de Responses API (maakt “tweak & iterate”-UI’s mogelijk).
De API behandelt afbeeldingsprompts anders dan de oude DALL·E-beperkingen: GPT-afbeeldingsmodellen accepteren aanzienlijk langere tekstprompts (de richtlijn van 32k tekens), waardoor complexe, beperkingsrijke instructies haalbaar worden.
Belangrijkste functies (praktisch)
- Verbeterde bewerkbaarheid / multi-turn consistentie: behoudt het uiterlijk van personages, belichting en belangrijke visuele kenmerken tijdens iteratieve bewerkingen. Dit maakt “hetzelfde model, herhaalde bewerkingen” betrouwbaarder voor workflows zoals productcatalogi of merkmiddelen.
- Snellere doorvoer — 4× snelheidsverbeteringen ten opzichte van GPT Image 1, gericht op het verlagen van de latentie voor iteratieve creatieve workflows.
- Kostenoptimalisaties — kosten voor afbeeldingsinvoer/-uitvoer met ongeveer 20% verlaagd ten opzichte van GPT Image 1, waardoor de kosten per afbeeldingsiteratie voor gebruikers met hoog volume dalen.
- Compositing met meerdere afbeeldingen & stijlreferenties — accepteert meerdere referentieafbeeldingen om scènes te compositen of stijl/belichting over te dragen.
- Kwaliteits-/fidelity-instellingen — API-parameters die snelheid tegenover fidelity afwegen (gebruik lagere kwaliteit voor bulkproductie; hogere kwaliteit voor productiemiddelen).
- Multi-turn bewerking / Responses API-integratie — maakt stapsgewijze workflows mogelijk (vraag om wijzigingen en vervolgens “breng aanpassingen aan” met behoud van status).
Technische mogelijkheden
- Tekstpromptlimiet (afbeeldingsmodellen): tot 32.000 tekens (OpenAI documenteert dit als de toegestane tekstlengte voor GPT-afbeeldingsmodellen). Gebruik dit voor lange, beperkingsrijke prompts.
- Afbeeldingsinvoer: accepteert bestands-ID’s (voorkeur voor multi-turn flows) of ruwe bytes; meerdere afbeeldingen kunnen worden aangeleverd voor compositing en referentie.
- Uitvoer: PNG/JPEG of standaard afbeeldingsartefacten van het platform die door de API worden geretourneerd (of als bijlagen binnen ChatGPT). Uitvoer kan meerdere kandidaatafbeeldingen bevatten en ondersteunt iteratieve verzoeken om een resultaat te verfijnen.
- Generatiemodi: tekst-naar-afbeelding, afbeeldingsbewerking (inpaint/uitbreiden met instructies) en varianten. Multi-turn bewerking ondersteunt instructies in de stijl van “toevoegen/aftrekken/combineren”.
- Instructiebewuste bewerking: modellen zijn geoptimaliseerd voor het nauwkeurig volgen van instructies (het behouden van gespecificeerde invarianten zoals “verander het logo niet”, “behoud pose en belichting”). Prompt-engineeringpatronen (expliciete invarianten in elke iteratie herhalen) verminderen semantische drift.
Benchmarkprestaties
- Positie op ranglijsten: één geaggregeerd rapport noemde GPT Image 1.5 als koploper in tekst-naar-afbeeldingranglijsten met ~1264 punten op een Artificial Analysis-ranglijst, vóór het volgende model met een meetbare marge.
- Taakniveau-metrieken (bewerking & behoud): een Microsoft Foundry-samenvatting van evaluatiemetrieken toont dat GPT-Image-1.5 bijna perfecte binaire modificatiesucces behaalt (100% op een single-turn BinaryEval) en sterke gezichtsbewaringsscores (ongeveer 90% op AuraFace-metingen) in hun vergelijkingstabel ten opzichte van concurrenten en eerdere OpenAI-modellen. Die vergelijkende metriek plaatst GPT-Image-1.5 vóór sommige rivalen op behoud en bewerkingsnauwkeurigheid.

Hoe GPT-Image-1.5 zich verhoudt tot vergelijkbare modellen
- Vs. GPT Image 1 (vorige OpenAI-generatie): sneller (tot 4×), goedkoper (~20% lagere kosten voor afbeeldings-I/O) en sterkere bewerkingsnauwkeurigheid — gericht op de overstap van “prototype/demo” naar “productievriendelijke” afbeeldingsworkflows.
- Vs. Google’s Nano Banana Pro / Gemini-afbeeldingsmodellen: GPT-Image-1.5 en Google’s Nano Banana Pro / Gemini 3-familie zijn nauwe rivalen — elk heeft sterke punten in verschillende promptcategorieën. OpenAI’s boodschap legt de nadruk op bewerkingsnauwkeurigheid en iteratiesnelheid; Google’s aanbod is in sommige voorbeelden geprezen om realisme op studioniveau.
- Vs. Qwen Image en andere open/closed modellen: GPT-Image-1.5 presteert beter dan Qwen Image op verschillende bewerkings- en behoudsmetriek in single-turn evaluaties, maar de verschillen worden kleiner in multi-turn of andere domeinspecifieke tests.
Waar GPT-Image-1.5 sterk in is
- E-commerce productbeeldvorming: bulkvarianten, achtergrondwissels, consistente productcatalogi vanuit één foto (behoud van merk/logo).
- Creatieve & marketingproductie van middelen: snelle conceptiteraties, fotorealistische mock-ups, gecontroleerde stijloverdrachten.
- Fotoretouchering & redactionele workflows: realistische kleding-/haarstijl-try-ons, selectieve retouchering die identiteit en belichting behoudt.
- Integratie in ontwerptools: integreer in ontwerpplatforms of CMS voor on-demand afbeeldingsvarianten (fidelity-instellingen helpen bij kostenbeheersing).
- Compositing-pijplijnen met meerdere stappen: invoer met meerdere afbeeldingen maakt compositing en referentiegebaseerde generatie voor complexe scènes mogelijk.
Toegang krijgen tot de GPT Image 1.5 API
Stap 1: Meld u aan voor een API-sleutel
Log in op cometapi.com. Als u nog geen gebruiker bent, registreer u dan eerst. Log in op uw CometAPI-console. Haal de toegangsreferentie-API-sleutel van de interface op. Klik op “Add Token” bij de API-token in het persoonlijke centrum, verkrijg de token-sleutel: sk-xxxxx en dien deze in.
Stap 2: Verzend verzoeken naar de GPT Image 1.5 API
Selecteer de endpoint “gpt-image-1.5” om het API-verzoek te verzenden en stel de request body in. De request-methode en request body zijn te vinden in onze API-documentatie op de website. Onze website biedt ook Apifox-tests voor uw gemak. Vervang <YOUR_API_KEY> door uw werkelijke CometAPI-sleutel uit uw account. De base URL is Images (https://api.cometapi.com/v1/images/generations) en [Image Editing]
Voer uw vraag of verzoek in het veld content in — hierop zal het model reageren. Verwerk de API-respons om het gegenereerde antwoord te verkrijgen.
Stap 3: Resultaten ophalen en verifiëren
Verwerk de API-respons om het gegenereerde antwoord te verkrijgen. Na verwerking reageert de API met de taakstatus en uitvoergegevens.
Zie ook Gemini 3 Pro Preview API