How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 bietet gegenüber GPT Image 1 bis zu 4× höhere Geschwindigkeit und reduziert die Latenz bei iterativen kreativen Workflows deutlich.

Does GPT Image 1.5 support multi-turn conversational editing?

Ja, über die Responses API unterstützt GPT Image 1.5 mehrstufige Bearbeitungs-Workflows, bei denen Sie durch nachfolgende Anweisungen Bilder iterativ verfeinern können, während der Kontext erhalten bleibt.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 unterstützt 1024×1024 (quadratisch), 1536×1024 (Querformat) und 1024×1536 (Hochformat). Zu den Qualitätsoptionen gehören low, medium, high und auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Ja, GPT Image 1.5 akzeptiert mehrere Eingabebilder für Compositing und Stilreferenzen. Die ersten 5 Bilder werden mit höherer Treue beibehalten, wenn der Modus high input_fidelity verwendet wird.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 legt den Schwerpunkt auf Bearbeitungstreue und Iterationsgeschwindigkeit, während Nano Banana Pro für Studio-Realismus gelobt wird. Beide sind eng konkurrenzfähig—wählen Sie je nach den Anforderungen Ihres Workflows.

Does GPT Image 1.5 support transparent backgrounds?

Ja, setzen Sie den Parameter background bei den Ausgabeformaten PNG oder WebP auf 'transparent'. Transparenz funktioniert am besten bei mittleren oder hohen Qualitätseinstellungen.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 akzeptiert Prompts mit bis zu 32,000 Zeichen und ermöglicht damit hochdetaillierte und präzise begrenzte Anweisungen für komplexe Bildgenerierungsaufgaben.

Erschwingliche GPT Image 1.5 API | text-to-image

Was ist die GPT-Image-1.5-API?

GPT-Image-1.5 ist das neueste Mitglied von OpenAIs GPT Image-Familie und das Modell hinter ChatGPTs überarbeitetem Images-Erlebnis. Es ist darauf ausgelegt, die Bildgenerierung von Neuheits-Experimenten zu produktionsreifen Kreativwerkzeugen zu führen: höherer Fotorealismus, feinere Kontrolle für iterative Bearbeitungen und schnellere Inferenz zur Unterstützung interaktiver und Enterprise-Workflows.

Die gpt-image-1.5-API ist ein multimodaler Bildmodell-Endpunkt, der ein oder mehrere Bild-Inputs (Datei-IDs oder Bytes) plus einen Text-Prompt akzeptiert und generierte oder bearbeitete Bilder zurückgibt. Sie unterstützt:

Text-zu-Bild-Generierung (Erzeugung aus Prompt),
Bildbearbeitung / Inpainting / Compositing (Anweisungen auf vorhandene Bilder anwenden, mehrere Bild-Inputs erlaubt), und
Iterative, mehrschrittige Bearbeitungs-Workflows über die Responses API (ermöglicht „tweak & iterate“-UIs).

Die API behandelt Bild-Prompts anders als die alten DALL·E-Grenzen: GPT-Bildmodelle akzeptieren deutlich längere Text-Prompts (der 32k-Zeichen-Richtwert), wodurch komplexe, restriktionsreiche Anweisungen möglich werden.

Hauptfunktionen (praktisch)

Verbesserte Editierbarkeit / Multi-Turn-Konsistenz: bewahrt Charaktererscheinung, Beleuchtung und zentrale visuelle Attribute über iterative Bearbeitungen hinweg. Dadurch wird „gleiches Modell, wiederholte Bearbeitungen“ für Workflows wie Produktkataloge oder Marken-Assets zuverlässiger.
Schnellerer Durchsatz — 4× Geschwindigkeitsverbesserung gegenüber GPT Image 1, mit dem Ziel, die Latenz für iterative Kreativ-Workflows zu senken.
Kostenoptimierungen — Bild-Ein-/Ausgabe-Kosten um etwa 20 % gegenüber GPT Image 1 reduziert, wodurch Iterationskosten pro Bild für Nutzer mit hohem Volumen sinken.
Mehrbild-Compositing & Stilreferenzierung — akzeptiert mehrere Referenzbilder, um Szenen zu komponieren oder Stil/Beleuchtung zu übertragen.
Qualitäts-/Fidelity-Regler — API-Parameter, die Geschwindigkeit gegen Treue abwägen (niedrigere Qualität für Massengenerierung; höhere Qualität für Produktions-Assets).
Multi-Turn-Bearbeitung / Responses API-Integration — ermöglicht schrittweise Workflows (Änderungen anfordern, dann „Tweaks vornehmen“ bei Erhalt des Zustands).

Technische Leistungsmerkmale

Text-Prompt-Limit (Bildmodelle): bis zu 32,000 Zeichen (Hinweis: OpenAI dokumentiert dies als Textlängenfreigabe für GPT-Bildmodelle). Verwenden Sie dies für lange, restriktionsreiche Prompts.
Bild-Inputs: akzeptiert File IDs (bevorzugt für Multi-Turn-Flows) oder Rohbytes; mehrere Bilder können für Compositing und als Referenz bereitgestellt werden.
Ausgaben: PNG/JPEG oder plattformspezifische Standard-Bildartefakte, die von der API zurückgegeben werden (oder als Anhänge innerhalb von ChatGPT). Ausgaben können mehrere Kandidatenbilder enthalten und unterstützen iterative Anfragen zur Verfeinerung einer Ausgabe.
Generierungsmodi: Text-zu-Bild, Bildbearbeitung (Inpainting/Erweitern mit Anweisungen) und Varianten. Multi-Turn-Bearbeitung unterstützt Anweisungen im Stil „add/subtract/combine“.
Anweisungsbewusste Bearbeitung: Modelle sind auf Instruktions-Treue optimiert (Erhalt angegebener Invarianten wie „Logo nicht ändern“, „Pose und Beleuchtung beibehalten“). Prompt-Engineering-Muster (explizite Invarianten, die in jeder Iteration wiederholt werden) reduzieren semantische Drift.

Benchmark-Leistung

Platzierung im Leaderboard: Ein aggregierter Bericht verzeichnet GPT Image 1.5 mit ~1264 Punkten an der Spitze der Text-zu-Bild-Ranglisten auf einem Artificial Analysis-Leaderboard, mit messbarem Abstand vor dem nächstplatzierten Modell.
Aufgabenbezogene Metriken (Bearbeitung & Erhalt): Eine Microsoft Foundry-Zusammenfassung von Evaluationsmetriken zeigt, dass GPT-Image-1.5 einen nahezu perfekten binären Modifikationserfolg erzielt (100 % in einem Single-Turn-BinaryEval) und starke Gesichtserhaltungs-Scores (rund 90 % bei AuraFace-Messungen) in deren Vergleichstabelle gegenüber Wettbewerbern und früheren OpenAI-Modellen. Diese vergleichenden Metriken positionieren GPT-Image-1.5 bei Erhalt und Bearbeitungstreue vor einigen Rivalen.

GPT Image 1.5

Vergleich von GPT-Image-1.5 mit Wettbewerbern

Vs. GPT Image 1 (vorherige OpenAI-Generation): schneller (bis zu 4×), günstiger (~20 % niedrigere Bild-IO-Kosten) und stärkere Bearbeitungstreue — ausgerichtet darauf, von „Prototyp/Demo“ zu „produktionsfreundlichen“ Bild-Workflows zu wechseln.
Vs. Googles Nano Banana Pro / Gemini-Bildmodelle: GPT-Image-1.5 und Googles Nano Banana Pro / Gemini 3-Familie als enge Rivalen — jeweils mit Stärken in unterschiedlichen Prompt-Klassen. OpenAIs Kommunikation betont Bearbeitungstreue und Iterationsgeschwindigkeit; Googles Angebot wurde in einigen Beispielen für Realismus auf Studioqualität gelobt.
Vs. Qwen Image und andere offene/geschlossene Modelle: GPT-Image-1.5 übertrifft Qwen Image bei mehreren Metriken zu Bearbeitung und Erhalt in Single-Turn-Evaluierungen, aber die Unterschiede werden in Multi-Turn- oder anderen domänenspezifischen Tests geringer.

Worin GPT-Image-1.5 stark ist

E-Commerce-Produktabbildungen: Massenvarianten, Hintergrundwechsel, konsistente Produktkataloge aus einem einzigen Foto (Marken-/Logoerhaltung).
Produktion kreativer & Marketing-Assets: schnelle Konzeptiterationen, fotorealistische Mockups, kontrollierte Stilübertragungen.
Fotoretusche & redaktionelle Workflows: realistische Kleidungs-/Frisuren-Anproben, selektive Retuschen bei Wahrung von Identität und Beleuchtung.
Integration in Design-Tools: in Designplattformen oder CMS für bedarfsgesteuerte Bildvarianten einbinden (Fidelity-Regler helfen bei der Kostenkontrolle).
Mehrschritt-Compositing-Pipelines: Mehrbild-Inputs ermöglichen Compositing und referenzbasierte Generierung für komplexe Szenen.

So greifen Sie auf die GPT Image 1.5-API zu

Schritt 1: Für API-Schlüssel registrieren

Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer sind, registrieren Sie sich bitte zuerst. Melden Sie sich in Ihrer CometAPI console an. Holen Sie sich den Zugriffsberechtigungs-API-Schlüssel der Schnittstelle. Klicken Sie im persönlichen Zentrum beim API-Token auf „Add Token“, holen Sie sich den Token-Schlüssel: sk-xxxxx und senden Sie ihn ab.

Schritt 2: Anfragen an die GPT Image 1.5-API senden

Wählen Sie den „gpt-image-1.5“-Endpunkt, um die API-Anfrage zu senden, und legen Sie den Request-Body fest. Die Anfragemethode und der Request-Body werden unserer Website-API-Dokumentation entnommen. Unsere Website bietet auch einen Apifox-Test zu Ihrer Bequemlichkeit. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto. Basis-URL ist Images (https://api.cometapi.com/v1/images/generations) und [Bildbearbeitung]

Fügen Sie Ihre Frage oder Anfrage in das content-Feld ein — darauf antwortet das Modell. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.

Schritt 3: Ergebnisse abrufen und verifizieren

Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten. Nach der Verarbeitung antwortet die API mit dem Task-Status und Ausgabedaten.

Siehe auch Gemini 3 Pro Preview API

Comet-Preis (USD / M Tokens)	Offizieller Preis (USD / M Tokens)	Rabatt
Eingabe:$6.4/M Ausgabe:$25.6/M	Eingabe:$8/M Ausgabe:$32/M	-20%

version
gpt-image-1.5-2025-12-16
gpt-image-1.5

Was ist die GPT-Image-1.5-API?

Text-zu-Bild-Generierung (Erzeugung aus Prompt),
Bildbearbeitung / Inpainting / Compositing (Anweisungen auf vorhandene Bilder anwenden, mehrere Bild-Inputs erlaubt), und
Iterative, mehrschrittige Bearbeitungs-Workflows über die Responses API (ermöglicht „tweak & iterate“-UIs).

Hauptfunktionen (praktisch)

Verbesserte Editierbarkeit / Multi-Turn-Konsistenz: bewahrt Charaktererscheinung, Beleuchtung und zentrale visuelle Attribute über iterative Bearbeitungen hinweg. Dadurch wird „gleiches Modell, wiederholte Bearbeitungen“ für Workflows wie Produktkataloge oder Marken-Assets zuverlässiger.
Schnellerer Durchsatz — 4× Geschwindigkeitsverbesserung gegenüber GPT Image 1, mit dem Ziel, die Latenz für iterative Kreativ-Workflows zu senken.
Kostenoptimierungen — Bild-Ein-/Ausgabe-Kosten um etwa 20 % gegenüber GPT Image 1 reduziert, wodurch Iterationskosten pro Bild für Nutzer mit hohem Volumen sinken.
Mehrbild-Compositing & Stilreferenzierung — akzeptiert mehrere Referenzbilder, um Szenen zu komponieren oder Stil/Beleuchtung zu übertragen.
Qualitäts-/Fidelity-Regler — API-Parameter, die Geschwindigkeit gegen Treue abwägen (niedrigere Qualität für Massengenerierung; höhere Qualität für Produktions-Assets).
Multi-Turn-Bearbeitung / Responses API-Integration — ermöglicht schrittweise Workflows (Änderungen anfordern, dann „Tweaks vornehmen“ bei Erhalt des Zustands).

Technische Leistungsmerkmale

Text-Prompt-Limit (Bildmodelle): bis zu 32,000 Zeichen (Hinweis: OpenAI dokumentiert dies als Textlängenfreigabe für GPT-Bildmodelle). Verwenden Sie dies für lange, restriktionsreiche Prompts.
Bild-Inputs: akzeptiert File IDs (bevorzugt für Multi-Turn-Flows) oder Rohbytes; mehrere Bilder können für Compositing und als Referenz bereitgestellt werden.
Ausgaben: PNG/JPEG oder plattformspezifische Standard-Bildartefakte, die von der API zurückgegeben werden (oder als Anhänge innerhalb von ChatGPT). Ausgaben können mehrere Kandidatenbilder enthalten und unterstützen iterative Anfragen zur Verfeinerung einer Ausgabe.
Generierungsmodi: Text-zu-Bild, Bildbearbeitung (Inpainting/Erweitern mit Anweisungen) und Varianten. Multi-Turn-Bearbeitung unterstützt Anweisungen im Stil „add/subtract/combine“.
Anweisungsbewusste Bearbeitung: Modelle sind auf Instruktions-Treue optimiert (Erhalt angegebener Invarianten wie „Logo nicht ändern“, „Pose und Beleuchtung beibehalten“). Prompt-Engineering-Muster (explizite Invarianten, die in jeder Iteration wiederholt werden) reduzieren semantische Drift.

Benchmark-Leistung

Platzierung im Leaderboard: Ein aggregierter Bericht verzeichnet GPT Image 1.5 mit ~1264 Punkten an der Spitze der Text-zu-Bild-Ranglisten auf einem Artificial Analysis-Leaderboard, mit messbarem Abstand vor dem nächstplatzierten Modell.
Aufgabenbezogene Metriken (Bearbeitung & Erhalt): Eine Microsoft Foundry-Zusammenfassung von Evaluationsmetriken zeigt, dass GPT-Image-1.5 einen nahezu perfekten binären Modifikationserfolg erzielt (100 % in einem Single-Turn-BinaryEval) und starke Gesichtserhaltungs-Scores (rund 90 % bei AuraFace-Messungen) in deren Vergleichstabelle gegenüber Wettbewerbern und früheren OpenAI-Modellen. Diese vergleichenden Metriken positionieren GPT-Image-1.5 bei Erhalt und Bearbeitungstreue vor einigen Rivalen.

GPT Image 1.5

Vergleich von GPT-Image-1.5 mit Wettbewerbern

Vs. GPT Image 1 (vorherige OpenAI-Generation): schneller (bis zu 4×), günstiger (~20 % niedrigere Bild-IO-Kosten) und stärkere Bearbeitungstreue — ausgerichtet darauf, von „Prototyp/Demo“ zu „produktionsfreundlichen“ Bild-Workflows zu wechseln.
Vs. Googles Nano Banana Pro / Gemini-Bildmodelle: GPT-Image-1.5 und Googles Nano Banana Pro / Gemini 3-Familie als enge Rivalen — jeweils mit Stärken in unterschiedlichen Prompt-Klassen. OpenAIs Kommunikation betont Bearbeitungstreue und Iterationsgeschwindigkeit; Googles Angebot wurde in einigen Beispielen für Realismus auf Studioqualität gelobt.
Vs. Qwen Image und andere offene/geschlossene Modelle: GPT-Image-1.5 übertrifft Qwen Image bei mehreren Metriken zu Bearbeitung und Erhalt in Single-Turn-Evaluierungen, aber die Unterschiede werden in Multi-Turn- oder anderen domänenspezifischen Tests geringer.

Worin GPT-Image-1.5 stark ist

E-Commerce-Produktabbildungen: Massenvarianten, Hintergrundwechsel, konsistente Produktkataloge aus einem einzigen Foto (Marken-/Logoerhaltung).
Produktion kreativer & Marketing-Assets: schnelle Konzeptiterationen, fotorealistische Mockups, kontrollierte Stilübertragungen.
Fotoretusche & redaktionelle Workflows: realistische Kleidungs-/Frisuren-Anproben, selektive Retuschen bei Wahrung von Identität und Beleuchtung.
Integration in Design-Tools: in Designplattformen oder CMS für bedarfsgesteuerte Bildvarianten einbinden (Fidelity-Regler helfen bei der Kostenkontrolle).
Mehrschritt-Compositing-Pipelines: Mehrbild-Inputs ermöglichen Compositing und referenzbasierte Generierung für komplexe Szenen.

So greifen Sie auf die GPT Image 1.5-API zu

Schritt 1: Für API-Schlüssel registrieren

Schritt 2: Anfragen an die GPT Image 1.5-API senden

Fügen Sie Ihre Frage oder Anfrage in das content-Feld ein — darauf antwortet das Modell. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.

Schritt 3: Ergebnisse abrufen und verifizieren

Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten. Nach der Verarbeitung antwortet die API mit dem Task-Status und Ausgabedaten.

Siehe auch Gemini 3 Pro Preview API

GPT Image 1.5

Playground für GPT Image 1.5

Was ist die GPT-Image-1.5-API?

Hauptfunktionen (praktisch)

Technische Leistungsmerkmale

Benchmark-Leistung

Vergleich von GPT-Image-1.5 mit Wettbewerbern

Worin GPT-Image-1.5 stark ist

So greifen Sie auf die GPT Image 1.5-API zu

Schritt 1: Für API-Schlüssel registrieren

Schritt 2: Anfragen an die GPT Image 1.5-API senden

Schritt 3: Ergebnisse abrufen und verifizieren

FAQ

Preise für GPT Image 1.5

Beispielcode und API für GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Versionen von GPT Image 1.5

GPT Image 1.5

Playground für GPT Image 1.5

Was ist die GPT-Image-1.5-API?

Hauptfunktionen (praktisch)

Technische Leistungsmerkmale

Benchmark-Leistung

Vergleich von GPT-Image-1.5 mit Wettbewerbern

Worin GPT-Image-1.5 stark ist

So greifen Sie auf die GPT Image 1.5-API zu

Schritt 1: Für API-Schlüssel registrieren

Schritt 2: Anfragen an die GPT Image 1.5-API senden

Schritt 3: Ergebnisse abrufen und verifizieren

FAQ

Preise für GPT Image 1.5

Beispielcode und API für GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Versionen von GPT Image 1.5