What is the difference between gpt-5.4 and gpt-5.4-2026-03-05 in the OpenAI API?

gpt-5.4 ist ein beweglicher Alias, der sich mit der Verbesserung des Modells aktualisieren kann, während gpt-5.4-2026-03-05 eine Snapshot-Version ist, die stabiles Verhalten und reproduzierbare Ergebnisse in der Produktion gewährleistet.

What is the context window size of the GPT-5.4 API model?

GPT-5.4 unterstützt ein Kontextfenster von ungefähr 1.050.000 Tokens mit bis zu 128.000 Ausgabetokens.

Does GPT-5.4 support tool calling and external integrations?

Ja. GPT-5.4 unterstützt die Tool-Orchestrierung über die Responses API, einschließlich Websuche, Dateisuche, Code Interpreter und Bildgenerierungstools.

How does GPT-5.4 compare to GPT-5.3 Instant?

GPT-5.4 konzentriert sich auf tiefergehendes Schlussfolgern und professionelle Workflows, während GPT-5.3 Instant für schnellere Alltagsgespräche und Aufgaben mit geringerer Latenz optimiert ist.

Can GPT-5.4 process images through the API?

Ja. GPT-5.4 unterstützt Bildeingaben, sodass das Modell Screenshots, Diagramme oder Fotos zusammen mit Text-Prompts analysieren kann.

When should developers use the GPT-5.4 snapshot model instead of the alias version?

Entwickler sollten das Snapshot-Modell verwenden, wenn sie stabile Ausgaben für Produktionssysteme, Benchmarking oder regulatorische Compliance benötigen.

Does GPT-5.4 support configurable reasoning levels?

Ja. Die API erlaubt es Entwicklern, Reasoning-Ebenen wie low, medium, high oder xhigh festzulegen, um zu steuern, wie viel internes Schlussfolgern das Modell durchführt.

Erschwingliche GPT-5.4 API | text-to-text

Technische Spezifikationen von GPT-5.4-2026-03-05

Element	GPT-5.4-2026-03-05
Modellfamilie	GPT-5
Anbieter	OpenAI
Veröffentlichungsdatum	5. März 2026
Kontextfenster	1,050,000 tokens
Maximale Ausgabetoken	128,000
Eingabetypen	Text, Bild
Ausgabetypen	Text
Audio	Nicht unterstützt
Reasoning-Steuerung	keine, niedrig, mittel, hoch, extra hoch
Tool-Unterstützung	Websuche, Dateisuche, Code-Interpreter, Bildgenerierung
Wissensstand	31. August 2025
Snapshot-Stabilität	Fixiertes Modellverhalten

Was ist GPT-5.4?

GPT-5.4 ist eine vereinheitlichte Spitzenveröffentlichung, die Verbesserungen aus den jüngsten Reasoning- und Coding-Linien (einschließlich der GPT-5.3-Codex-Arbeiten) in einem einzigen Modell für professionelle Wissensarbeit zusammenführt. Es ist als „Thinking“-Modell für tiefere, steuerbare Reasoning-Prozesse positioniert und als „Pro“-Variante für Kunden mit höchster Performance/hohem Durchsatz. Zentrale Themen des Releases sind: (1) längerer Kontext und Verständnis auf Dokumentebene, (2) verbesserte Tool- und „Computer Use“-Fähigkeiten (Steuerung von Apps, Bearbeitung von Tabellen/Präsentationen) und (3) weniger Faktenfehler sowie stärkeres mehrstufiges Planen.

Hauptfunktionen von GPT-5.4

Enorme Langkontext-Fähigkeit (experimentell 1M+ tokens): GPT-5.4 unterstützt experimentelle 1.05M token Sessions (mit Preisen/Limits) und ermöglicht Reasoning über ganze Bücher/Codebasen sowie die Synthese über mehrere Dokumente. Für die allgemeine Verfügbarkeit bleibt das Standardfenster bei ≈272K tokens.
Verbesserte mehrstufige Tool-Nutzung und native „Computer Use“: bessere Desktop-/Browser-Steuerung für agentische Workflows (Tastatur/Maus über eine Computer-Use-Schnittstelle), Websuche, die über mehrere Runden fortbesteht, und ein neuer Mechanismus Tool Search, um Konnektoren/Tools effizient zu finden. OpenAI berichtet über Spitzenleistungen in mehreren Benchmarks zu Computer-Nutzung und Web-Agenten.
Erstellung/Bearbeitung von Tabellen, Dokumenten und Präsentationen: spezifisches Tuning für Office-Workflows; interne Benchmarks zeigen große Fortschritte beim Tabellenmodellieren und bei der Qualität von Präsentationen. OpenAI hat parallel ein ChatGPT for Excel Add-in gestartet.
Steuerbarkeit und Reasoning-Modi: Der „Thinking“-Modus erzeugt für lange Aufgaben einen expliziten Plan/eine Präambel und unterstützt Steuerung während der Antwort (Anpassen von Anweisungen während der Generierung). Stufen für den Reasoning-Aufwand erlauben es, Latenz gegen tieferes Chain-of-Thought-Reasoning einzutauschen.
Verbesserte multimodale Verständnisfähigkeit: bessere Interpretation hochauflösender Bilder und Diagramme (Bildeingabe), genutzt für Dokumentverständnis und Präsentationen.
Sicherheitsausrichtung: OpenAI behandelt GPT-5.4 als Modell mit hoher Cyberfähigkeit und setzt verbesserte Schutzmaßnahmen ähnlich den GPT-5.3-Codex-Mitigations ein.

Benchmark-Leistung

	GPT-5.4	GPT-5.3-Codex	GPT-5.2
GDPval (Siege oder Gleichstand)	83.0%	70.9%	70.9%
SWE-Bench Pro (Public)	57.7%	56.8%	55.6%
OSWorld-Verified	75.0%	74.0%*	47.3%
Toolathlon	54.6%	51.9%	46.3%
BrowseComp	82.7%	77.3%	65.8%

GPT-5.4 vs. vergleichbare Modelle

Modell	Kontextfenster	Hauptstärke
GPT-5.4-2026-03-05	1,050,000 tokens	Frontier-Reasoning + Agent-Workflows
GPT-5.3 Instant	Kleiner	Schnellere Alltagsaufgaben
Claude Opus / Sonnet	~200k tokens	Long-Form-Reasoning
Gemini 3 Pro	~1M tokens	Multimodales Reasoning

Wesentlicher Unterschied: GPT-5.4 fokussiert stark auf professionelle Produktivitäts-Workflows und Agent-Fähigkeiten, insbesondere in der Integration mit externen Tools.

Repräsentative Anwendungsfälle in der Produktion

Enterprise-Dokument- und Compliance-Workflows: Verarbeitung langer Verträge, Extraktion von Verpflichtungen und Verfassen von Kommentaren über mehrere Dokumentkorpora hinweg (profitieren von den 272K→1M-Kontextoptionen für Single-Session-Synthese).
Tabellenautomatisierung & Finanzmodellierung: Generieren von Formeln, Aufbau mehrblättriger Modelle aus einer Beschreibung in einfacher Sprache, Abgleich von Eingaben — OpenAI berichtet über große Fortschritte bei Aufgaben im Stil von Junior-Investmentbanking.
Agentische Automatisierung & „Computer Use“: automatisierte Browser-/Desktop-Workflows (Installation, QA, Tool-Orchestrierung) und mehrstufige Toolketten (Zapier-Integrationen als Partner genannt).
Software-Engineering & Code-Wartung: Codegenerierung, Refactorings und Terminal/CLI-Agent-Aufgaben (berichtet: Verbesserungen bei Terminal-Bench). Für große Codebasen hilft das lange Kontextfenster, muss aber anhand aufgabenbezogener Heuristiken validiert werden.
Unterstützung für Wissensarbeiter: Forschungssynthese (BrowseComp-Verbesserungen), Foliensatz-Erstellung und visuelles Design für Präsentationen.

Zugriff auf die GPT-5.4-API

Schritt 1: Für API-Schlüssel registrieren

Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer sind, registrieren Sie sich bitte zuerst. Melden Sie sich in Ihrer CometAPI-Konsole an. Rufen Sie den Zugangs-Credential-API-Schlüssel der Schnittstelle ab. Klicken Sie im persönlichen Bereich beim API-Token auf „Add Token“, erhalten Sie den Token-Schlüssel: sk-xxxxx und senden Sie ihn ab.

cometapi-key

Schritt 2: Anfragen an die GPT-5.4-API senden

Wählen Sie den Endpunkt „gpt-5.4“, um die API-Anfrage zu senden, und setzen Sie den Request-Body. Die Anfragemethode und der Request-Body sind unserer Website-API-Doku zu entnehmen. Unsere Website bietet zudem Apifox-Tests zu Ihrer Unterstützung. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto. Basis-URL ist Chat Completions und Responses.

Fügen Sie Ihre Frage oder Anforderung in das content-Feld ein — darauf wird das Modell antworten. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.

Schritt 3: Ergebnisse abrufen und verifizieren

Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten. Nach der Verarbeitung antwortet die API mit dem Aufgabenstatus und den Ausgabedaten.

Comet-Preis (USD / M Tokens)	Offizieller Preis (USD / M Tokens)	Rabatt
Eingabe:0.00/M Ausgabe:0.00/M	Eingabe:0.00/M Ausgabe:0.00/M	-

Modell-ID	Verfügbarkeit	Anfrage
gpt-5.4-2026-03-05	✅	Responses und Chat Completions
gpt-5.4	✅	Responses und Chat Completions

Technische Spezifikationen von GPT-5.4-2026-03-05

Element	GPT-5.4-2026-03-05
Modellfamilie	GPT-5
Anbieter	OpenAI
Veröffentlichungsdatum	5. März 2026
Kontextfenster	1,050,000 tokens
Maximale Ausgabetoken	128,000
Eingabetypen	Text, Bild
Ausgabetypen	Text
Audio	Nicht unterstützt
Reasoning-Steuerung	keine, niedrig, mittel, hoch, extra hoch
Tool-Unterstützung	Websuche, Dateisuche, Code-Interpreter, Bildgenerierung
Wissensstand	31. August 2025
Snapshot-Stabilität	Fixiertes Modellverhalten

Was ist GPT-5.4?

Hauptfunktionen von GPT-5.4

Enorme Langkontext-Fähigkeit (experimentell 1M+ tokens): GPT-5.4 unterstützt experimentelle 1.05M token Sessions (mit Preisen/Limits) und ermöglicht Reasoning über ganze Bücher/Codebasen sowie die Synthese über mehrere Dokumente. Für die allgemeine Verfügbarkeit bleibt das Standardfenster bei ≈272K tokens.
Verbesserte mehrstufige Tool-Nutzung und native „Computer Use“: bessere Desktop-/Browser-Steuerung für agentische Workflows (Tastatur/Maus über eine Computer-Use-Schnittstelle), Websuche, die über mehrere Runden fortbesteht, und ein neuer Mechanismus Tool Search, um Konnektoren/Tools effizient zu finden. OpenAI berichtet über Spitzenleistungen in mehreren Benchmarks zu Computer-Nutzung und Web-Agenten.
Erstellung/Bearbeitung von Tabellen, Dokumenten und Präsentationen: spezifisches Tuning für Office-Workflows; interne Benchmarks zeigen große Fortschritte beim Tabellenmodellieren und bei der Qualität von Präsentationen. OpenAI hat parallel ein ChatGPT for Excel Add-in gestartet.
Steuerbarkeit und Reasoning-Modi: Der „Thinking“-Modus erzeugt für lange Aufgaben einen expliziten Plan/eine Präambel und unterstützt Steuerung während der Antwort (Anpassen von Anweisungen während der Generierung). Stufen für den Reasoning-Aufwand erlauben es, Latenz gegen tieferes Chain-of-Thought-Reasoning einzutauschen.
Verbesserte multimodale Verständnisfähigkeit: bessere Interpretation hochauflösender Bilder und Diagramme (Bildeingabe), genutzt für Dokumentverständnis und Präsentationen.
Sicherheitsausrichtung: OpenAI behandelt GPT-5.4 als Modell mit hoher Cyberfähigkeit und setzt verbesserte Schutzmaßnahmen ähnlich den GPT-5.3-Codex-Mitigations ein.

Benchmark-Leistung

	GPT-5.4	GPT-5.3-Codex	GPT-5.2
GDPval (Siege oder Gleichstand)	83.0%	70.9%	70.9%
SWE-Bench Pro (Public)	57.7%	56.8%	55.6%
OSWorld-Verified	75.0%	74.0%*	47.3%
Toolathlon	54.6%	51.9%	46.3%
BrowseComp	82.7%	77.3%	65.8%

GPT-5.4 vs. vergleichbare Modelle

Modell	Kontextfenster	Hauptstärke
GPT-5.4-2026-03-05	1,050,000 tokens	Frontier-Reasoning + Agent-Workflows
GPT-5.3 Instant	Kleiner	Schnellere Alltagsaufgaben
Claude Opus / Sonnet	~200k tokens	Long-Form-Reasoning
Gemini 3 Pro	~1M tokens	Multimodales Reasoning

Wesentlicher Unterschied: GPT-5.4 fokussiert stark auf professionelle Produktivitäts-Workflows und Agent-Fähigkeiten, insbesondere in der Integration mit externen Tools.

Repräsentative Anwendungsfälle in der Produktion

Enterprise-Dokument- und Compliance-Workflows: Verarbeitung langer Verträge, Extraktion von Verpflichtungen und Verfassen von Kommentaren über mehrere Dokumentkorpora hinweg (profitieren von den 272K→1M-Kontextoptionen für Single-Session-Synthese).
Tabellenautomatisierung & Finanzmodellierung: Generieren von Formeln, Aufbau mehrblättriger Modelle aus einer Beschreibung in einfacher Sprache, Abgleich von Eingaben — OpenAI berichtet über große Fortschritte bei Aufgaben im Stil von Junior-Investmentbanking.
Agentische Automatisierung & „Computer Use“: automatisierte Browser-/Desktop-Workflows (Installation, QA, Tool-Orchestrierung) und mehrstufige Toolketten (Zapier-Integrationen als Partner genannt).
Software-Engineering & Code-Wartung: Codegenerierung, Refactorings und Terminal/CLI-Agent-Aufgaben (berichtet: Verbesserungen bei Terminal-Bench). Für große Codebasen hilft das lange Kontextfenster, muss aber anhand aufgabenbezogener Heuristiken validiert werden.
Unterstützung für Wissensarbeiter: Forschungssynthese (BrowseComp-Verbesserungen), Foliensatz-Erstellung und visuelles Design für Präsentationen.

Zugriff auf die GPT-5.4-API

Schritt 1: Für API-Schlüssel registrieren

cometapi-key

Schritt 2: Anfragen an die GPT-5.4-API senden

Fügen Sie Ihre Frage oder Anforderung in das content-Feld ein — darauf wird das Modell antworten. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.

Schritt 3: Ergebnisse abrufen und verifizieren

Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten. Nach der Verarbeitung antwortet die API mit dem Aufgabenstatus und den Ausgabedaten.

GPT-5.4

Playground für GPT-5.4

Technische Spezifikationen von GPT-5.4-2026-03-05

Was ist GPT-5.4?

Hauptfunktionen von GPT-5.4

Benchmark-Leistung

GPT-5.4 vs. vergleichbare Modelle

Repräsentative Anwendungsfälle in der Produktion

Zugriff auf die GPT-5.4-API

Schritt 1: Für API-Schlüssel registrieren

Schritt 2: Anfragen an die GPT-5.4-API senden

Schritt 3: Ergebnisse abrufen und verifizieren

FAQ

Preise für GPT-5.4

Beispielcode und API für GPT-5.4

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime

Versionen von GPT-5.4

GPT-5.4

Playground für GPT-5.4

Technische Spezifikationen von GPT-5.4-2026-03-05

Was ist GPT-5.4?

Hauptfunktionen von GPT-5.4

Benchmark-Leistung

GPT-5.4 vs. vergleichbare Modelle

Repräsentative Anwendungsfälle in der Produktion

Zugriff auf die GPT-5.4-API

Schritt 1: Für API-Schlüssel registrieren

Schritt 2: Anfragen an die GPT-5.4-API senden

Schritt 3: Ergebnisse abrufen und verifizieren

FAQ

Preise für GPT-5.4

Beispielcode und API für GPT-5.4

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime

Versionen von GPT-5.4