Technische Spezifikationen von GPT-5.4-2026-03-05
| Element | GPT-5.4-2026-03-05 |
|---|---|
| Modellfamilie | GPT-5 |
| Anbieter | OpenAI |
| Veröffentlichungsdatum | 5. März 2026 |
| Kontextfenster | 1,050,000 tokens |
| Maximale Ausgabetoken | 128,000 |
| Eingabetypen | Text, Bild |
| Ausgabetypen | Text |
| Audio | Nicht unterstützt |
| Reasoning-Steuerung | keine, niedrig, mittel, hoch, extra hoch |
| Tool-Unterstützung | Websuche, Dateisuche, Code-Interpreter, Bildgenerierung |
| Wissensstand | 31. August 2025 |
| Snapshot-Stabilität | Fixiertes Modellverhalten |
Was ist GPT-5.4?
GPT-5.4 ist eine vereinheitlichte Spitzenveröffentlichung, die Verbesserungen aus den jüngsten Reasoning- und Coding-Linien (einschließlich der GPT-5.3-Codex-Arbeiten) in einem einzigen Modell für professionelle Wissensarbeit zusammenführt. Es ist als „Thinking“-Modell für tiefere, steuerbare Reasoning-Prozesse positioniert und als „Pro“-Variante für Kunden mit höchster Performance/hohem Durchsatz. Zentrale Themen des Releases sind: (1) längerer Kontext und Verständnis auf Dokumentebene, (2) verbesserte Tool- und „Computer Use“-Fähigkeiten (Steuerung von Apps, Bearbeitung von Tabellen/Präsentationen) und (3) weniger Faktenfehler sowie stärkeres mehrstufiges Planen.
Hauptfunktionen von GPT-5.4
- Enorme Langkontext-Fähigkeit (experimentell 1M+ tokens): GPT-5.4 unterstützt experimentelle 1.05M token Sessions (mit Preisen/Limits) und ermöglicht Reasoning über ganze Bücher/Codebasen sowie die Synthese über mehrere Dokumente. Für die allgemeine Verfügbarkeit bleibt das Standardfenster bei ≈272K tokens.
- Verbesserte mehrstufige Tool-Nutzung und native „Computer Use“: bessere Desktop-/Browser-Steuerung für agentische Workflows (Tastatur/Maus über eine Computer-Use-Schnittstelle), Websuche, die über mehrere Runden fortbesteht, und ein neuer Mechanismus Tool Search, um Konnektoren/Tools effizient zu finden. OpenAI berichtet über Spitzenleistungen in mehreren Benchmarks zu Computer-Nutzung und Web-Agenten.
- Erstellung/Bearbeitung von Tabellen, Dokumenten und Präsentationen: spezifisches Tuning für Office-Workflows; interne Benchmarks zeigen große Fortschritte beim Tabellenmodellieren und bei der Qualität von Präsentationen. OpenAI hat parallel ein ChatGPT for Excel Add-in gestartet.
- Steuerbarkeit und Reasoning-Modi: Der „Thinking“-Modus erzeugt für lange Aufgaben einen expliziten Plan/eine Präambel und unterstützt Steuerung während der Antwort (Anpassen von Anweisungen während der Generierung). Stufen für den Reasoning-Aufwand erlauben es, Latenz gegen tieferes Chain-of-Thought-Reasoning einzutauschen.
- Verbesserte multimodale Verständnisfähigkeit: bessere Interpretation hochauflösender Bilder und Diagramme (Bildeingabe), genutzt für Dokumentverständnis und Präsentationen.
- Sicherheitsausrichtung: OpenAI behandelt GPT-5.4 als Modell mit hoher Cyberfähigkeit und setzt verbesserte Schutzmaßnahmen ähnlich den GPT-5.3-Codex-Mitigations ein.
Benchmark-Leistung
| GPT-5.4 | GPT-5.3-Codex | GPT-5.2 | |
|---|---|---|---|
| GDPval (Siege oder Gleichstand) | 83.0% | 70.9% | 70.9% |
| SWE-Bench Pro (Public) | 57.7% | 56.8% | 55.6% |
| OSWorld-Verified | 75.0% | 74.0%* | 47.3% |
| Toolathlon | 54.6% | 51.9% | 46.3% |
| BrowseComp | 82.7% | 77.3% | 65.8% |
GPT-5.4 vs. vergleichbare Modelle
| Modell | Kontextfenster | Hauptstärke |
|---|---|---|
| GPT-5.4-2026-03-05 | 1,050,000 tokens | Frontier-Reasoning + Agent-Workflows |
| GPT-5.3 Instant | Kleiner | Schnellere Alltagsaufgaben |
| Claude Opus / Sonnet | ~200k tokens | Long-Form-Reasoning |
| Gemini 3 Pro | ~1M tokens | Multimodales Reasoning |
Wesentlicher Unterschied: GPT-5.4 fokussiert stark auf professionelle Produktivitäts-Workflows und Agent-Fähigkeiten, insbesondere in der Integration mit externen Tools.
Repräsentative Anwendungsfälle in der Produktion
- Enterprise-Dokument- und Compliance-Workflows: Verarbeitung langer Verträge, Extraktion von Verpflichtungen und Verfassen von Kommentaren über mehrere Dokumentkorpora hinweg (profitieren von den 272K→1M-Kontextoptionen für Single-Session-Synthese).
- Tabellenautomatisierung & Finanzmodellierung: Generieren von Formeln, Aufbau mehrblättriger Modelle aus einer Beschreibung in einfacher Sprache, Abgleich von Eingaben — OpenAI berichtet über große Fortschritte bei Aufgaben im Stil von Junior-Investmentbanking.
- Agentische Automatisierung & „Computer Use“: automatisierte Browser-/Desktop-Workflows (Installation, QA, Tool-Orchestrierung) und mehrstufige Toolketten (Zapier-Integrationen als Partner genannt).
- Software-Engineering & Code-Wartung: Codegenerierung, Refactorings und Terminal/CLI-Agent-Aufgaben (berichtet: Verbesserungen bei Terminal-Bench). Für große Codebasen hilft das lange Kontextfenster, muss aber anhand aufgabenbezogener Heuristiken validiert werden.
- Unterstützung für Wissensarbeiter: Forschungssynthese (BrowseComp-Verbesserungen), Foliensatz-Erstellung und visuelles Design für Präsentationen.
Zugriff auf die GPT-5.4-API
Schritt 1: Für API-Schlüssel registrieren
Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer sind, registrieren Sie sich bitte zuerst. Melden Sie sich in Ihrer CometAPI-Konsole an. Rufen Sie den Zugangs-Credential-API-Schlüssel der Schnittstelle ab. Klicken Sie im persönlichen Bereich beim API-Token auf „Add Token“, erhalten Sie den Token-Schlüssel: sk-xxxxx und senden Sie ihn ab.

Schritt 2: Anfragen an die GPT-5.4-API senden
Wählen Sie den Endpunkt „gpt-5.4“, um die API-Anfrage zu senden, und setzen Sie den Request-Body. Die Anfragemethode und der Request-Body sind unserer Website-API-Doku zu entnehmen. Unsere Website bietet zudem Apifox-Tests zu Ihrer Unterstützung. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto. Basis-URL ist Chat Completions und Responses.
Fügen Sie Ihre Frage oder Anforderung in das content-Feld ein — darauf wird das Modell antworten. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.
Schritt 3: Ergebnisse abrufen und verifizieren
Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten. Nach der Verarbeitung antwortet die API mit dem Aufgabenstatus und den Ausgabedaten.




.webp)