Specifiche tecniche di GPT-5.4-2026-03-05
| Voce | GPT-5.4-2026-03-05 |
|---|---|
| Famiglia di modelli | GPT-5 |
| Fornitore | OpenAI |
| Data di rilascio | March 5, 2026 |
| Finestra di contesto | 1,050,000 tokens |
| Token massimi di output | 128,000 |
| Tipi di input | Text, Image |
| Tipi di output | Text |
| Audio | Not supported |
| Controlli di ragionamento | none, low, medium, high, xhigh |
| Supporto strumenti | Web search, File search, Code interpreter, Image generation |
| Data limite della conoscenza | Aug 31, 2025 |
| Stabilità snapshot | Locked model behavior |
Che cos’è GPT-5.4?
GPT-5.4 è una release di frontiera unificata che integra i miglioramenti delle recenti linee di ragionamento e di coding (incluso il lavoro GPT-5.3-Codex) in un unico modello rivolto al lavoro professionale della conoscenza. È posizionato come modello “Thinking” per un ragionamento più profondo e pilotabile e come variante “Pro” per i clienti con i massimi requisiti di prestazioni/throughput. I temi chiave del rilascio sono: (1) contesto più lungo e comprensione a livello di documento, (2) capacità migliorate di utilizzo degli strumenti e di “computer use” (controllo di app, modifica di fogli di calcolo/presentazioni) e (3) riduzione degli errori fattuali e pianificazione multi-step più solida.
Caratteristiche principali di GPT-5.4
- Capacità di contesto estremamente estesa (sperimentale 1M+): GPT-5.4 supporta sessioni sperimentali da 1.05M token (con pricing/limiti) che consentono ragionamento su interi libri/intere codebase e sintesi multi-documento. Per la disponibilità generale, la finestra standard rimane ≈272K token.
- Utilizzo multi-step degli strumenti e “computer use” nativo migliorati: migliore controllo di desktop/browser per workflow agentici (tastiera/mouse tramite un’interfaccia di computer-use), ricerca web che persiste tra i turni e un nuovo meccanismo di Tool Search per trovare connettori/strumenti in modo efficiente. OpenAI riporta risultati allo stato dell’arte su molteplici benchmark di computer-use e web agent.
- Generazione/modifica di fogli di calcolo, documenti e presentazioni: messa a punto specifica per i workflow d’ufficio; benchmark interni mostrano grandi miglioramenti nella modellazione su fogli di calcolo e nella qualità delle presentazioni. OpenAI ha inoltre lanciato un componente aggiuntivo ChatGPT for Excel insieme al rilascio.
- Governabilità e modalità di ragionamento: la modalità “Thinking” produce un piano/preludio esplicito per compiti lunghi e supporta la guida in corsa (regolazione delle istruzioni durante la generazione). I livelli di sforzo di ragionamento consentono agli utenti di scambiare latenza con un ragionamento a catena più profondo.
- Comprensione multimodale potenziata: migliore interpretazione di immagini e grafici ad alta risoluzione (input immagine), impiegata per la comprensione di documenti e presentazioni.
- Postura di sicurezza: OpenAI tratta GPT-5.4 come un modello con elevate capacità cyber e implementa salvaguardie rafforzate simili alle mitigazioni di GPT-5.3-Codex.
Prestazioni sui benchmark
| GPT-5.4 | GPT-5.3-Codex | GPT-5.2 | |
|---|---|---|---|
| GDPval (vittorie o pareggi) | 83.0% | 70.9% | 70.9% |
| SWE-Bench Pro (Public) | 57.7% | 56.8% | 55.6% |
| OSWorld-Verified | 75.0% | 74.0%* | 47.3% |
| Toolathlon | 54.6% | 51.9% | 46.3% |
| BrowseComp | 82.7% | 77.3% | 65.8% |
GPT-5.4 vs Modelli comparabili
| Modello | Finestra di contesto | Punto di forza principale |
|---|---|---|
| GPT-5.4-2026-03-05 | 1,050,000 tokens | Ragionamento di frontiera + workflow agentici |
| GPT-5.3 Instant | Più piccola | Attività quotidiane più rapide |
| Claude Opus / Sonnet | ~200k tokens | Ragionamento long-form |
| Gemini 3 Pro | ~1M tokens | Ragionamento multimodale |
Differenza chiave: GPT-5.4 è fortemente focalizzato sui workflow di produttività professionale e sulle capacità agentiche, in particolare quando integrato con strumenti esterni.
Casi d’uso rappresentativi in produzione
- Workflow enterprise per documenti e conformità: elaborazione di contratti lunghi, estrazione di obblighi e redazione di commenti su corpora multi-documento (beneficia delle opzioni di contesto 272K→1M per la sintesi in sessione singola).
- Automazione di fogli di calcolo e modellazione finanziaria: generazione di formule, creazione di modelli multi-scheda da specifiche in linguaggio naturale, riconciliazione degli input — OpenAI riporta grandi progressi in attività di tipo junior investment-banking.
- Automazione agentica e “computer use”: workflow automatizzati su browser/desktop (installazione, QA, orchestrazione di strumenti) e catene di strumenti multi-step (Zapier citato come partner d’uso).
- Ingegneria del software e manutenzione del codice: generazione di codice, refactoring e attività agentiche su terminale/CLI (riportati miglioramenti su Terminal-Bench). Per codebase ampie, la finestra di contesto lunga aiuta ma va validata con euristiche di compito.
- Aumento della produttività della conoscenza: sintesi di ricerca (miglioramenti su BrowseComp), generazione di slide e design visivo per presentazioni.
Come accedere all’API GPT-5.4
Passaggio 1: Registrati per ottenere la chiave API
Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla CometAPI console. Ottieni la chiave API di accesso dell’interfaccia. Fai clic su “Add Token” nella sezione API token del centro personale, ottieni la chiave del token: sk-xxxxx e invia.

Passaggio 2: Invia richieste all’API GPT-5.4
Seleziona l’endpoint “gpt-5.4” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo di richiesta e il corpo della richiesta sono reperibili nella documentazione API del nostro sito web. Il nostro sito fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua chiave CometAPI effettiva del tuo account. L’URL di base è Chat Completions e Responses.
Inserisci la tua domanda o richiesta nel campo content: è ciò a cui il modello risponderà. Elabora la risposta dell’API per ottenere la risposta generata.
Passaggio 3: Recupera e verifica i risultati
Elabora la risposta dell’API per ottenere la risposta generata. Dopo l’elaborazione, l’API risponde con lo stato dell’attività e i dati di output.




.webp)