Especificações técnicas do GPT-5.4-2026-03-05
| Item | GPT-5.4-2026-03-05 |
|---|---|
| Família do modelo | GPT-5 |
| Provedor | OpenAI |
| Data de lançamento | March 5, 2026 |
| Janela de contexto | 1,050,000 tokens |
| Máximo de tokens de saída | 128,000 |
| Tipos de entrada | Texto, Imagem |
| Tipos de saída | Texto |
| Áudio | Não suportado |
| Controles de raciocínio | none, low, medium, high, xhigh |
| Suporte de ferramentas | Pesquisa na web, Pesquisa de arquivos, Interpretador de código, Geração de imagens |
| Corte de conhecimento | Aug 31, 2025 |
| Estabilidade do snapshot | Comportamento do modelo bloqueado |
O que é o GPT-5.4?
GPT-5.4 é um lançamento unificador de fronteira que mescla melhorias recentes das linhas de raciocínio e codificação (incluindo o trabalho do GPT-5.3-Codex) em um único modelo voltado ao trabalho profissional com conhecimento. Ele é posicionado como um modelo “Thinking” para raciocínio mais profundo e direcionável e como uma variante “Pro” para clientes que buscam o mais alto desempenho/throughput. Os temas-chave do lançamento são: (1) compreensão de contexto mais longo e em escala de documento, (2) capacidades aprimoradas de ferramentas e “uso de computador” (controle de apps, edição de planilhas/apresentações) e (3) redução de erros factuais e planejamento multi-etapas mais robusto.
Principais recursos do GPT-5.4
- Capacidade de contexto longo enorme (1M+ tokens experimental): o GPT-5.4 suporta sessões experimentais de 1.05M de tokens (com preços/limites), permitindo raciocínio sobre livros inteiros/bases de código inteiras e síntese multidocumento. Para disponibilidade geral, a janela padrão permanece em ≈272K tokens.
- Uso de ferramentas multi-etapas aprimorado e “uso de computador” nativo: melhor controle de desktop/navegador para fluxos de trabalho agentivos (teclado/mouse via interface de uso de computador), pesquisa na web que persiste entre rodadas e um novo mecanismo de Tool Search para encontrar conectores/ferramentas de forma eficiente. A OpenAI reporta estado da arte em múltimos benchmarks de uso de computador e agentes web.
- Geração/edição de planilhas, documentos e apresentações: ajuste específico para fluxos de trabalho de escritório; benchmarks internos mostram grandes ganhos em modelagem de planilhas e qualidade de apresentações. A OpenAI também lançou um complemento do ChatGPT para Excel junto com o lançamento.
- Controlabilidade e modos de raciocínio: o modo “Thinking” produz um plano/preâmbulo explícito para tarefas longas e suporta direcionamento no meio da resposta (ajuste de instruções durante a geração). Níveis de esforço de raciocínio permitem que os usuários troquem latência por cadeias de raciocínio mais profundas.
- Compreensão multimodal aprimorada: melhor interpretação de imagens e gráficos de alta resolução (entrada de imagem), usada para entendimento de documentos e apresentações.
- Postura de segurança: a OpenAI trata o GPT-5.4 como um modelo com alta capacidade cibernética e implementa proteções aprimoradas semelhantes às mitigações do GPT-5.3-Codex.
Desempenho em benchmarks
| GPT-5.4 | GPT-5.3-Codex | GPT-5.2 | |
|---|---|---|---|
| GDPval (vitórias ou empates) | 83.0% | 70.9% | 70.9% |
| SWE-Bench Pro (Público) | 57.7% | 56.8% | 55.6% |
| OSWorld-Verified | 75.0% | 74.0%* | 47.3% |
| Toolathlon | 54.6% | 51.9% | 46.3% |
| BrowseComp | 82.7% | 77.3% | 65.8% |
GPT-5.4 vs. modelos comparáveis
| Modelo | Janela de contexto | Ponto forte principal |
|---|---|---|
| GPT-5.4-2026-03-05 | 1,050,000 tokens | Raciocínio de fronteira + fluxos agentivos |
| GPT-5.3 Instant | Menor | Tarefas do dia a dia mais rápidas |
| Claude Opus / Sonnet | ~200k tokens | Raciocínio de longa extensão |
| Gemini 3 Pro | ~1M tokens | Raciocínio multimodal |
Diferença principal: o GPT-5.4 foca fortemente em fluxos de produtividade profissionais e capacidades de agente, principalmente quando integrado a ferramentas externas.
Casos representativos de uso em produção
- Fluxos de trabalho de documentos e conformidade corporativos: processamento de contratos longos, extração de obrigações e elaboração de comentários em corpora multidocumento (tira proveito das opções de contexto de 272K→1M para síntese em sessão única).
- Automação de planilhas e modelagem financeira: geração de fórmulas, construção de modelos multiaba a partir de especificação em linguagem natural, reconciliação de entradas — a OpenAI reporta grandes ganhos em tarefas ao estilo júnior de banco de investimento.
- Automação agentiva e “uso de computador”: fluxos de trabalho automatizados de navegador/desktop (instalação, QA, orquestração de ferramentas) e cadeias de ferramentas multi-etapas (integrações com Zapier citadas como parceiras de uso).
- Engenharia de software e manutenção de código: geração de código, refatorações e tarefas de agente em terminal/CLI (ganhos reportados no Terminal-Bench). Para bases de código grandes, a janela de contexto longa ajuda, mas deve ser validada conforme heurísticas de tarefa.
- Aumento da produtividade de trabalhadores do conhecimento: síntese de pesquisa (melhorias no BrowseComp), geração de slides e design visual para apresentações.
Como acessar a API do GPT-5.4
Etapa 1: Cadastre-se para obter a chave de API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu console CometAPI. Obtenha a chave de API de acesso da interface. Clique em “Add Token” no token de API na central pessoal, obtenha a chave do token: sk-xxxxx e envie.

Etapa 2: Envie solicitações para a API do GPT-5.4
Selecione o endpoint “gpt-5.4” para enviar a solicitação de API e defina o corpo da requisição. O método e o corpo da requisição são obtidos na documentação de API do nosso site. Nosso site também oferece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta. A URL base é Chat Completions e Responses.
Insira sua pergunta ou solicitação no campo content — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.
Etapa 3: Recuperar e verificar os resultados
Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.




.webp)