What is the difference between gpt-5.4 and gpt-5.4-2026-03-05 in the OpenAI API?

gpt-5.4 é um alias dinâmico que pode ser atualizado à medida que o modelo melhora, enquanto gpt-5.4-2026-03-05 é uma versão snapshot que garante comportamento estável e resultados reproduzíveis em produção.

What is the context window size of the GPT-5.4 API model?

GPT-5.4 suporta uma janela de contexto de aproximadamente 1,050,000 tokens, com até 128,000 tokens de saída.

Does GPT-5.4 support tool calling and external integrations?

Sim. GPT-5.4 oferece orquestração de ferramentas por meio da Responses API, incluindo busca na web, busca de arquivos, interpretador de código e ferramentas de geração de imagens.

How does GPT-5.4 compare to GPT-5.3 Instant?

GPT-5.4 foca em raciocínio mais profundo e fluxos de trabalho profissionais, enquanto GPT-5.3 Instant é otimizado para conversas cotidianas mais rápidas e tarefas de menor latência.

Can GPT-5.4 process images through the API?

Sim. GPT-5.4 aceita entradas de imagem, permitindo que o modelo analise capturas de tela, diagramas ou fotos junto com prompts de texto.

When should developers use the GPT-5.4 snapshot model instead of the alias version?

Os desenvolvedores devem usar a versão snapshot quando precisarem de saídas estáveis para sistemas de produção, benchmarking ou conformidade regulatória.

Does GPT-5.4 support configurable reasoning levels?

Sim. A API permite que os desenvolvedores definam níveis de esforço de raciocínio, como low, medium, high ou xhigh, para controlar quanto raciocínio interno o modelo executa.

API GPT-5.4 Acessível | text-to-text

Especificações técnicas do GPT-5.4-2026-03-05

Item	GPT-5.4-2026-03-05
Família do modelo	GPT-5
Provedor	OpenAI
Data de lançamento	March 5, 2026
Janela de contexto	1,050,000 tokens
Máximo de tokens de saída	128,000
Tipos de entrada	Texto, Imagem
Tipos de saída	Texto
Áudio	Não suportado
Controles de raciocínio	none, low, medium, high, xhigh
Suporte de ferramentas	Pesquisa na web, Pesquisa de arquivos, Interpretador de código, Geração de imagens
Corte de conhecimento	Aug 31, 2025
Estabilidade do snapshot	Comportamento do modelo bloqueado

O que é o GPT-5.4?

GPT-5.4 é um lançamento unificador de fronteira que mescla melhorias recentes das linhas de raciocínio e codificação (incluindo o trabalho do GPT-5.3-Codex) em um único modelo voltado ao trabalho profissional com conhecimento. Ele é posicionado como um modelo “Thinking” para raciocínio mais profundo e direcionável e como uma variante “Pro” para clientes que buscam o mais alto desempenho/throughput. Os temas-chave do lançamento são: (1) compreensão de contexto mais longo e em escala de documento, (2) capacidades aprimoradas de ferramentas e “uso de computador” (controle de apps, edição de planilhas/apresentações) e (3) redução de erros factuais e planejamento multi-etapas mais robusto.

Principais recursos do GPT-5.4

Capacidade de contexto longo enorme (1M+ tokens experimental): o GPT-5.4 suporta sessões experimentais de 1.05M de tokens (com preços/limites), permitindo raciocínio sobre livros inteiros/bases de código inteiras e síntese multidocumento. Para disponibilidade geral, a janela padrão permanece em ≈272K tokens.
Uso de ferramentas multi-etapas aprimorado e “uso de computador” nativo: melhor controle de desktop/navegador para fluxos de trabalho agentivos (teclado/mouse via interface de uso de computador), pesquisa na web que persiste entre rodadas e um novo mecanismo de Tool Search para encontrar conectores/ferramentas de forma eficiente. A OpenAI reporta estado da arte em múltimos benchmarks de uso de computador e agentes web.
Geração/edição de planilhas, documentos e apresentações: ajuste específico para fluxos de trabalho de escritório; benchmarks internos mostram grandes ganhos em modelagem de planilhas e qualidade de apresentações. A OpenAI também lançou um complemento do ChatGPT para Excel junto com o lançamento.
Controlabilidade e modos de raciocínio: o modo “Thinking” produz um plano/preâmbulo explícito para tarefas longas e suporta direcionamento no meio da resposta (ajuste de instruções durante a geração). Níveis de esforço de raciocínio permitem que os usuários troquem latência por cadeias de raciocínio mais profundas.
Compreensão multimodal aprimorada: melhor interpretação de imagens e gráficos de alta resolução (entrada de imagem), usada para entendimento de documentos e apresentações.
Postura de segurança: a OpenAI trata o GPT-5.4 como um modelo com alta capacidade cibernética e implementa proteções aprimoradas semelhantes às mitigações do GPT-5.3-Codex.

Desempenho em benchmarks

	GPT-5.4	GPT-5.3-Codex	GPT-5.2
GDPval (vitórias ou empates)	83.0%	70.9%	70.9%
SWE-Bench Pro (Público)	57.7%	56.8%	55.6%
OSWorld-Verified	75.0%	74.0%*	47.3%
Toolathlon	54.6%	51.9%	46.3%
BrowseComp	82.7%	77.3%	65.8%

GPT-5.4 vs. modelos comparáveis

Modelo	Janela de contexto	Ponto forte principal
GPT-5.4-2026-03-05	1,050,000 tokens	Raciocínio de fronteira + fluxos agentivos
GPT-5.3 Instant	Menor	Tarefas do dia a dia mais rápidas
Claude Opus / Sonnet	~200k tokens	Raciocínio de longa extensão
Gemini 3 Pro	~1M tokens	Raciocínio multimodal

Diferença principal: o GPT-5.4 foca fortemente em fluxos de produtividade profissionais e capacidades de agente, principalmente quando integrado a ferramentas externas.

Casos representativos de uso em produção

Fluxos de trabalho de documentos e conformidade corporativos: processamento de contratos longos, extração de obrigações e elaboração de comentários em corpora multidocumento (tira proveito das opções de contexto de 272K→1M para síntese em sessão única).
Automação de planilhas e modelagem financeira: geração de fórmulas, construção de modelos multiaba a partir de especificação em linguagem natural, reconciliação de entradas — a OpenAI reporta grandes ganhos em tarefas ao estilo júnior de banco de investimento.
Automação agentiva e “uso de computador”: fluxos de trabalho automatizados de navegador/desktop (instalação, QA, orquestração de ferramentas) e cadeias de ferramentas multi-etapas (integrações com Zapier citadas como parceiras de uso).
Engenharia de software e manutenção de código: geração de código, refatorações e tarefas de agente em terminal/CLI (ganhos reportados no Terminal-Bench). Para bases de código grandes, a janela de contexto longa ajuda, mas deve ser validada conforme heurísticas de tarefa.
Aumento da produtividade de trabalhadores do conhecimento: síntese de pesquisa (melhorias no BrowseComp), geração de slides e design visual para apresentações.

Como acessar a API do GPT-5.4

Etapa 1: Cadastre-se para obter a chave de API

Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu console CometAPI. Obtenha a chave de API de acesso da interface. Clique em “Add Token” no token de API na central pessoal, obtenha a chave do token: sk-xxxxx e envie.

cometapi-key

Etapa 2: Envie solicitações para a API do GPT-5.4

Selecione o endpoint “gpt-5.4” para enviar a solicitação de API e defina o corpo da requisição. O método e o corpo da requisição são obtidos na documentação de API do nosso site. Nosso site também oferece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta. A URL base é Chat Completions e Responses.

Insira sua pergunta ou solicitação no campo content — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.

Etapa 3: Recuperar e verificar os resultados

Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.

Preço do Comet (USD / M Tokens)	Preço Oficial (USD / M Tokens)	Desconto
Entrada:0.00/M Saída:0.00/M	Entrada:0.00/M Saída:0.00/M	-

ID do modelo	Disponibilidade	Requisição
gpt-5.4-2026-03-05	✅	Respostas e Conclusões de chat
gpt-5.4	✅	Respostas e Conclusões de chat

Especificações técnicas do GPT-5.4-2026-03-05

Item	GPT-5.4-2026-03-05
Família do modelo	GPT-5
Provedor	OpenAI
Data de lançamento	March 5, 2026
Janela de contexto	1,050,000 tokens
Máximo de tokens de saída	128,000
Tipos de entrada	Texto, Imagem
Tipos de saída	Texto
Áudio	Não suportado
Controles de raciocínio	none, low, medium, high, xhigh
Suporte de ferramentas	Pesquisa na web, Pesquisa de arquivos, Interpretador de código, Geração de imagens
Corte de conhecimento	Aug 31, 2025
Estabilidade do snapshot	Comportamento do modelo bloqueado

O que é o GPT-5.4?

Principais recursos do GPT-5.4

Capacidade de contexto longo enorme (1M+ tokens experimental): o GPT-5.4 suporta sessões experimentais de 1.05M de tokens (com preços/limites), permitindo raciocínio sobre livros inteiros/bases de código inteiras e síntese multidocumento. Para disponibilidade geral, a janela padrão permanece em ≈272K tokens.
Uso de ferramentas multi-etapas aprimorado e “uso de computador” nativo: melhor controle de desktop/navegador para fluxos de trabalho agentivos (teclado/mouse via interface de uso de computador), pesquisa na web que persiste entre rodadas e um novo mecanismo de Tool Search para encontrar conectores/ferramentas de forma eficiente. A OpenAI reporta estado da arte em múltimos benchmarks de uso de computador e agentes web.
Geração/edição de planilhas, documentos e apresentações: ajuste específico para fluxos de trabalho de escritório; benchmarks internos mostram grandes ganhos em modelagem de planilhas e qualidade de apresentações. A OpenAI também lançou um complemento do ChatGPT para Excel junto com o lançamento.
Controlabilidade e modos de raciocínio: o modo “Thinking” produz um plano/preâmbulo explícito para tarefas longas e suporta direcionamento no meio da resposta (ajuste de instruções durante a geração). Níveis de esforço de raciocínio permitem que os usuários troquem latência por cadeias de raciocínio mais profundas.
Compreensão multimodal aprimorada: melhor interpretação de imagens e gráficos de alta resolução (entrada de imagem), usada para entendimento de documentos e apresentações.
Postura de segurança: a OpenAI trata o GPT-5.4 como um modelo com alta capacidade cibernética e implementa proteções aprimoradas semelhantes às mitigações do GPT-5.3-Codex.

Desempenho em benchmarks

	GPT-5.4	GPT-5.3-Codex	GPT-5.2
GDPval (vitórias ou empates)	83.0%	70.9%	70.9%
SWE-Bench Pro (Público)	57.7%	56.8%	55.6%
OSWorld-Verified	75.0%	74.0%*	47.3%
Toolathlon	54.6%	51.9%	46.3%
BrowseComp	82.7%	77.3%	65.8%

GPT-5.4 vs. modelos comparáveis

Modelo	Janela de contexto	Ponto forte principal
GPT-5.4-2026-03-05	1,050,000 tokens	Raciocínio de fronteira + fluxos agentivos
GPT-5.3 Instant	Menor	Tarefas do dia a dia mais rápidas
Claude Opus / Sonnet	~200k tokens	Raciocínio de longa extensão
Gemini 3 Pro	~1M tokens	Raciocínio multimodal

Diferença principal: o GPT-5.4 foca fortemente em fluxos de produtividade profissionais e capacidades de agente, principalmente quando integrado a ferramentas externas.

Casos representativos de uso em produção

Fluxos de trabalho de documentos e conformidade corporativos: processamento de contratos longos, extração de obrigações e elaboração de comentários em corpora multidocumento (tira proveito das opções de contexto de 272K→1M para síntese em sessão única).
Automação de planilhas e modelagem financeira: geração de fórmulas, construção de modelos multiaba a partir de especificação em linguagem natural, reconciliação de entradas — a OpenAI reporta grandes ganhos em tarefas ao estilo júnior de banco de investimento.
Automação agentiva e “uso de computador”: fluxos de trabalho automatizados de navegador/desktop (instalação, QA, orquestração de ferramentas) e cadeias de ferramentas multi-etapas (integrações com Zapier citadas como parceiras de uso).
Engenharia de software e manutenção de código: geração de código, refatorações e tarefas de agente em terminal/CLI (ganhos reportados no Terminal-Bench). Para bases de código grandes, a janela de contexto longa ajuda, mas deve ser validada conforme heurísticas de tarefa.
Aumento da produtividade de trabalhadores do conhecimento: síntese de pesquisa (melhorias no BrowseComp), geração de slides e design visual para apresentações.

Como acessar a API do GPT-5.4

Etapa 1: Cadastre-se para obter a chave de API

cometapi-key

Etapa 2: Envie solicitações para a API do GPT-5.4

Insira sua pergunta ou solicitação no campo content — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.

Etapa 3: Recuperar e verificar os resultados

Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.

GPT-5.4

Playground para GPT-5.4

Especificações técnicas do GPT-5.4-2026-03-05

O que é o GPT-5.4?

Principais recursos do GPT-5.4

Desempenho em benchmarks

GPT-5.4 vs. modelos comparáveis

Casos representativos de uso em produção

Como acessar a API do GPT-5.4

Etapa 1: Cadastre-se para obter a chave de API

Etapa 2: Envie solicitações para a API do GPT-5.4

Etapa 3: Recuperar e verificar os resultados

FAQ

Preços para GPT-5.4

Código de exemplo e API para GPT-5.4

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime

Versões do GPT-5.4

GPT-5.4

Playground para GPT-5.4

Especificações técnicas do GPT-5.4-2026-03-05

O que é o GPT-5.4?

Principais recursos do GPT-5.4

Desempenho em benchmarks

GPT-5.4 vs. modelos comparáveis

Casos representativos de uso em produção

Como acessar a API do GPT-5.4

Etapa 1: Cadastre-se para obter a chave de API

Etapa 2: Envie solicitações para a API do GPT-5.4

Etapa 3: Recuperar e verificar os resultados

FAQ

Preços para GPT-5.4

Código de exemplo e API para GPT-5.4

Python Code Example

JavaScript Code Example

Curl Code Example

Uptime

Versões do GPT-5.4