ModelosPreçosEmpresarial
500+ APIs de Modelos de IA, Tudo em Uma API. Apenas na CometAPI
API de Modelos
Desenvolvedor
Início RápidoDocumentaçãoPainel de API
Empresa
Sobre nósEmpresarial
Recursos
Modelos de IABlogRegistro de AlteraçõesSuporte
Termos de ServiçoPolítica de Privacidade
© 2026 CometAPI · All rights reserved
Home/Models/OpenAI/GPT-5.4
O

GPT-5.4

Entrada:$2/M
Saída:$12/M
Contexto:1,050,000
Saída Máxima:128,000
GPT-5.4 é o modelo de fronteira para trabalho profissional complexo. Reasoning.effort suporta: none (default), low, medium, high e xhigh.
Novo
Uso comercial
Playground
Visão Geral
Recursos
Preços
API
Versões

Especificações técnicas do GPT-5.4-2026-03-05

ItemGPT-5.4-2026-03-05
Família do modeloGPT-5
ProvedorOpenAI
Data de lançamentoMarch 5, 2026
Janela de contexto1,050,000 tokens
Máximo de tokens de saída128,000
Tipos de entradaTexto, Imagem
Tipos de saídaTexto
ÁudioNão suportado
Controles de raciocínionone, low, medium, high, xhigh
Suporte de ferramentasPesquisa na web, Pesquisa de arquivos, Interpretador de código, Geração de imagens
Corte de conhecimentoAug 31, 2025
Estabilidade do snapshotComportamento do modelo bloqueado

O que é o GPT-5.4?

GPT-5.4 é um lançamento unificador de fronteira que mescla melhorias recentes das linhas de raciocínio e codificação (incluindo o trabalho do GPT-5.3-Codex) em um único modelo voltado ao trabalho profissional com conhecimento. Ele é posicionado como um modelo “Thinking” para raciocínio mais profundo e direcionável e como uma variante “Pro” para clientes que buscam o mais alto desempenho/throughput. Os temas-chave do lançamento são: (1) compreensão de contexto mais longo e em escala de documento, (2) capacidades aprimoradas de ferramentas e “uso de computador” (controle de apps, edição de planilhas/apresentações) e (3) redução de erros factuais e planejamento multi-etapas mais robusto.

Principais recursos do GPT-5.4

  • Capacidade de contexto longo enorme (1M+ tokens experimental): o GPT-5.4 suporta sessões experimentais de 1.05M de tokens (com preços/limites), permitindo raciocínio sobre livros inteiros/bases de código inteiras e síntese multidocumento. Para disponibilidade geral, a janela padrão permanece em ≈272K tokens.
  • Uso de ferramentas multi-etapas aprimorado e “uso de computador” nativo: melhor controle de desktop/navegador para fluxos de trabalho agentivos (teclado/mouse via interface de uso de computador), pesquisa na web que persiste entre rodadas e um novo mecanismo de Tool Search para encontrar conectores/ferramentas de forma eficiente. A OpenAI reporta estado da arte em múltimos benchmarks de uso de computador e agentes web.
  • Geração/edição de planilhas, documentos e apresentações: ajuste específico para fluxos de trabalho de escritório; benchmarks internos mostram grandes ganhos em modelagem de planilhas e qualidade de apresentações. A OpenAI também lançou um complemento do ChatGPT para Excel junto com o lançamento.
  • Controlabilidade e modos de raciocínio: o modo “Thinking” produz um plano/preâmbulo explícito para tarefas longas e suporta direcionamento no meio da resposta (ajuste de instruções durante a geração). Níveis de esforço de raciocínio permitem que os usuários troquem latência por cadeias de raciocínio mais profundas.
  • Compreensão multimodal aprimorada: melhor interpretação de imagens e gráficos de alta resolução (entrada de imagem), usada para entendimento de documentos e apresentações.
  • Postura de segurança: a OpenAI trata o GPT-5.4 como um modelo com alta capacidade cibernética e implementa proteções aprimoradas semelhantes às mitigações do GPT-5.3-Codex.

Desempenho em benchmarks

GPT-5.4GPT-5.3-CodexGPT-5.2
GDPval (vitórias ou empates)83.0%70.9%70.9%
SWE-Bench Pro (Público)57.7%56.8%55.6%
OSWorld-Verified75.0%74.0%*47.3%
Toolathlon54.6%51.9%46.3%
BrowseComp82.7%77.3%65.8%

GPT-5.4 vs. modelos comparáveis

ModeloJanela de contextoPonto forte principal
GPT-5.4-2026-03-051,050,000 tokensRaciocínio de fronteira + fluxos agentivos
GPT-5.3 InstantMenorTarefas do dia a dia mais rápidas
Claude Opus / Sonnet~200k tokensRaciocínio de longa extensão
Gemini 3 Pro~1M tokensRaciocínio multimodal

Diferença principal: o GPT-5.4 foca fortemente em fluxos de produtividade profissionais e capacidades de agente, principalmente quando integrado a ferramentas externas.

Casos representativos de uso em produção

  1. Fluxos de trabalho de documentos e conformidade corporativos: processamento de contratos longos, extração de obrigações e elaboração de comentários em corpora multidocumento (tira proveito das opções de contexto de 272K→1M para síntese em sessão única).
  2. Automação de planilhas e modelagem financeira: geração de fórmulas, construção de modelos multiaba a partir de especificação em linguagem natural, reconciliação de entradas — a OpenAI reporta grandes ganhos em tarefas ao estilo júnior de banco de investimento.
  3. Automação agentiva e “uso de computador”: fluxos de trabalho automatizados de navegador/desktop (instalação, QA, orquestração de ferramentas) e cadeias de ferramentas multi-etapas (integrações com Zapier citadas como parceiras de uso).
  4. Engenharia de software e manutenção de código: geração de código, refatorações e tarefas de agente em terminal/CLI (ganhos reportados no Terminal-Bench). Para bases de código grandes, a janela de contexto longa ajuda, mas deve ser validada conforme heurísticas de tarefa.
  5. Aumento da produtividade de trabalhadores do conhecimento: síntese de pesquisa (melhorias no BrowseComp), geração de slides e design visual para apresentações.

Como acessar a API do GPT-5.4

Etapa 1: Cadastre-se para obter a chave de API

Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu console CometAPI. Obtenha a chave de API de acesso da interface. Clique em “Add Token” no token de API na central pessoal, obtenha a chave do token: sk-xxxxx e envie.

cometapi-key

Etapa 2: Envie solicitações para a API do GPT-5.4

Selecione o endpoint “gpt-5.4” para enviar a solicitação de API e defina o corpo da requisição. O método e o corpo da requisição são obtidos na documentação de API do nosso site. Nosso site também oferece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta. A URL base é Chat Completions e Responses.

Insira sua pergunta ou solicitação no campo content — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.

Etapa 3: Recuperar e verificar os resultados

Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.

FAQ

What is the difference between gpt-5.4 and gpt-5.4-2026-03-05 in the OpenAI API?

gpt-5.4 é um alias dinâmico que pode ser atualizado à medida que o modelo melhora, enquanto gpt-5.4-2026-03-05 é uma versão snapshot que garante comportamento estável e resultados reproduzíveis em produção.

What is the context window size of the GPT-5.4 API model?

GPT-5.4 suporta uma janela de contexto de aproximadamente 1,050,000 tokens, com até 128,000 tokens de saída.

Does GPT-5.4 support tool calling and external integrations?

Sim. GPT-5.4 oferece orquestração de ferramentas por meio da Responses API, incluindo busca na web, busca de arquivos, interpretador de código e ferramentas de geração de imagens.

How does GPT-5.4 compare to GPT-5.3 Instant?

GPT-5.4 foca em raciocínio mais profundo e fluxos de trabalho profissionais, enquanto GPT-5.3 Instant é otimizado para conversas cotidianas mais rápidas e tarefas de menor latência.

Can GPT-5.4 process images through the API?

Sim. GPT-5.4 aceita entradas de imagem, permitindo que o modelo analise capturas de tela, diagramas ou fotos junto com prompts de texto.

When should developers use the GPT-5.4 snapshot model instead of the alias version?

Os desenvolvedores devem usar a versão snapshot quando precisarem de saídas estáveis para sistemas de produção, benchmarking ou conformidade regulatória.

Does GPT-5.4 support configurable reasoning levels?

Sim. A API permite que os desenvolvedores definam níveis de esforço de raciocínio, como low, medium, high ou xhigh, para controlar quanto raciocínio interno o modelo executa.

Recursos para GPT-5.4

Explore os principais recursos do GPT-5.4, projetado para aprimorar o desempenho e a usabilidade. Descubra como essas capacidades podem beneficiar seus projetos e melhorar a experiência do usuário.

Preços para GPT-5.4

Explore preços competitivos para GPT-5.4, projetado para atender diversos orçamentos e necessidades de uso. Nossos planos flexíveis garantem que você pague apenas pelo que usar, facilitando o dimensionamento conforme suas necessidades crescem. Descubra como GPT-5.4 pode aprimorar seus projetos mantendo os custos gerenciáveis.
Preço do Comet (USD / M Tokens)Preço Oficial (USD / M Tokens)Desconto
Entrada:$2/M
Saída:$12/M
Entrada:$2.5/M
Saída:$15/M
-20%

Código de exemplo e API para GPT-5.4

Acesse código de exemplo abrangente e recursos de API para GPT-5.4 para otimizar seu processo de integração. Nossa documentação detalhada fornece orientação passo a passo, ajudando você a aproveitar todo o potencial do GPT-5.4 em seus projetos.
POST
/v1/chat/completions
POST
/v1/responses
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

response = client.responses.create(
    model="gpt-5.4-2026-03-05",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "none"},
)

print(response.output_text)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

response = client.responses.create(
    model="gpt-5.4-2026-03-05",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "none"},
)

print(response.output_text)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const BASE_URL = "https://api.cometapi.com/v1";

const client = new OpenAI({
    apiKey: COMETAPI_KEY,
    baseURL: BASE_URL,
});

async function main() {
    const response = await client.responses.create({
        model: "gpt-5.4-2026-03-05",
        input: "How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
        reasoning: {
            effort: "none",
        },
    });

    console.log(response.output_text);
}

main();

Curl Code Example

curl https://api.cometapi.com/v1/responses \
     --header "Authorization: Bearer $COMETAPI_KEY" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "gpt-5.4-2026-03-05",
    "input": "How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    "reasoning": {
        "effort": "none"
    }
}'

Versões do GPT-5.4

O motivo pelo qual GPT-5.4 possui múltiplas versões instantâneas pode incluir fatores como variações na saída após atualizações que exigem versões antigas para consistência, fornecendo aos desenvolvedores um período de transição para adaptação e migração, e diferentes versões correspondentes a endpoints globais ou regionais para otimizar a experiência do usuário. Para diferenças detalhadas entre versões, consulte a documentação oficial.
ID do modeloDisponibilidadeRequisição
gpt-5.4-2026-03-05✅Respostas e Conclusões de chat
gpt-5.4✅Respostas e Conclusões de chat

Mais modelos

C

Claude Opus 4.7

Entrada:$3/M
Saída:$15/M
O modelo mais inteligente para agentes e programação
A

Claude Sonnet 4.6

Entrada:$2.4/M
Saída:$12/M
Claude Sonnet 4.6 é o nosso modelo Sonnet mais capaz até agora. É uma atualização completa das capacidades do modelo em programação, uso do computador, raciocínio de longo contexto, planejamento de agentes, trabalho de conhecimento e design. Sonnet 4.6 também apresenta uma janela de contexto de 1M tokens em beta.
O

GPT-5.4 nano

Entrada:$0.16/M
Saída:$1/M
O GPT-5.4 nano foi projetado para tarefas em que a velocidade e o custo são os que mais importam, como classificação, extração de dados, ranqueamento e subagentes.
O

GPT-5.4 mini

Entrada:$0.6/M
Saída:$3.6/M
GPT-5.4 mini traz os pontos fortes do GPT-5.4 para um modelo mais rápido e mais eficiente, projetado para cargas de trabalho de alto volume.
X

Grok 4.20

Entrada:$1.6/M
Saída:$4.8/M
A versão 4.20 do Grok introduz uma arquitetura multiagente (múltiplos agentes especializados coordenados em tempo real), modos de contexto expandidos e melhorias focadas em seguimento de instruções, redução de alucinações e saídas estruturadas/assistidas por ferramentas.
Q

Qwen3.6-Plus

Entrada:$0.32/M
Saída:$1.92/M
Qwen 3.6-Plus já está disponível, com capacidades aprimoradas para desenvolvimento de código e maior eficiência em reconhecimento e inferência multimodais, tornando a experiência Vibe Coding ainda melhor.

Blogs relacionados

Chamadas de função na API da OpenAI: o que isso realmente faz e como usar corretamente
Apr 20, 2026
open-ai
tech

Chamadas de função na API da OpenAI: o que isso realmente faz e como usar corretamente

Domine o OpenAI Function Calling: vá além da engenharia de prompts para a orquestração estruturada. Aprenda a aplicação estrita de esquemas, as melhores práticas de segurança e fluxos de trabalho orientados a agentes. Padronize a chamada de ferramentas entre GPT, Claude e Gemini com a CometAPI.
Como usar a API do Claude Opus 4.7
Apr 18, 2026
claude-opus-4-7

Como usar a API do Claude Opus 4.7

Claude Opus 4.7 (ID do modelo: `claude-opus-4-7`) é o modelo de disponibilidade geral mais capaz da Anthropic, lançado em 16 de abril de 2026. Ele oferece melhorias de mudança de patamar em programação orientada a agentes, visão multimodal de alta resolução (até 3.75MP), raciocínio adaptativo e fluxos de trabalho de longa duração, mantendo $5/$25 por milhão de tokens de entrada/saída. Use-o via CometAPI para preços 20-40% mais baixos, uma chave unificada e troca instantânea de modelos—sem dependência de fornecedor.
O que é o Claude Opus 4.7? Ele está disponível na CometAPI.
Apr 16, 2026
claude-opus-4-7

O que é o Claude Opus 4.7? Ele está disponível na CometAPI.

Claude Opus 4.7, lançado pela Anthropic em 16 de abril de 2026, é o mais recente modelo principal de raciocínio híbrido da família Claude 4. Ele oferece uma melhoria de 13% em um benchmark de codificação com 93 tarefas em relação ao Opus 4.6, suporta uma janela de contexto de 1M tokens, visão de maior resolução (até 2,576 pixels) e raciocínio adaptativo para fluxos de trabalho agentivos complexos. Ele se destaca em programação pronta para produção, tarefas de longa duração e trabalho profissional baseado em conhecimento, mantendo o mesmo preço do seu antecessor ($5/$25 por milhão de tokens, oficialmente). Para desenvolvedores que buscam custos menores e acesso unificado via API a 500+ modelos, CometAPI oferece Claude Opus 4.7 por apenas $4 de entrada / $20 de saída por milhão de tokens—uma economia de 20%—além de uma chave de API gratuita e 1M de tokens gratuitos para novos usuários.
Como usar o ChatGPT no iPhone em 2026: guia completo
Apr 14, 2026
chat-gpt

Como usar o ChatGPT no iPhone em 2026: guia completo

Para usar o ChatGPT no iPhone, baixe o app oficial gratuito na App Store, faça login (ou use como convidado) e comece a conversar. Para uma integração mais profunda, ative-o nas configurações de Apple Intelligence & Siri para ter acesso ao Siri e às Writing Tools. Atualize para o iOS 26.4+ para suporte de voz no CarPlay. Usuários avançados podem acessar a versão web no Safari ou criar soluções personalizadas via CometAPI’s SDK.
DeepSeek v4 já está disponível na web: como acessar e testá-lo
Apr 9, 2026
deepseek-v4

DeepSeek v4 já está disponível na web: como acessar e testá-lo

O teste em tons de cinza do DeepSeek V4 vazou e está sendo implementado ativamente, de forma limitada, na plataforma web oficial. Usuários selecionados agora veem uma interface redesenhada com **Fast Mode** (padrão, uso diário em alta velocidade), **Expert Mode** (raciocínio profundo e resolução de problemas complexos) e **Vision Mode** (processamento multimodal de imagens e vídeos). Isso marca a atualização mais significativa desde o DeepSeek-V3.2, com rumores de janelas de contexto de 1 milhão de tokens, bases de conhecimento atualizadas, capacidades multimodais nativas e uma nova arquitetura subjacente otimizada para velocidade, lógica e eficiência.