ModelosPreçosEmpresarial
500+ APIs de Modelos de IA, Tudo em Uma API. Apenas na CometAPI
API de Modelos
Desenvolvedor
Início RápidoDocumentaçãoPainel de API
Empresa
Sobre nósEmpresarial
Recursos
Modelos de IABlogRegistro de AlteraçõesSuporte
Termos de ServiçoPolítica de Privacidade
© 2026 CometAPI · All rights reserved
Home/Models/OpenAI/GPT-5.4 mini
O

GPT-5.4 mini

Entrada:$0.6/M
Saída:$3.6/M
Contexto:400,000
Saída Máxima:128,000
GPT-5.4 mini traz os pontos fortes do GPT-5.4 para um modelo mais rápido e mais eficiente, projetado para cargas de trabalho de alto volume.
Novo
Uso comercial
Playground
Visão Geral
Recursos
Preços
API
Versões

Especificações Técnicas do GPT-5.4 Mini

ItemGPT-5.4 Mini (estimado a partir de fontes oficiais + validação cruzada)
Model familySérie GPT-5.4 (variante “mini” custo-eficiente)
ProviderOpenAI
Input typesText, Image
Output typesText
Context window400,000 tokens
Max output tokens128,000 tokens
Knowledge cutoff~31 de maio de 2024 (herda a linhagem mini)
Reasoning supportSim (versão leve vs GPT-5.4 completo)
Tool supportFunction calling, web search, file search, agents (inferido da família GPT-5)
PositioningModelo próximo ao estado da arte, de alta velocidade e custo-eficiente

O que é o GPT-5.4 Mini?

O GPT-5.4 Mini é uma variante de alto desempenho e custo-eficiente do GPT-5.4, projetada para cargas de trabalho sensíveis à latência e de alto volume. Ele traz uma parte significativa das capacidades de raciocínio, programação e multimodais do GPT-5.4 para um modelo menor e mais rápido, otimizado para sistemas em escala de produção.

Em comparação com modelos “mini” anteriores, o GPT-5.4 Mini é posicionado como um modelo pequeno próximo ao estado da arte, o que significa que se aproxima do desempenho de um modelo de topo enquanto reduz drasticamente o custo e o tempo de resposta.

Principais recursos do GPT-5.4 Mini

  • Inferência de alta velocidade: Otimizado para aplicações de baixa latência, como chatbots, copilotos e sistemas em tempo real
  • Janela de contexto grande (400K): Suporta documentos longos, fluxos de trabalho multi-etapas e memória de agentes
  • Suporte robusto a programação e agentes: Projetado para uso de ferramentas, raciocínio multi-etapas e tarefas delegadas a subagentes
  • Entrada multimodal: Aceita entradas de texto e imagem para fluxos de trabalho mais ricos
  • Escalonamento custo-eficiente: Significativamente mais barato que o GPT-5.4, mantendo forte capacidade de raciocínio
  • Otimização de pipeline de agentes: Ideal para arquiteturas multi-modelo em que grandes modelos planejam e modelos mini executam

Desempenho em benchmarks do GPT-5.4 Mini

  • Aproxima-se do desempenho do GPT-5.4 em tarefas de programação no estilo SWE-Bench (~94–95% do desempenho do modelo de topo) (estimativa com validação cruzada a partir de discussões de lançamento)
  • Melhorias significativas em relação ao GPT-5 Mini em:
    • precisão do raciocínio
    • confiabilidade no uso de ferramentas
    • compreensão multimodal
  • Projetado para superar gerações “mini” anteriores em fluxos de trabalho com agentes e benchmarks de programação
  • medições de velocidade: os primeiros testadores da API relatam ~180–190 tokens/sec no GPT-5.4 Mini (vs ~55–120 t/s para variantes antigas do GPT-5 mini, dependendo dos modos de prioridade).

👉 Ponto principal: o GPT-5.4 Mini oferece desempenho próximo ao estado da arte com uma fração do custo e da latência, tornando-o ideal para sistemas escaláveis.

GPT-5.4 mini

Casos de uso representativos

  1. Assistentes e editores de programação (plugins de IDE, Copilot): análise rápida de contexto, exploração de bases de código e conclusões ágeis tornam o GPT-5.4 Mini ideal para sugestões no editor, onde o tempo até o primeiro token é crucial. GitHub Copilot é uma integração inicial.
  2. Subagentes / trabalhadores delegados: quando um agente mestre delega tarefas curtas e rápidas (formatação, pequenos passos de raciocínio, buscas estilo grep) a um trabalhador barato e veloz. A OpenAI posiciona mini/nano para esses papéis.
  3. Automação de API em alto volume: geração de código em lote, triagem automatizada de tickets, sumarização de logs em escala, onde custo por chamada e latência são as principais restrições. Números de taxa de transferência da comunidade indicam vantagens operacionais materiais para o mini.
  4. Empacotamento de ferramentas e cadeias de ferramentas (toolchains): chamadas de ferramentas rápidas em que o modelo orquestra chamadas para ferramentas externas (search, grep, run tests) e retorna saídas compactas e acionáveis. A família GPT-5.4 inclui recursos aprimorados de “computer use”.

Como acessar a API do GPT-5.4 Mini

Etapa 1: Cadastre-se para obter uma chave de API

Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu console CometAPI. Obtenha a chave de API de credenciais de acesso da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.

cometapi-key

Etapa 2: Envie solicitações para a API do GPT-5.4 Mini

Selecione o endpoint “gpt-5.4-mini” para enviar a solicitação à API e defina o corpo da solicitação. O método e o corpo da solicitação podem ser obtidos na documentação de API do nosso site. Nosso site também fornece teste via Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI da sua conta. A URL base é Chat Completions e Responses.

Insira sua pergunta ou solicitação no campo content — é isso que o modelo irá responder. Procese a resposta da API para obter a resposta gerada.

Etapa 3: Recuperar e verificar os resultados

Procese a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.

FAQ

Can GPT-5.4 Mini API handle long documents or large context inputs?

Sim, o GPT-5.4 Mini suporta uma janela de contexto de 400.000 tokens com até 128.000 tokens de saída, tornando-o adequado para documentos longos e fluxos de trabalho em várias etapas.

How does GPT-5.4 Mini compare to GPT-5.4 for reasoning tasks?

O GPT-5.4 Mini oferece desempenho de raciocínio próximo ao estado da arte, mas é ligeiramente menos capaz que o GPT-5.4 em tarefas complexas de várias etapas ou de nível de pesquisa.

Is GPT-5.4 Mini API suitable for real-time or low-latency applications?

Sim, o GPT-5.4 Mini é otimizado para velocidade e baixa latência, tornando-o ideal para chatbots, copilotos e sistemas de IA em tempo real.

Does GPT-5.4 Mini support tool use and agent workflows?

Sim, ele oferece suporte a chamada de funções, pesquisa na web e fluxos de trabalho no estilo de agentes, tornando-o eficaz em sistemas de automação em várias etapas.

When should I use GPT-5.4 Mini instead of GPT-5 Mini?

Use o GPT-5.4 Mini quando precisar de desempenho significativamente melhor em raciocínio, programação e multimodalidade, mantendo ainda baixo custo e alta velocidade.

Can GPT-5.4 Mini process images as input?

Sim, o GPT-5.4 Mini oferece suporte a entrada de imagens junto com texto, possibilitando casos de uso multimodais, como análise visual e compreensão de interfaces.

What are the main limitations of GPT-5.4 Mini API?

Suas principais limitações são o desempenho reduzido em comparação com o GPT-5.4 em tarefas de raciocínio muito complexas e a possível degradação em cenários de raciocínio com contexto extremamente longo.

Recursos para GPT-5.4 mini

Explore os principais recursos do GPT-5.4 mini, projetado para aprimorar o desempenho e a usabilidade. Descubra como essas capacidades podem beneficiar seus projetos e melhorar a experiência do usuário.

Preços para GPT-5.4 mini

Explore preços competitivos para GPT-5.4 mini, projetado para atender diversos orçamentos e necessidades de uso. Nossos planos flexíveis garantem que você pague apenas pelo que usar, facilitando o dimensionamento conforme suas necessidades crescem. Descubra como GPT-5.4 mini pode aprimorar seus projetos mantendo os custos gerenciáveis.
Preço do Comet (USD / M Tokens)Preço Oficial (USD / M Tokens)Desconto
Entrada:$0.6/M
Saída:$3.6/M
Entrada:$0.75/M
Saída:$4.5/M
-20%

Código de exemplo e API para GPT-5.4 mini

Acesse código de exemplo abrangente e recursos de API para GPT-5.4 mini para otimizar seu processo de integração. Nossa documentação detalhada fornece orientação passo a passo, ajudando você a aproveitar todo o potencial do GPT-5.4 mini em seus projetos.
POST
/v1/chat/completions
POST
/v1/responses
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

response = client.responses.create(
    model="gpt-5.4-mini",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "none"},
)

print(response.output_text)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

response = client.responses.create(
    model="gpt-5.4-mini",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "none"},
)

print(response.output_text)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const BASE_URL = "https://api.cometapi.com/v1";

const client = new OpenAI({
  apiKey: COMETAPI_KEY,
  baseURL: BASE_URL,
});

const response = await client.responses.create({
  model: "gpt-5.4-mini",
  input: "How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
  reasoning: {
    effort: "none",
  },
});

console.log(response.output_text);

Curl Code Example

#!/usr/bin/env bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

response=$(curl --silent --location --request POST "https://api.cometapi.com/v1/responses" \
  --header "Authorization: Bearer $COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --header "Accept: application/json" \
  --data-raw '{
    "model": "gpt-5.4-mini",
    "input": "How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    "reasoning": {
      "effort": "none"
    }
  }')

if command -v jq >/dev/null 2>&1; then
  printf '%s\n' "$response" | jq -r '(
    [
      .output[]?
      | select(.type == "message")
      | .content[]?
      | select(.type == "output_text")
      | .text
    ][0]
  ) // .output_text // .'
else
  printf '%s\n' "$response"
fi

Versões do GPT-5.4 mini

O motivo pelo qual GPT-5.4 mini possui múltiplas versões instantâneas pode incluir fatores como variações na saída após atualizações que exigem versões antigas para consistência, fornecendo aos desenvolvedores um período de transição para adaptação e migração, e diferentes versões correspondentes a endpoints globais ou regionais para otimizar a experiência do usuário. Para diferenças detalhadas entre versões, consulte a documentação oficial.
version
gpt-5.4-mini
gpt-5.4-mini-2026-03-17

Mais modelos

C

Claude Opus 4.7

Entrada:$3/M
Saída:$15/M
O modelo mais inteligente para agentes e programação
A

Claude Sonnet 4.6

Entrada:$2.4/M
Saída:$12/M
Claude Sonnet 4.6 é o nosso modelo Sonnet mais capaz até agora. É uma atualização completa das capacidades do modelo em programação, uso do computador, raciocínio de longo contexto, planejamento de agentes, trabalho de conhecimento e design. Sonnet 4.6 também apresenta uma janela de contexto de 1M tokens em beta.
O

GPT 5.5 Pro

Entrada:$24/M
Saída:$144/M
Um modelo avançado projetado para lógica extremamente complexa e exigências profissionais, representando o mais alto padrão de raciocínio profundo e capacidades analíticas precisas.
O

GPT 5.5

Entrada:$4/M
Saída:$24/M
Um modelo multimodal carro-chefe de próxima geração que equilibra desempenho excepcional com respostas eficientes, dedicado a fornecer serviços de IA de uso geral abrangentes e estáveis.
O

GPT Image 2 ALL

Por Solicitação:$0.04
GPT Image 2 é o modelo de geração de imagens de última geração da OpenAI para gerar e editar imagens com rapidez e alta qualidade. Ele suporta tamanhos de imagem flexíveis e entradas de imagem de alta fidelidade.
O

GPT 5.5 ALL

Entrada:$4/M
Saída:$24/M
O GPT-5.5 se destaca na escrita de código, na pesquisa online, na análise de dados e nas operações entre ferramentas. O modelo não apenas aumenta sua autonomia ao lidar com tarefas complexas de múltiplas etapas, mas também melhora significativamente as capacidades de raciocínio e a eficiência de execução, mantendo a mesma latência que seu predecessor, marcando um passo importante rumo à automação de escritório automatizada em IA.

Blogs relacionados

O ChatGPT pode gerar música em 2026? O guia definitivo
Apr 2, 2026

O ChatGPT pode gerar música em 2026? O guia definitivo

Em 2026, o ChatGPT não consegue gerar diretamente arquivos de áudio, vocais ou faixas de música reproduzíveis. O ChatGPT se destaca como um colaborador criativo para letras, estrutura de canções, progressões de acordes e prompts otimizados. No entanto, ao combinar ChatGPT + Suno v5.5 + CometAPI, qualquer pessoa pode criar músicas profissionais completas com vocais realistas em poucos minutos.
GPT 5.4 Mini e Nano estão disponíveis na CometAPI: o que eles trazem?
Mar 18, 2026

GPT 5.4 Mini e Nano estão disponíveis na CometAPI: o que eles trazem?

GPT-5.4 Mini e GPT-5.4 Nano são as novas variantes compactas da família GPT-5.4 de ponta da OpenAI: o Mini busca a melhor relação desempenho/latência da categoria para programação, tarefas de UI multimodais e cargas de trabalho de subagentes; o Nano visa custo e latência ultrabaixos para classificação, extração, ranqueamento e subagentes massivamente paralelos. O Mini oferece precisão próxima à dos modelos de ponta em muitos benchmarks de desenvolvedores, enquanto roda >2× mais rápido do que as versões Mini anteriores; o Nano é significativamente mais barato por token e ideal onde vazão e responsividade são mais importantes. Esses modelos já estão disponíveis na API (GPT 5.4 Mini e Nano estão disponíveis no CometAPI).
Desvendando o Agents SDK da OpenAI: um guia
Mar 11, 2025
agents-sdk
open-ai
responses-api

Desvendando o Agents SDK da OpenAI: um guia

OpenAI está apresentando várias novas ofertas: Responses API, ferramentas integradas para pesquisa na web e em arquivos, uma ferramenta de uso do computador e o Agents SDK de código aberto. Enquanto