Home/Models/OpenAI/GPT Image 1 mini
X

GPT Image 1 mini

Entrada:$6.4/M
Saída:$25.6/M
Contexto:2M
Saída Máxima:30K
Versão com custo otimizado do GPT Image 1. É um modelo de linguagem multimodal nativo que aceita tanto texto quanto imagem como entrada e gera saída de imagem.
Novo
Uso comercial
Visão Geral
Recursos
Preços
API

Principais recursos

  • Geração de Texto→Imagem: converte prompts em linguagem natural em imagens com forte aderência às instruções.
  • Edição de imagem / inpainting: aceita imagens de referência e máscaras para realizar edições direcionadas.
  • Design otimizado para custo (“mini”): uma versão menor que a OpenAI e observadores descrevem como muito mais barata por imagem do que o modelo grande (as mensagens da OpenAI/DevDay e relatos iniciais indicam ~80% menos caro).
  • Controles de saída flexíveis: oferece suporte a tamanho, formato de saída (JPEG/PNG/WEBP), compressão e um controle de qualidade (low/medium/high/auto no cookbook).

Detalhes técnicos (arquitetura e capacidades)

  • Família do modelo e entrada/saída: membro da família gpt-image-1; aceita prompts de texto e entradas de imagem (para edições) e retorna imagens geradas. Os parâmetros de qualidade/tamanho controlam a resolução (máximo típico de ~1536×1024 nesta família — consulte a documentação para os tamanhos exatos suportados).
  • Trade-offs operacionais: projetado como um modelo de menor porte — faz concessões em parte da fidelidade máxima em troca de melhorias de throughput e custo, preservando um acompanhamento robusto de prompts e recursos de edição.
  • Segurança e metadados: segue as proteções de segurança de imagem da OpenAI e incorpora opções de metadados C2PA para procedência, quando disponíveis.

Entradas e saídas — o uso canônico oferece suporte a:

  • Prompt de texto (string) para gerar uma nova imagem.
  • Imagem + máscara para realizar edições direcionadas/inpainting.
  • Imagens de referência para controlar estilo ou composição.
    Esses recursos são disponibilizados por meio da Images API (nome do modelo gpt-image-1-mini).

Limitações

  • Menor fidelidade máxima: em comparação com o modelo grande gpt-image-1, o mini pode perder alguns microdetalhes e parte do fotorealismo de ponta (trade-off esperado pelo custo).
  • Renderização de texto e detalhes minúsculos: como muitos modelos de imagem, ele pode ter dificuldade com texto pequeno e legível, gráficos densos ou texturas extremamente finas; espere fazer pós-processamento ou usar modelos de maior capacidade para essas necessidades.
  • Escopo de edição: os recursos de edição de imagem/inpainting estão disponíveis, mas sugerem algumas limitações de edição em relação às ferramentas interativas da web do ChatGPT — as edições são eficazes para muitas tarefas, mas podem exigir refinamento iterativo.
  • Restrições de segurança e política: as saídas estão sujeitas às proteções de moderação/segurança da OpenAI (conteúdo explícito, restrições de conteúdo protegido por direitos autorais, saídas não permitidas). Os desenvolvedores podem controlar a sensibilidade da moderação por meio de parâmetros da API, quando disponíveis.

Casos de uso recomendados

  • Geração de conteúdo em alto volume (materiais de marketing, miniaturas, concept art rápida) — quando o custo por imagem é o fator principal.
  • Edição programática / templating — inpainting em massa ou geração de variantes a partir de um ativo base.
  • Aplicações interativas com restrições de orçamento — interfaces de chat ou ferramentas de design integradas nas quais a velocidade de resposta e o custo são mais importantes do que a fidelidade máxima absoluta.
  • Prototipagem e geração de imagens para testes A/B — gere muitas imagens candidatas rapidamente e faça upscale seletivo ou execute novamente em modelos maiores para as versões finais.
  • Como acessar a API gpt-image-1-mini

Etapa 1: Cadastre-se para obter uma chave de API

Faça login em cometapi.com. Se você ainda não for nosso usuário, registre-se primeiro. Entre no seu console da CometAPI. Obtenha a credencial de acesso, a chave de API da interface. Clique em “Add Token” na seção de token da API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.

Etapa 2: Envie solicitações para a API gpt-image-1-mini

Selecione o endpoint “\**gpt-image-1-mini \**” para enviar a solicitação da API e definir o corpo da solicitação. O método da solicitação e o corpo da solicitação podem ser obtidos na documentação da API em nosso site. Nosso site também fornece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave real da CometAPI da sua conta.

Insira sua pergunta ou solicitação no campo content — é isso ao que o modelo responderá. Processe a resposta da API para obter a resposta gerada.

Etapa 3: Recuperar e verificar resultados

Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.

Recursos para GPT Image 1 mini

Explore os principais recursos do GPT Image 1 mini, projetado para aprimorar o desempenho e a usabilidade. Descubra como essas capacidades podem beneficiar seus projetos e melhorar a experiência do usuário.

Preços para GPT Image 1 mini

Explore preços competitivos para GPT Image 1 mini, projetado para atender diversos orçamentos e necessidades de uso. Nossos planos flexíveis garantem que você pague apenas pelo que usar, facilitando o dimensionamento conforme suas necessidades crescem. Descubra como GPT Image 1 mini pode aprimorar seus projetos mantendo os custos gerenciáveis.
Preço do Comet (USD / M Tokens)Preço Oficial (USD / M Tokens)Desconto
Entrada:$6.4/M
Saída:$25.6/M
Entrada:$8/M
Saída:$32/M
-20%

Código de exemplo e API para GPT Image 1 mini

gpt-image-1-mini é um modelo de imagem multimodal otimizado para custo da OpenAI que aceita entradas de texto e imagem e produz saídas de imagem. Ele é posicionado como uma versão menor e mais barata da família completa GPT-Image-1 da OpenAI — projetado para uso em produção de alto rendimento, onde custo e latência são restrições importantes. O modelo é destinado a tarefas como geração de imagem a partir de texto, edição de imagem / inpainting e fluxos de trabalho que incorporam imagens de referência.
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI
from PIL import Image
from io import BytesIO

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

prompt = "A cute baby sea otter swimming in the ocean"

# Generate image using gpt-image-1-mini
result = client.images.generate(
    model="gpt-image-1-mini",
    prompt=prompt,
    size="1024x1024",
)

# Save the image
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

output_path = os.path.join(OUTPUT_DIR, "output.png")
image = Image.open(BytesIO(image_bytes))
image.save(output_path, format="PNG")

print(f"Image saved to: {output_path}")

Mais modelos