Principais recursos
- Geração de Texto→Imagem: converte prompts em linguagem natural em imagens com forte aderência às instruções.
- Edição de imagem / inpainting: aceita imagens de referência e máscaras para realizar edições direcionadas.
- Design otimizado para custo (“mini”): uma versão menor que a OpenAI e observadores descrevem como muito mais barata por imagem do que o modelo grande (as mensagens da OpenAI/DevDay e relatos iniciais indicam ~80% menos caro).
- Controles de saída flexíveis: oferece suporte a tamanho, formato de saída (JPEG/PNG/WEBP), compressão e um controle de qualidade (low/medium/high/auto no cookbook).
Detalhes técnicos (arquitetura e capacidades)
- Família do modelo e entrada/saída: membro da família gpt-image-1; aceita prompts de texto e entradas de imagem (para edições) e retorna imagens geradas. Os parâmetros de qualidade/tamanho controlam a resolução (máximo típico de ~1536×1024 nesta família — consulte a documentação para os tamanhos exatos suportados).
- Trade-offs operacionais: projetado como um modelo de menor porte — faz concessões em parte da fidelidade máxima em troca de melhorias de throughput e custo, preservando um acompanhamento robusto de prompts e recursos de edição.
- Segurança e metadados: segue as proteções de segurança de imagem da OpenAI e incorpora opções de metadados C2PA para procedência, quando disponíveis.
Entradas e saídas — o uso canônico oferece suporte a:
- Prompt de texto (string) para gerar uma nova imagem.
- Imagem + máscara para realizar edições direcionadas/inpainting.
- Imagens de referência para controlar estilo ou composição.
Esses recursos são disponibilizados por meio da Images API (nome do modelogpt-image-1-mini).
Limitações
- Menor fidelidade máxima: em comparação com o modelo grande gpt-image-1, o mini pode perder alguns microdetalhes e parte do fotorealismo de ponta (trade-off esperado pelo custo).
- Renderização de texto e detalhes minúsculos: como muitos modelos de imagem, ele pode ter dificuldade com texto pequeno e legível, gráficos densos ou texturas extremamente finas; espere fazer pós-processamento ou usar modelos de maior capacidade para essas necessidades.
- Escopo de edição: os recursos de edição de imagem/inpainting estão disponíveis, mas sugerem algumas limitações de edição em relação às ferramentas interativas da web do ChatGPT — as edições são eficazes para muitas tarefas, mas podem exigir refinamento iterativo.
- Restrições de segurança e política: as saídas estão sujeitas às proteções de moderação/segurança da OpenAI (conteúdo explícito, restrições de conteúdo protegido por direitos autorais, saídas não permitidas). Os desenvolvedores podem controlar a sensibilidade da moderação por meio de parâmetros da API, quando disponíveis.
Casos de uso recomendados
- Geração de conteúdo em alto volume (materiais de marketing, miniaturas, concept art rápida) — quando o custo por imagem é o fator principal.
- Edição programática / templating — inpainting em massa ou geração de variantes a partir de um ativo base.
- Aplicações interativas com restrições de orçamento — interfaces de chat ou ferramentas de design integradas nas quais a velocidade de resposta e o custo são mais importantes do que a fidelidade máxima absoluta.
- Prototipagem e geração de imagens para testes A/B — gere muitas imagens candidatas rapidamente e faça upscale seletivo ou execute novamente em modelos maiores para as versões finais.
- Como acessar a API gpt-image-1-mini
Etapa 1: Cadastre-se para obter uma chave de API
Faça login em cometapi.com. Se você ainda não for nosso usuário, registre-se primeiro. Entre no seu console da CometAPI. Obtenha a credencial de acesso, a chave de API da interface. Clique em “Add Token” na seção de token da API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.
Etapa 2: Envie solicitações para a API gpt-image-1-mini
Selecione o endpoint “\**gpt-image-1-mini \**” para enviar a solicitação da API e definir o corpo da solicitação. O método da solicitação e o corpo da solicitação podem ser obtidos na documentação da API em nosso site. Nosso site também fornece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave real da CometAPI da sua conta.
Insira sua pergunta ou solicitação no campo content — é isso ao que o modelo responderá. Processe a resposta da API para obter a resposta gerada.
Etapa 3: Recuperar e verificar resultados
Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.