gpt-imagem-1-mini é um modelo de imagem multimodal otimizado em termos de custos da OpenAI que aceita entradas de texto e imagem e produz saídas de imagem. Ele se posiciona como um irmão menor e mais barato da família completa GPT-Image-1 da OpenAI — projetado para uso em produção de alto rendimento, onde custo e latência são restrições importantes. O modelo é destinado a tarefas como geração de texto para imagem, edição de imagem / pintura, e fluxos de trabalho que incorporam imagens de referência.
Características chave
- Geração de texto para imagem: Converte comandos em linguagem natural em imagens com instruções claras e fáceis de seguir.
- Edição/preenchimento de imagens: Aceita imagens de referência e máscaras para realizar edições direcionadas.
- Projeto otimizado em termos de custo (“mini”): um modelo com uma pegada menor que a OpenAI e observadores descrevem como muito mais barato por imagem do que o modelo grande (mensagens da OpenAI/DevDay e relatórios iniciais indicam uma redução de custo de aproximadamente 80%).
- Controles de saída flexíveis: Suporta opções de tamanho, formato de saída (JPEG/PNG/WEBP), compressão e um controle de qualidade (baixa/média/alta/automática no manual).
Detalhes técnicos (arquitetura e capacidades)
- Família de modelos e entrada/saída: membro do gpt-image-1 família; aceita prompts de texto e entradas de imagem (para edições) e retorna as imagens geradas. Qualidade/tamanho Os parâmetros controlam a resolução (máximo típico de ~1536×1024 nesta família — consulte a documentação para obter os tamanhos exatos suportados).
- Compensações operacionais: Projetado como um modelo de tamanho menor, sacrifica um pouco da fidelidade de ponta em prol de algo maior. produtividade e custo Melhorias, mantendo ao mesmo tempo funcionalidades robustas de seguimento de instruções e edição.
- Segurança e metadados: Segue as diretrizes de segurança de imagem da OpenAI e incorpora opções de metadados C2PA para rastreabilidade quando disponíveis.
Entradas saídas — o uso canônico suporta:
- Prompt de texto (string) para gerar uma nova imagem.
- Imagem + máscara Para realizar edições/preenchimento direcionados.
- Imagens de referência Controlar o estilo ou a composição.
Esses dados são expostos por meio da API de Imagens (nome do modelo).gpt-image-1-mini).
Limitações
- Fidelidade de pico inferior: Em comparação com o modelo gpt-image-1 de grande porte, o mini pode Perde-se um pouco de microdetalhes e fotorrealismo de alta qualidade. (compensação esperada em relação ao custo).
- Renderização de texto e pequenos detalhes: Assim como muitos modelos de imagem, ele pode dificuldade com textos pequenos e legíveisGráficos densos ou texturas microfinas; espere precisar de pós-processamento ou de modelos de maior capacidade para essas necessidades.
- Escopo da edição: Funcionalidades de edição/preenchimento de imagens estão disponíveis, mas sugiro algumas. limitações de edição Em comparação com as ferramentas web interativas do ChatGPT, as edições são eficazes para muitas tarefas, mas podem exigir refinamento iterativo.
- Restrições de segurança e políticas: Os resultados estão sujeitos à moderação/medidas de segurança da OpenAI (conteúdo explícito, restrições de conteúdo protegido por direitos autorais, resultados não permitidos). Os desenvolvedores podem controlar a sensibilidade da moderação por meio de parâmetros da API, quando disponíveis.
Casos de uso recomendados
- Geração de conteúdo em grande volume (materiais de marketing, miniaturas, arte conceitual rápida) — onde custo por imagem é primário.
- Edição programática / criação de modelos — preenchimento em massa ou geração de variantes a partir de um recurso base.
- Aplicações interativas com restrições orçamentárias — interfaces de bate-papo ou ferramentas de design integradas onde a velocidade de resposta e o custo importam mais do que a fidelidade absoluta.
- Prototipagem e geração de imagens A/B — gerar rapidamente muitas imagens candidatas e aumentar seletivamente a escala ou executar novamente em modelos maiores para os finalistas.
Como chamar a API gpt-image-1-mini a partir da CometAPI
gpt-image-1-mini Preços da API no CometAPI, 20% de desconto sobre o preço oficial:
| Tokens de entrada | $2.00 |
| Tokens de saída | $6.40 |
Etapas Necessárias
- Faça o login no cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro.
- Faça login na sua Console CometAPI.
- Obtenha a chave de API da credencial de acesso da interface. Clique em "Adicionar Token" no token da API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.

Use o método
- Selecione o endpoint “gpt-image-1-mini” para enviar a solicitação à API e defina o corpo da solicitação. O método e o corpo da solicitação podem ser obtidos na documentação da API em nosso site. Nosso site também oferece um teste com o Apifox para sua conveniência.
- Substituir com sua chave CometAPI real da sua conta.
- Insira sua pergunta ou solicitação no campo de conteúdo — é a isso que o modelo responderá.
- . Processe a resposta da API para obter a resposta gerada.
A CometAPI fornece uma API REST totalmente compatível — para uma migração perfeita. Detalhes importantes para geração de imagem:
- URL base: https://api.cometapi.com/v1/images/generations
- Nomes de modelo: gpt-imagem-1-mini
- Autenticação:
Bearer YOUR_CometAPI_API_KEYcabeçalho - Tipo de conteúdo:
application/json.
Edição de imagem (gpt-image-1): https://api.cometapi.com/v1/images/edits
Veja também API GPT-image-1


