How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 atinge melhorias de velocidade de até 4× em relação ao GPT Image 1, reduzindo significativamente a latência em fluxos de trabalho criativos iterativos.

Does GPT Image 1.5 support multi-turn conversational editing?

Sim, por meio da Responses API, o GPT Image 1.5 oferece suporte a fluxos de edição em múltiplas interações, nos quais você pode refinar imagens iterativamente fornecendo instruções de acompanhamento, preservando o contexto.

What resolutions and quality settings does GPT Image 1.5 support?

O GPT Image 1.5 oferece suporte a 1024×1024 (quadrado), 1536×1024 (paisagem) e 1024×1536 (retrato). As opções de qualidade incluem baixo, médio, alto e automático.

Can GPT Image 1.5 use multiple reference images for compositing?

Sim, o GPT Image 1.5 aceita várias imagens de entrada para composição e referência de estilo. As 5 primeiras imagens são preservadas com maior fidelidade ao usar o modo input_fidelity high.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

O GPT Image 1.5 enfatiza a fidelidade de edição e a velocidade de iteração, enquanto o Nano Banana Pro é elogiado pelo realismo de estúdio. Ambos são altamente competitivos — escolha com base nas necessidades do seu fluxo de trabalho.

Does GPT Image 1.5 support transparent backgrounds?

Sim, defina o parâmetro background como 'transparent' com os formatos de saída PNG ou WebP. A transparência funciona melhor em configurações de qualidade média ou alta.

What is the maximum text prompt length for GPT Image 1.5?

O GPT Image 1.5 aceita prompts de até 32,000 caracteres, possibilitando instruções altamente detalhadas e restritas para tarefas complexas de geração de imagens.

API GPT Image 1.5 Acessível | text-to-image

O que é a API GPT-Image-1.5?

GPT-Image-1.5 é o mais novo membro da família GPT Image da OpenAI e o modelo por trás da experiência Images reformulada do ChatGPT. Ele foi projetado para levar a geração de imagens de experimentos de novidade para ferramentas criativas em nível de produção: maior fotorrealismo, controle mais preciso para edições iterativas e inferência mais rápida para dar suporte a fluxos de trabalho interativos e corporativos.

A API gpt-image-1.5 é um endpoint multimodal de imagem que aceita uma ou mais entradas de imagem (identificadores de arquivo ou bytes) mais um prompt de texto e retorna imagens geradas ou imagens editadas. Ela oferece suporte a:

Geração de texto para imagem (criar a partir de prompt),
Edição de imagem / in-painting / composição (aplicar instruções a imagens existentes, várias entradas de imagem permitidas), e
Fluxos de edição iterativa, multietapas por meio da Responses API (habilita UIs de “ajustar e iterar”).

A API trata prompts de imagem de forma diferente dos antigos limites do DALL·E: os modelos de imagem GPT aceitam prompts de texto significativamente mais longos (a diretriz de 32k caracteres), tornando viáveis instruções complexas e com muitas restrições.

Principais recursos (práticos)

Editabilidade aprimorada / consistência em múltiplas interações: preserva a aparência do personagem, a iluminação e os principais atributos visuais ao longo de edições iterativas. Isso torna “mesmo modelo, edições repetidas” mais confiável para fluxos como catálogos de produtos ou ativos de marca.
Maior throughput — melhorias de velocidade de 4× em relação ao GPT Image 1, visando reduzir a latência para fluxos criativos iterativos.
Otimizações de custo — custos de E/S de imagem reduzidos em cerca de 20% vs. GPT Image 1, diminuindo o custo por iteração de imagem para usuários de alto volume.
Composição multiimagem e referência de estilo — aceita várias imagens de referência para compor cenas ou transferir estilo/iluminação.
Ajustes de qualidade/fidelidade — parâmetros da API que equilibram velocidade e fidelidade (use qualidade menor para geração em massa; maior para ativos de produção).
Edição multietapas / integração com a Responses API — possibilita fluxos de trabalho passo a passo (pedir mudanças e depois “fazer ajustes” preservando o estado).

Capacidades técnicas

Limite de prompt de texto (modelos de imagem): até 32,000 caracteres (observação: a OpenAI documenta isso como a permissão de comprimento de texto para os modelos de imagem GPT). Use isso para prompts longos e com muitas restrições.
Entradas de imagem: aceita IDs de arquivo (preferidas para fluxos multietapas) ou bytes brutos; várias imagens podem ser fornecidas para composição e referência.
Saídas: artefatos de imagem PNG/JPEG ou padrão da plataforma retornados pela API (ou como anexos dentro do ChatGPT). As saídas podem incluir múltiplas imagens candidatas e suportar solicitações iterativas para refinar um resultado.
Modos de geração: texto para imagem, edição de imagem (inpaint/estender com instruções) e variantes. A edição multietapas suporta instruções do tipo “adicionar/subtrair/combinar”.
Edição sensível às instruções: os modelos são otimizados para fidelidade às instruções (preservando invariantes especificados como “não altere o logotipo”, “mantenha a pose e a iluminação”). Padrões de engenharia de prompts (invariantes explícitos repetidos a cada iteração) reduzem a deriva semântica.

Desempenho em benchmarks

Posicionamento em rankings: um relatório agregado citou o GPT Image 1.5 liderando os rankings de texto para imagem com ~1264 pontos em um leaderboard da Artificial Analysis, à frente do próximo modelo por uma margem mensurável.
Métricas por tarefa (edição e preservação): um resumo da Microsoft Foundry de métricas de avaliação mostra o GPT-Image-1.5 alcançando sucesso de modificação binária quase perfeito (100% em um BinaryEval de turno único) e fortes pontuações de preservação de rosto (cerca de 90% em medidas do AuraFace) em sua tabela de comparação versus concorrentes e modelos anteriores da OpenAI. Essas métricas comparativas colocam o GPT-Image-1.5 à frente de alguns rivais em preservação e fidelidade de edição.

GPT Image 1.5

Como o GPT-Image-1.5 se compara aos pares

Vs. GPT Image 1 (geração anterior da OpenAI): mais rápido (até 4×), mais barato (~20% menor custo de E/S de imagem) e maior fidelidade de edição — voltado a migrar de “protótipo/demo” para fluxos de trabalho de imagem “prontos para produção”.
Vs. os modelos de imagem Nano Banana Pro / Gemini do Google: GPT-Image-1.5 e a família Nano Banana Pro / Gemini 3 do Google como rivais próximos — cada um com pontos fortes em diferentes classes de prompt. A mensagem da OpenAI enfatiza fidelidade de edição e velocidade de iteração; a oferta do Google tem sido elogiada por realismo em nível de estúdio em alguns exemplos.
Vs. Qwen Image e outros modelos abertos/fechados: o GPT-Image-1.5 superando o Qwen Image em várias métricas de edição e preservação em avaliações de turno único, mas as diferenças diminuem em testes multietapas ou outros domínios específicos.

Onde o GPT-Image-1.5 é forte

Imagens de produtos para e-commerce: variantes em massa, trocas de fundo, catálogos de produtos consistentes a partir de uma única foto (preservação de marca/logotipo).
Produção de ativos criativos e de marketing: iterações rápidas de conceito, mockups fotorrealistas, transferências de estilo controladas.
Retoque fotográfico e fluxos editoriais: experimentação realista de roupas/cabelos, retoques seletivos que preservam identidade e iluminação.
Integração com ferramentas de design: integração a plataformas de design ou CMS para variantes de imagem sob demanda (os ajustes de fidelidade ajudam no controle de custos).
Pipelines de composição em múltiplas etapas: várias entradas de imagem permitem composição e geração baseada em referência para cenas complexas.

Como acessar a API GPT Image 1.5

Etapa 1: Cadastre-se para obter a chave de API

Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu console do CometAPI. Obtenha a credencial de acesso (API key) da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.

Etapa 2: Envie solicitações para a API GPT Image 1.5

Selecione o endpoint “gpt-image-1.5” para enviar a solicitação à API e defina o corpo da solicitação. O método e o corpo da solicitação são obtidos na nossa documentação de API do site. Nosso site também fornece teste Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta. o URL base é Images (https://api.cometapi.com/v1/images/generations) e [Edição de Imagem]

Insira sua pergunta ou solicitação no campo content — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.

Etapa 3: Recupere e verifique os resultados

Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.

Veja também Gemini 3 Pro Preview API

Preço do Comet (USD / M Tokens)	Preço Oficial (USD / M Tokens)	Desconto
Entrada:$6.4/M Saída:$25.6/M	Entrada:$8/M Saída:$32/M	-20%

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

O que é a API GPT-Image-1.5?

Geração de texto para imagem (criar a partir de prompt),
Edição de imagem / in-painting / composição (aplicar instruções a imagens existentes, várias entradas de imagem permitidas), e
Fluxos de edição iterativa, multietapas por meio da Responses API (habilita UIs de “ajustar e iterar”).

Principais recursos (práticos)

Editabilidade aprimorada / consistência em múltiplas interações: preserva a aparência do personagem, a iluminação e os principais atributos visuais ao longo de edições iterativas. Isso torna “mesmo modelo, edições repetidas” mais confiável para fluxos como catálogos de produtos ou ativos de marca.
Maior throughput — melhorias de velocidade de 4× em relação ao GPT Image 1, visando reduzir a latência para fluxos criativos iterativos.
Otimizações de custo — custos de E/S de imagem reduzidos em cerca de 20% vs. GPT Image 1, diminuindo o custo por iteração de imagem para usuários de alto volume.
Composição multiimagem e referência de estilo — aceita várias imagens de referência para compor cenas ou transferir estilo/iluminação.
Ajustes de qualidade/fidelidade — parâmetros da API que equilibram velocidade e fidelidade (use qualidade menor para geração em massa; maior para ativos de produção).
Edição multietapas / integração com a Responses API — possibilita fluxos de trabalho passo a passo (pedir mudanças e depois “fazer ajustes” preservando o estado).

Capacidades técnicas

Limite de prompt de texto (modelos de imagem): até 32,000 caracteres (observação: a OpenAI documenta isso como a permissão de comprimento de texto para os modelos de imagem GPT). Use isso para prompts longos e com muitas restrições.
Entradas de imagem: aceita IDs de arquivo (preferidas para fluxos multietapas) ou bytes brutos; várias imagens podem ser fornecidas para composição e referência.
Saídas: artefatos de imagem PNG/JPEG ou padrão da plataforma retornados pela API (ou como anexos dentro do ChatGPT). As saídas podem incluir múltiplas imagens candidatas e suportar solicitações iterativas para refinar um resultado.
Modos de geração: texto para imagem, edição de imagem (inpaint/estender com instruções) e variantes. A edição multietapas suporta instruções do tipo “adicionar/subtrair/combinar”.
Edição sensível às instruções: os modelos são otimizados para fidelidade às instruções (preservando invariantes especificados como “não altere o logotipo”, “mantenha a pose e a iluminação”). Padrões de engenharia de prompts (invariantes explícitos repetidos a cada iteração) reduzem a deriva semântica.

Desempenho em benchmarks

Posicionamento em rankings: um relatório agregado citou o GPT Image 1.5 liderando os rankings de texto para imagem com ~1264 pontos em um leaderboard da Artificial Analysis, à frente do próximo modelo por uma margem mensurável.
Métricas por tarefa (edição e preservação): um resumo da Microsoft Foundry de métricas de avaliação mostra o GPT-Image-1.5 alcançando sucesso de modificação binária quase perfeito (100% em um BinaryEval de turno único) e fortes pontuações de preservação de rosto (cerca de 90% em medidas do AuraFace) em sua tabela de comparação versus concorrentes e modelos anteriores da OpenAI. Essas métricas comparativas colocam o GPT-Image-1.5 à frente de alguns rivais em preservação e fidelidade de edição.

GPT Image 1.5

Como o GPT-Image-1.5 se compara aos pares

Vs. GPT Image 1 (geração anterior da OpenAI): mais rápido (até 4×), mais barato (~20% menor custo de E/S de imagem) e maior fidelidade de edição — voltado a migrar de “protótipo/demo” para fluxos de trabalho de imagem “prontos para produção”.
Vs. os modelos de imagem Nano Banana Pro / Gemini do Google: GPT-Image-1.5 e a família Nano Banana Pro / Gemini 3 do Google como rivais próximos — cada um com pontos fortes em diferentes classes de prompt. A mensagem da OpenAI enfatiza fidelidade de edição e velocidade de iteração; a oferta do Google tem sido elogiada por realismo em nível de estúdio em alguns exemplos.
Vs. Qwen Image e outros modelos abertos/fechados: o GPT-Image-1.5 superando o Qwen Image em várias métricas de edição e preservação em avaliações de turno único, mas as diferenças diminuem em testes multietapas ou outros domínios específicos.

Onde o GPT-Image-1.5 é forte

Imagens de produtos para e-commerce: variantes em massa, trocas de fundo, catálogos de produtos consistentes a partir de uma única foto (preservação de marca/logotipo).
Produção de ativos criativos e de marketing: iterações rápidas de conceito, mockups fotorrealistas, transferências de estilo controladas.
Retoque fotográfico e fluxos editoriais: experimentação realista de roupas/cabelos, retoques seletivos que preservam identidade e iluminação.
Integração com ferramentas de design: integração a plataformas de design ou CMS para variantes de imagem sob demanda (os ajustes de fidelidade ajudam no controle de custos).
Pipelines de composição em múltiplas etapas: várias entradas de imagem permitem composição e geração baseada em referência para cenas complexas.

Como acessar a API GPT Image 1.5

Etapa 1: Cadastre-se para obter a chave de API

Etapa 2: Envie solicitações para a API GPT Image 1.5

Insira sua pergunta ou solicitação no campo content — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.

Etapa 3: Recupere e verifique os resultados

Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.

Veja também Gemini 3 Pro Preview API

GPT Image 1.5

Playground para GPT Image 1.5

O que é a API GPT-Image-1.5?

Principais recursos (práticos)

Capacidades técnicas

Desempenho em benchmarks

Como o GPT-Image-1.5 se compara aos pares

Onde o GPT-Image-1.5 é forte

Como acessar a API GPT Image 1.5

Etapa 1: Cadastre-se para obter a chave de API

Etapa 2: Envie solicitações para a API GPT Image 1.5

Etapa 3: Recupere e verifique os resultados

FAQ

Preços para GPT Image 1.5

Código de exemplo e API para GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Versões do GPT Image 1.5

GPT Image 1.5

Playground para GPT Image 1.5

O que é a API GPT-Image-1.5?

Principais recursos (práticos)

Capacidades técnicas

Desempenho em benchmarks

Como o GPT-Image-1.5 se compara aos pares

Onde o GPT-Image-1.5 é forte

Como acessar a API GPT Image 1.5

Etapa 1: Cadastre-se para obter a chave de API

Etapa 2: Envie solicitações para a API GPT Image 1.5

Etapa 3: Recupere e verifique os resultados

FAQ

Preços para GPT Image 1.5

Código de exemplo e API para GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Versões do GPT Image 1.5