Como editar imagens usando a API OpenAI GPT-Image-1

CometAPI
AnnaApr 28, 2025
Como editar imagens usando a API OpenAI GPT-Image-1

A API GPT-Image-1 da OpenAI está revolucionando a forma como desenvolvedores e criativos abordam a edição de imagens. Ao combinar recursos multimodais avançados com prompts de texto intuitivos, ela permite a manipulação precisa e de alta qualidade de imagens diretamente por meio do código. Seja para gerar novos visuais, editar imagens existentes ou criar variações, a gpt-image-1 oferece uma solução robusta.

O que é gpt-image-1?

O GPT-Image-1 é o modelo de geração de imagens mais recente da OpenAI, projetado para criar e editar imagens com base em descrições textuais. Ele é capaz de compreender prompts complexos e produzir imagens de alta fidelidade que se alinham perfeitamente com a intenção do usuário. Os principais recursos incluem:

  • Geração de imagens de alta fidelidade: Produz visuais detalhados e precisos.
  • Estilos visuais diversos: Suporta uma variedade de estéticas, do fotorrealista ao abstrato.
  • Edição precisa de imagens: Permite modificações direcionadas às imagens geradas.
  • Conhecimento Mundial Rico: Compreende instruções complexas com precisão contextual.
  • Renderização de texto consistente: Renderiza texto dentro de imagens de forma confiável.

Aplicações do mundo real

Os setores que utilizam o gpt-image-1 incluem:

  • Design e Prototipagem: Ferramentas como o Figma integram gpt-image-1 para aprimorar fluxos de trabalho criativos.
  • E-Commerce: As plataformas o utilizam para gerar visuais de produtos e materiais de marketing.
  • Educação: Cria diagramas e recursos visuais para plataformas de aprendizagem.
  • Marketing: Produz gráficos de anúncios e visuais para mídias sociais instantaneamente.

Configurando seu ambiente

Pré-requisitos

Antes de começar, certifique-se de ter o seguinte:

  • Uma chave de API OpenAI.
  • Python instalado no seu sistema.
  • O openai Pacote Python instalado.

Você pode instalar o openai pacote usando pip:

bashpip install openai

Configurando o cliente da API OpenAI

Primeiro, configure o cliente da API OpenAI no seu script Python:

pythonimport openai

openai.api_key = 'your-api-key-here'

Substituir 'your-api-key-here' com sua chave de API OpenAI real.


Como editar imagens com GPT-Image-1

Como funciona a edição de imagens?

O GPT-Image-1 permite editar imagens fornecendo uma imagem base, uma máscara opcional para especificar regiões editáveis ​​e um prompt textual descrevendo o resultado desejado. A API processa essas entradas e retorna uma imagem modificada que atende às suas especificações.

Preparando a imagem e a máscara

Certifique-se de que sua imagem de entrada e máscara atendam aos seguintes critérios:

  • Ambas devem ser imagens quadradas.
  • A máscara deve ser um PNG transparente onde a área transparente indica a região a ser editada.

Escrevendo o script Python

Aqui está um exemplo de script Python para editar uma imagem usando a API gpt-image-1:​

import requests
edit_url = "https://api.openai.com/v1/images/edits"
headers = {
"Authorization": "Bearer YOUR_API_KEY"
}
files = {
"image": open("input-image.png", "rb")
"mask":open("path_to_your_mask.png", "rb"),
}
data = {
"model": "gpt-image-1",
"prompt": "Add a bright red balloon in the sky",
"n": 1,
"size": "1024x1024"
}
response = requests.post(edit_url, headers=headers, files=files, data=data)
image_url = response.json()
print("Edited Image URL:", image_url)

Substituir:

  • 'Bearer YOUR_API_KEY' com sua chave de API OpenAI.
  • "path_to_your_image.png" com o caminho para sua imagem original.
  • "path_to_your_mask.png" com o caminho para sua imagem de máscara.
  • "Describe the desired edit here" com um prompt descrevendo a edição que você deseja fazer.

Exemplo: Alterando a cor de um objeto

Suponha que você tenha a imagem de uma bola vermelha e queira mudar sua cor para azul. Seu prompt seria:

pythonprompt="Change the red ball to a blue ball"

Certifique-se de que sua máscara destaque apenas a área da bola vermelha.


GPT-Imagem-1

Dicas e considerações avançadas

Quais são alguns recursos avançados?

  • Transferência de estilo: Aplique diferentes estilos artísticos modificando o prompt.
  • Adição/Remoção de Objetos: Adicione ou remova elementos dentro da imagem usando instruções descritivas.
  • Renderização de texto: Insira texto em imagens com fontes e posicionamentos específicos.

Tamanho da imagem e proporção da imagem

A API GPT-Image-1 exige que as imagens sejam quadradas, com tamanhos suportados como 256×256, 512×512 ou 1024×1024 pixels. Imagens não quadradas podem ser redimensionadas ou cortadas, o que pode afetar o resultado.

Uso e custos do token

Ao usar imagens codificadas em base64, esteja ciente de que o tamanho do payload aumenta em aproximadamente 33%, o que pode impactar o uso e os custos do token. Para atenuar isso, considere hospedar suas imagens e fornecer URLs em vez de dados em base64.

Limitações do modelo

Embora o gpt-image-1 ofereça recursos avançados de edição de imagens, ele pode não lidar com edições complexas envolvendo múltiplos objetos ou detalhes complexos tão eficazmente quanto um software especializado em edição de imagens. É mais adequado para edições simples, guiadas por instruções claras.

Melhores práticas para resultados ideais

Como melhorar os resultados da edição de imagens?

  • Seja específico: Avisos detalhados produzem resultados mais precisos.
  • Use imagens de alta qualidade: Certifique-se de que as imagens de base estejam claras e bem iluminadas.
  • Teste diferentes prompts: Experimente diferentes descrições para obter os efeitos desejados.
  • Máscaras de Alavancagem: Use máscaras para controlar regiões editáveis ​​com precisão.

Integrando gpt-image-1 em fluxos de trabalho de design

A integração do gpt-image-1 com ferramentas como Figma e Adobe Firefly agiliza o processo de design. Designers podem gerar e editar imagens diretamente nessas plataformas usando prompts de texto, facilitando a prototipagem e a iteração rápidas.

Por exemplo, no Figma, você pode selecionar um elemento de design, inserir um prompt como “Adicionar uma sombra a este objeto” e a integração GPT-Image-1 aplicará a edição de acordo.


Conclusão

A API GPT-Image-1 da OpenAI representa um avanço significativo na edição de imagens orientada por IA. Ao permitir prompts em linguagem natural para orientar as edições de imagens, ela capacita designers e desenvolvedores a criar e modificar visuais com eficiência. À medida que a integração com ferramentas de design continua a evoluir, a gpt-image-1 está pronta para se tornar um recurso indispensável no fluxo de trabalho criativo.

Começando a jornada

Os desenvolvedores podem acessar API GPT-image-1  através de CometAPI. Para começar, explore as capacidades do modelo no Playground e consulte o Guia de API (nome do modelo: gpt-image-1) para obter instruções detalhadas. Observe que alguns desenvolvedores podem precisar verificar sua organização antes de usar o modelo.

GPT-Image-1 Preços da API no CometAPI, 20% de desconto sobre o preço oficial:

Tokens de saída: US$ 32/M tokens

Tokens de entrada: $ 8 / M tokens

Leia Mais

500+ Modelos em Uma API

Até 20% de Desconto