Como usar a API Seedgream 4.5

Seedream 4.5 é a mais nova evolução da família Seedream de modelos de texto‑para‑imagem/edição de imagem (desenvolvidos sob a pesquisa da Byte/BytePlus). Está sendo distribuído nos endpoints oficiais da BytePlus e em múltiplas plataformas de terceiros — incluindo acesso integrado via gateways multimodelo como o CometAPI — e traz melhorias em consistência de sujeito, tipografia/renderização de texto e fidelidade em edição multi-imagem.

Este artigo é um guia prático e profissional para usar a API do Seedream 4.5. Você terá passos de configuração, autenticação e padrões de requisição, boas práticas de prompt e parâmetros, fluxos de edição e multi-imagem, tratamento de erros, padrões de implantação e considerações legais/de segurança.

O que é o Seedream 4.5?

Seedream 4.5 é a iteração mais recente da família Seedream — um modelo multimodal de geração e edição de imagens projetado para criação texto‑para‑imagem de alta fidelidade e edição de imagem com consciência de contexto (imagem‑para‑imagem, edição com múltiplas referências, inpainting/outpainting, tipografia e tratamento de texto denso). Em comparação com versões anteriores do Seedream, o 4.5 foca em melhor consistência de sujeito em fluxos de trabalho multi‑imagem, preservação mais rigorosa de detalhes de referência, maior fidelidade tipográfica (texto em imagens) e melhor qualidade de saída até 4K/ultra‑HD em configurações de “alta qualidade”. Essas melhorias vêm com uma arquitetura em escala e ajustes de prompt/heurísticas no engine.

Por que isso importa: o 4.5 foi intencionalmente criado para lidar com tarefas criativas profissionais — variações de produtos em lote, edições multi‑imagem consistentes com a marca e ativos para impressão em alta resolução — permitindo controle mais fino com imagens de referência e operações de edição especializadas.

Capacidades principais

Geração texto‑para‑imagem (única e em lote): gerar 1–15 imagens por chamada de API, com modos de qualidade selecionáveis (Basic vs High) que equilibram velocidade e resolução.
Edição de imagem (i2i / inpainting / outpainting): use uma ou mais imagens de referência; preserva detalhes e relações espaciais entre múltiplas referências.
Mesclagem com múltiplas referências e cópia de elementos: até ~10 imagens de referência podem ser usadas em um único job para transplantar elementos mantendo a iluminação/perspectiva coerentes.
Renderização de tipografia/texto denso de alta qualidade: melhor tratamento de imagens com texto ou sinalização (útil para mockups, rótulos de produtos, capturas de UI).
Streaming/saída progressiva: alguns endpoints de implantação suportam streaming dos resultados para que clientes recebam resultados parciais enquanto a geração continua.

Como usar a API do Seedream 4.5 via CometAPI?

Abaixo está um passo a passo prático, pronto para copiar e colar, para gerar imagens por meio do CometAPI (um agregador que expõe o modelo Seedream 4.5 como um parâmetro de modelo). Use o CometAPI quando quiser uma única chave de API para acessar dezenas/centenas de modelos e uma superfície REST estável e fácil de integrar. A documentação do CometAPI mostra o alias de modelo doubao-seedream-4-5-251128 e um endpoint padrão de geração de imagens.

Passos em alto nível

Cadastre-se no CometAPI e obtenha uma chave de API.

Use o endpoint de geração de imagens (POST https://api.cometapi.com/v1/images/generations) com o parâmetro model definido para o identificador do Seedream 4.5 (exemplo: doubao-seedream-4-5-251128).

Inclua o prompt, imagens de referência opcionais (URLs ou uploads multipart, dependendo do agregador), tamanho/qualidade de saída e outros parâmetros.

Receba uma resposta JSON contendo URLs de imagens geradas (ou base64) e metadados.

Tipos de requisição e modos

O Seedream 4.5 normalmente suporta:

Texto → Imagem (prompts de texto → imagens novas)
Imagem → Imagem (imagens de referência + prompts para transformações estilizadas)
Edição de imagem / Inpainting (máscara + instruções de edição para mudanças direcionadas)
APIs hospedadas oferecem modos de tarefa assíncronos (enviar job → consultar com taskId), o que se adequa a renderizações longas e fluxos de trabalho em lote. Links gerados costumam ser temporários (por exemplo, válidos por 24 horas em alguns gateways), então planeje armazenamento/exportação.

Exemplo com `curl` (texto‑para‑imagem, prompt único)

curl -X POST "https://api.cometapi.com/v1/images/generations" \
  -H "Authorization: Bearer COMETAPI_KEY_GOES_HERE" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedream-4-5-251128",
    "prompt": "A cinematic portrait of a cyberpunk fox in neon rain, 4k, detailed lighting, film grain",
    "n": 3,
    "width": 2048,
    "height": 2048,
    "quality": "high",     # or "basic"
    "seed": 12345,
    "style": "photorealistic"
  }'

Observações

Substitua COMETAPI_KEY_GOES_HERE pela sua chave do CometAPI.
O parâmetro n gera múltiplas variações em uma única chamada (economiza overhead).
quality: "high" geralmente mapeia para resolução mais alta / maior custo computacional (frequentemente com suporte a 4K).

Exemplo em Python com `requests` (texto‑para‑imagem + salvando resultados)

import requests, base64, os

API_URL = "https://api.cometapi.com/v1/images/generations"
API_KEY = os.environ.get("COMETAPI_KEY")  # set env var for safety

payload = {
  "model": "doubao-seedream-4-5-251128",
  "prompt": "Studio shot of a ceramic mug on a wooden table, warm natural light, ultra-detailed, 2k",
  "n": 2,
  "width": 1024,
  "height": 1024,
  "quality": "basic"
}

resp = requests.post(API_URL, json=payload, headers={
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
})
resp.raise_for_status()
data = resp.json()

# Example: each item has 'b64_json' or 'url' depending on provider
for i, item in enumerate(data.get("data", [])):
    img_b64 = item.get("b64_json")
    if img_b64:
        img_bytes = base64.b64decode(img_b64)
        with open(f"seedream_result_{i}.png", "wb") as f:
            f.write(img_bytes)
    else:
        print("Image URL:", item.get("url"))

Por que esse padrão? Agregadores normalmente retornam um payload base64 ou URLs hospedadas; o código trata ambos. O endpoint normalmente retornará um task_id. Consulte o endpoint GET /tasks/{task_id} até o status ser succeeded e então faça o download do resultado. Muitos provedores incluem SDKs com auxiliares integrados para esse padrão.

Como otimizar a qualidade da imagem e manter o texto legível?

Use imagens de referência para contexto consistente e correspondência de cores.
Mencione tipografia explicitamente no prompt (família de fonte, peso, alinhamento) e considere adicionar o texto exato como uma sobreposição em uma segunda etapa para garantir legibilidade.
Execute um processo em duas etapas: (a) gere a composição base; (b) re-renderize ou edite em uma segunda passada focada em close-ups ou áreas de rótulo com resolução mais alta.

Como escrever prompts para o Seedream 4.5?

Princípios de engenharia de prompts

Seja explícito: liste sujeito, ação, estilo, lente/câmera, horário do dia e paleta de cores desejada.
Use âncoras de identidade: se você precisa da mesma face/objeto em várias imagens, inclua descritores persistentes (por exemplo, “a mesma mulher com cabelo curto ondulado, jaqueta verde, cicatriz na sobrancelha esquerda”) e forneça 1–3 imagens de referência. A fusão multi‑referência do Seedream 4.5 melhorou, mas as âncoras ajudam.
Prompts negativos: declare explicitamente o que evitar (por exemplo, “sem texto”, “sem marcas d’água”, “sem membros extras”).
Híbrido curto + longo: dê uma instrução canônica curta e depois estenda com algumas linhas de detalhes e restrições.

Modelos de prompt de exemplo

Foto hero de produto (fotorrealista): "Uma foto hero limpa de um alto-falante sem fio preto fosco colocado em uma mesa branca, iluminação de softbox, 50 mm, pouca profundidade de campo, fundo de estúdio, fotorrealista, sem texto"

Ilustração de fantasia (estilizada): "Paisagem de fantasia épica, castelo de vidro imponente em um penhasco, golden hour, neblina volumétrica, estilo pintado, altamente detalhado, arte conceitual"

Edição de imagem (remover objeto): "Remova a pessoa à esquerda e estenda o fundo para preencher o espaço, mantenha a iluminação consistente, sem artefatos"

Mockup com tipografia intensa: "Mockup de tela inicial de app móvel em um iPhone 14, com o texto 'Lançar agora' em Gotham Bold, deixe o botão verde e mantenha as sombras suaves"

Retrato de personagem: "Retrato heroico de uma guerreira, iluminação de recorte cinematográfica, lente de retrato 85 mm, textura de pele ultra-detalhada, sardas naturais, armadura de couro, fundo neutro, fotorrealista."

Prompts com múltiplas imagens e referências

Ao usar edição multi‑imagem, especifique qual imagem de referência mapeia para qual parte do prompt. O Seedream 4.5 está melhor em identificar o sujeito principal em múltiplas referências — mas ser explícito (por exemplo, “use image_1 para o rosto, image_2 para a textura da roupa”) gera resultados melhores.

Seleção de saída e pós‑processamento

Gere N variações e aplique filtros objetivos: pontuação de similaridade facial, comparação de histograma de cores, OCR para verificar a precisão do texto.
Automatize limiares de controle de qualidade (QC) para encaminhar saídas abaixo do limiar para retoque manual.
Deixe a tipografia final para ferramentas de layout se você precisa de texto com exatidão pixel a pixel — use o modelo para fundos e imagens, depois componha o texto preciso no pós. Isso reduz a necessidade de depender da fidelidade de texto do modelo para materiais de marketing.

Como realizar edição de imagem, inpainting e composição multi‑imagem?

Fluxo de trabalho de edição de imagem

Envie a(s) imagem(ns) de referência para o provedor ou envie-as inline na requisição.
Forneça uma máscara (imagem binária) para inpainting ou uma anotação delimitadora para edições direcionadas.
Envie um prompt de edição esclarecendo quais regiões mudar e quais preservar.

Muitas APIs suportam modos de edição de imagem única e composição multi‑imagem; o 4.5 é explicitamente ajustado para preservar a identidade do sujeito e melhorar a consistência em múltiplas imagens.

Exemplo: payload de inpainting (pseudocódigo JSON)

{
  "model": "seedream-4.5",
  "mode": "image_edit",
  "image_url": "https://.../original.png",
  "mask_url": "https://.../mask.png",
  "prompt": "Replace background with a sunset beach — keep subject untouched, maintain original lighting on subject",
  "guidance": 9,
  "steps": 40
}

Dicas para edição multi‑imagem consistente

Use o mesmo seed para renderizações relacionadas para manter consistência entre quadros.
Mantenha descritores de câmera consistentes entre prompts (por exemplo, “85 mm retrato, softbox, 3/4”) para preservar o ponto de vista.
Ao editar rostos, solicite cláusulas de preservação detalhadas (“preservar estrutura facial, alterar apenas a cor do cabelo”) para reduzir a deriva de identidade.

Quais são as melhores práticas ao usar o Seedream 4.5

Como solucionar problemas comuns?

Aqui estão passos práticos de troubleshooting quando os resultados não saem como esperado:

Rostos borrados / detalhes incorretos

Aumente a especificidade do prompt para detalhes faciais (idade, expressão, iluminação), forneça imagens de referência de maior qualidade ou tente uma instrução explícita de “preservar rosto” e reduza a strength da edição para manter mais do original. O Seedream 4.5 melhora o realismo facial, mas as entradas ainda importam.

Texto ilegível ou embaralhado

Forneça texto vetorial ou raster como uma sobreposição separada se você precisar de tipografia pixel‑perfeita; caso contrário, use configurações de resolução mais alta e instruções explícitas de estilo como “renderizar texto legível: sim”. O 4.5 melhora o tratamento de texto denso em comparação com versões anteriores, mas perfeição tipográfica ainda pode exigir composição no pós.

Iluminação ou composição inconsistente em lote

Use um prompt padronizado com menções fixas de iluminação/câmera ou gere dentro de uma única chamada em lote para aumentar a consistência. A BytePlus e o CometAPI fornecem padrões de inferência em lote por esse motivo.

Considerações finais e próximos passos

Seedream 4.5 é um modelo de imagem maduro, orientado para produção, com melhorias explícitas voltadas a fluxos de trabalho criativos reais: melhor consistência, texto e rostos aprimorados e suporte a múltiplas referências. Use CometAPI ou agregadores similares quando quiser experimentação rápida e flexibilidade multimodelo.

Desenvolvedores podem acessar Seedream 4.5 via CometAPI; a versão mais recente do modelo é sempre atualizada com o site oficial. Para começar, explore os recursos do modelo no Playground e consulte o guia da API para instruções detalhadas. Antes de acessar, certifique-se de ter feito login no CometAPI e obtido a chave de API. O CometAPI oferece um preço muito inferior ao oficial para ajudar na sua integração.

Pronto para começar?→ Avaliação gratuita do Seedream 4.5 !

Se você quiser mais dicas, guias e novidades sobre IA, siga-nos no VK, X e Discord!

O que é o Seedream 4.5?

Capacidades principais

Como usar a API do Seedream 4.5 via CometAPI?

Tipos de requisição e modos

Exemplo com `curl` (texto‑para‑imagem, prompt único)

Exemplo em Python com `requests` (texto‑para‑imagem + salvando resultados)

Como otimizar a qualidade da imagem e manter o texto legível?

Como escrever prompts para o Seedream 4.5?

Princípios de engenharia de prompts

Modelos de prompt de exemplo

Prompts com múltiplas imagens e referências

Seleção de saída e pós‑processamento

Como realizar edição de imagem, inpainting e composição multi‑imagem?

Fluxo de trabalho de edição de imagem

Exemplo: payload de inpainting (pseudocódigo JSON)

Dicas para edição multi‑imagem consistente

Quais são as melhores práticas ao usar o Seedream 4.5

Como solucionar problemas comuns?

Rostos borrados / detalhes incorretos

Texto ilegível ou embaralhado

Iluminação ou composição inconsistente em lote

Considerações finais e próximos passos

Leia Mais

500+ Modelos em Uma API

Como usar a API Seedgream 4.5

O que é o Seedream 4.5?

Capacidades principais

Como usar a API do Seedream 4.5 via CometAPI?

Tipos de requisição e modos

Exemplo com curl (texto‑para‑imagem, prompt único)

Exemplo em Python com requests (texto‑para‑imagem + salvando resultados)

Como otimizar a qualidade da imagem e manter o texto legível?

Como escrever prompts para o Seedream 4.5?

Princípios de engenharia de prompts

Modelos de prompt de exemplo

Prompts com múltiplas imagens e referências

Seleção de saída e pós‑processamento

Como realizar edição de imagem, inpainting e composição multi‑imagem?

Fluxo de trabalho de edição de imagem

Exemplo: payload de inpainting (pseudocódigo JSON)

Dicas para edição multi‑imagem consistente

Quais são as melhores práticas ao usar o Seedream 4.5

Como solucionar problemas comuns?

Rostos borrados / detalhes incorretos

Texto ilegível ou embaralhado

Iluminação ou composição inconsistente em lote

Considerações finais e próximos passos

Leia Mais

500+ Modelos em Uma API

Exemplo com `curl` (texto‑para‑imagem, prompt único)

Exemplo em Python com `requests` (texto‑para‑imagem + salvando resultados)