Seedream 4.5 é a mais nova evolução da família Seedream de modelos de texto‑para‑imagem/edição de imagem (desenvolvido sob pesquisa da Byte/BytePlus). Está sendo disponibilizado nos endpoints oficiais da BytePlus e em múltiplas plataformas de terceiros — incluindo acesso integrado por meio de gateways multimodelo como o CometAPI — e traz melhorias em consistência do sujeito, tipografia/renderização de texto e fidelidade na edição multi‑imagem.
Este artigo é um guia prático e profissional para usar a API do Seedream 4.5. Você terá passos de configuração, autenticação e padrões de requisição, boas práticas de prompts e parâmetros, fluxos de edição e multi‑imagem, tratamento de erros, padrões de implantação e considerações legais/de segurança.
O que é o Seedream 4.5?
Seedream 4.5 é a iteração mais recente da família Seedream — um modelo multimodal de geração e edição de imagens projetado para criação de texto‑para‑imagem de alta fidelidade e edição de imagem consciente do contexto (imagem‑para‑imagem, edição com múltiplas referências, inpainting/outpainting, tipografia e tratamento de texto denso). Em comparação com versões anteriores do Seedream, a 4.5 foca em melhor consistência do sujeito em fluxos multi‑imagem, preservação mais estrita de detalhes de referência, maior fidelidade tipográfica (texto em imagens) e melhor qualidade de saída até 4K/ultra‑HD em configurações de “alta qualidade”. Essas melhorias resultam de uma arquitetura em escala e de ajustes de prompt/heurísticas no motor.
Por que isso importa: a 4.5 foi intencionalmente construída para lidar com tarefas criativas profissionais — variações de produto em lote, edições multi‑imagem consistentes com a marca e ativos para impressão em alta resolução — permitindo controle mais fino com imagens de referência e operações de edição especializadas.
Recursos principais
- Geração de texto‑para‑imagem (individual e em lote): gere 1–15 imagens por chamada de API, com modos de qualidade selecionáveis (Basic vs High) que equilibram velocidade e resolução.
- Edição de imagem (i2i / inpainting / outpainting): use uma ou mais imagens de referência; preserva detalhes e relações espaciais entre múltiplas referências.
- Mistura com múltiplas referências e cópia de elementos: até ~10 imagens de referência podem ser usadas em um único job para transplantar elementos mantendo coerência de iluminação/perspectiva.
- Renderização avançada de tipografia/texto denso: melhor tratamento para imagens com texto ou sinalização (útil para mockups, rótulos de produto, capturas de tela de UI).
- Streaming/saída progressiva: alguns endpoints de implantação suportam resultados em streaming, permitindo que clientes recebam resultados parciais enquanto a geração continua.
Como usar a API do Seedream 4.5 via CometAPI?
Abaixo está um passo a passo prático, pronto para copiar/colar, para gerar imagens via CometAPI (um agregador que expõe o modelo Seedream 4.5 como um parâmetro de modelo). Use o CometAPI quando quiser uma única API key para acessar dezenas/centenas de modelos e uma superfície REST estável e fácil de integrar. A documentação do CometAPI exibe o alias de modelo doubao-seedream-4-5-251128 e um endpoint padrão de geração de imagens.
Passos em alto nível
- Cadastre‑se no CometAPI e obtenha uma API key.
- Use o endpoint de geração de imagens (
POST https://api.cometapi.com/v1/images/generations) com o parâmetro model definido para o identificador do Seedream 4.5 (exemplo:doubao-seedream-4-5-251128).- Inclua o prompt, imagens de referência opcionais (URLs ou uploads multipart, dependendo do agregador), tamanho/qualidade de saída e outros parâmetros.
- Receba uma resposta JSON contendo URLs (ou base64) das imagens geradas e metadados.
Tipos de solicitação e modos
Seedream 4.5 normalmente oferece suporte a:
- Texto → Imagem (prompts de texto → imagens novas)
- Imagem → Imagem (imagens de referência + prompts para transformações estilizadas)
- Edição de imagem / Inpainting (máscara + instruções de edição para mudanças direcionadas)
APIs hospedadas oferecem modos assíncronos de tarefa (enviar job → fazer polling com taskId), o que se encaixa em renders longos e fluxos em lote. Links gerados costumam ser temporários (por exemplo, válidos por 24 horas em alguns gateways), então planeje armazenamento/exportação.
Exemplo com curl (texto‑para‑imagem, prompt único)
curl -X POST "https://api.cometapi.com/v1/images/generations" \
-H "Authorization: Bearer COMETAPI_KEY_GOES_HERE" \
-H "Content-Type: application/json" \
-d '{
"model": "doubao-seedream-4-5-251128",
"prompt": "A cinematic portrait of a cyberpunk fox in neon rain, 4k, detailed lighting, film grain",
"n": 3,
"width": 2048,
"height": 2048,
"quality": "high", # or "basic"
"seed": 12345,
"style": "photorealistic"
}'
Observações
- Substitua
COMETAPI_KEY_GOES_HEREpela sua key do CometAPI. - O parâmetro
ngera múltiplas variações em uma chamada (economiza overhead). quality: "high"normalmente mapeia para maior resolução/maior custo de computação (geralmente compatível com 4K).
Exemplo em Python com requests (texto‑para‑imagem + salvando resultados)
import requests, base64, os
API_URL = "https://api.cometapi.com/v1/images/generations"
API_KEY = os.environ.get("COMETAPI_KEY") # set env var for safety
payload = {
"model": "doubao-seedream-4-5-251128",
"prompt": "Studio shot of a ceramic mug on a wooden table, warm natural light, ultra-detailed, 2k",
"n": 2,
"width": 1024,
"height": 1024,
"quality": "basic"
}
resp = requests.post(API_URL, json=payload, headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
})
resp.raise_for_status()
data = resp.json()
# Example: each item has 'b64_json' or 'url' depending on provider
for i, item in enumerate(data.get("data", [])):
img_b64 = item.get("b64_json")
if img_b64:
img_bytes = base64.b64decode(img_b64)
with open(f"seedream_result_{i}.png", "wb") as f:
f.write(img_bytes)
else:
print("Image URL:", item.get("url"))
Por que esse padrão? Agregadores normalmente retornam payload base64 ou URLs hospedadas; o código trata ambos. O endpoint normalmente retorna um task_id. Faça polling no endpoint GET /tasks/{task_id} até o status ser succeeded e então baixe o resultado. Muitos provedores incluem SDKs com utilitários integrados para esse padrão.
Como otimizar a qualidade da imagem e manter o texto legível?
- Use imagens de referência para contexto consistente e correspondência de cores.
- Mencione a tipografia explicitamente no prompt (família de fonte, peso, alinhamento) e considere adicionar o texto exato como sobreposição em uma segunda etapa para garantir legibilidade.
- Execute um processo em duas etapas: (a) gere a composição base; (b) renderize novamente ou edite em um segundo passe focado em close‑ups ou áreas com rótulos em resolução mais alta.
Como escrever prompts para o Seedream 4.5?
Princípios de engenharia de prompts
- Seja explícito: liste sujeito, ação, estilo, lente/câmera, hora do dia e a paleta de cores desejada.
- Use âncoras de identidade: se precisa da mesma face/objeto em várias imagens, inclua descritores persistentes (por exemplo, “a mesma mulher com cabelo curto ondulado, jaqueta verde, cicatriz na sobrancelha esquerda”) e forneça de 1 a 3 imagens de referência. A fusão multi‑referência do Seedream 4.5 melhorou, mas âncoras ajudam.
- Prompts negativos: declare explicitamente o que evitar (por exemplo, “sem texto”, “sem marcas d’água”, “sem membros extras”).
- Híbrido curto + longo: dê uma instrução canônica curta e depois estenda com algumas linhas de detalhes e restrições.
Modelos de prompt de exemplo
- Foto principal de produto (fotorrealista): "Uma foto principal de produto limpa de uma caixa de som sem fio preta fosca sobre uma mesa branca, iluminação de softbox, 50 mm, profundidade de campo rasa, fundo de estúdio, fotorreal, sem texto"
- Ilustração de fantasia (estilizada): "Paisagem de fantasia épica, castelo de vidro imponente em um penhasco, golden hour, neblina volumétrica, estilo pictórico, altamente detalhado, concept art"
- Edição de imagem (remover objeto): "Remova a pessoa à esquerda e estenda o fundo para preencher o espaço, mantenha a iluminação consistente, sem artefatos"
- Mockup com tipografia pesada: "Mockup de tela de landing de app móvel em um iPhone 14, com o texto 'Comece agora' em Gotham Bold, deixe o botão verde e mantenha sombras suaves"
- Retrato de personagem: "Retrato heroico de uma guerreira, iluminação de recorte cinematográfica, lente de retrato 85 mm, textura de pele ultra‑detalhada, sardas naturais, armadura de couro, fundo neutro, fotorrealista."
Prompts com múltiplas imagens e referências
Ao usar edição com múltiplas imagens, especifique qual imagem de referência corresponde a qual parte do prompt. O Seedream 4.5 melhora na identificação do sujeito principal entre várias referências — mas ser explícito (por exemplo, “use image_1 para o rosto, image_2 para a textura da roupa”) gera melhores resultados.
Seleção de saída e pós‑processamento
- Gere N variantes e use filtros objetivos: pontuação de similaridade facial, comparação de histograma de cores, OCR de tipografia para verificar a precisão do texto.
- Automatize limites de QC para encaminhar saídas abaixo do limiar para retoque manual.
- Delegue a tipografia final a ferramentas de layout se precisar de texto pixel‑perfeito — use o modelo para fundos e imagens, depois componha texto preciso no pós. Isso reduz a dependência da fidelidade tipográfica do modelo para ativos de marketing.
Como realizar edição de imagem, inpainting e composição com múltiplas imagens?
Fluxo de trabalho de edição de imagem
- Envie as imagens de referência para o provedor ou inclua‑as inline na requisição.
- Forneça uma máscara (imagem binária) para inpainting ou uma anotação delimitadora para edições direcionadas.
- Envie um prompt de edição esclarecendo quais regiões mudar e quais preservar.
Muitas APIs suportam modos de edição de imagem única e de composição multi‑imagem; a 4.5 é explicitamente ajustada para preservar a identidade do sujeito e melhorar a consistência multi‑imagem.
Exemplo: payload de Inpainting (pseudocódigo JSON)
{
"model": "seedream-4.5",
"mode": "image_edit",
"image_url": "https://.../original.png",
"mask_url": "https://.../mask.png",
"prompt": "Replace background with a sunset beach — keep subject untouched, maintain original lighting on subject",
"guidance": 9,
"steps": 40
}
Dicas para edição consistente com múltiplas imagens
- Use o mesmo
seedpara renders relacionados para manter consistência entre quadros. - Mantenha descritores de câmera consistentes entre prompts (por exemplo, “85 mm retrato, softbox, 3/4”) para manter consistência de ponto de vista.
- Ao editar rostos, solicite cláusulas de preservação de alta granularidade (“preservar a estrutura facial, alterar apenas a cor do cabelo”) para reduzir deriva de identidade.
Quais são as melhores práticas ao usar o Seedream 4.5
Como solucionar problemas comuns?
Aqui estão etapas práticas de solução de problemas quando os resultados não estão bons:
Rostos borrados / detalhes incorretos
Aumente a especificidade do prompt para detalhes faciais (idade, expressão, iluminação), forneça imagens de referência de maior qualidade ou tente uma instrução explícita de “preservar rosto” e reduza a strength da edição para manter mais do original. O Seedream 4.5 melhora o realismo facial, mas as entradas ainda importam.
Texto ilegível ou distorcido
Forneça texto vetorial ou raster como uma sobreposição separada se precisar de tipografia pixel‑perfeita; caso contrário, use configurações de resolução mais alta e instruções explícitas de estilo “renderizar texto legível: sim”. A 4.5 melhora o tratamento de texto denso em comparação com versões anteriores, mas perfeição tipográfica pode ainda exigir composição no pós.
Iluminação ou composição inconsistente no lote
Use um prompt modelado com menções fixas de iluminação/câmera ou gere dentro de uma única chamada em lote para aumentar a consistência. BytePlus e CometAPI fornecem padrões de inferência em lote por esse motivo.
Notas finais e próximos passos
Seedream 4.5 é um modelo de imagem maduro e voltado para produção, com melhorias explícitas focadas em fluxos criativos reais: melhor consistência, texto e renderização facial aprimorados e suporte multi‑referência. Use CometAPI ou agregadores similares quando quiser experimentação rápida e flexibilidade multimodelo.
Desenvolvedores podem acessar a API do [Seedream 4.5](http://Seedream 4.5) etc por meio do CometAPI; a versão mais recente do modelo é sempre atualizada com o site oficial. Para começar, explore os recursos do modelo no Playground e consulte o guia da API para instruções detalhadas. Antes de acessar, certifique‑se de ter feito login no CometAPI e obtido a API key. O CometAPI oferece um preço muito mais baixo que o valor oficial para ajudar na sua integração.
Pronto para começar?→ Teste gratuito do Seedream 4.5 !
Se quiser saber mais dicas, guias e novidades sobre IA, siga‑nos no VK, X e Discord!

