Cómo usar la API de Seedgream 4.5

CometAPI
AnnaDec 9, 2025
Cómo usar la API de Seedgream 4.5

Seedream 4.5 es la evolución más reciente de la familia Seedream de modelos de texto a imagen / edición de imágenes (desarrollados bajo Byte/BytePlus research). Se está desplegando en endpoints oficiales de BytePlus y múltiples plataformas de terceros —incluyendo acceso integrado mediante gateways multimodelo como CometAPI— y aporta una mayor consistencia del sujeto, mejor tipografía/renderizado de texto y mayor fidelidad en edición multiimagen.

Este artículo es una guía práctica y profesional para usar la API de Seedream 4.5. Obtendrás pasos de configuración, patrones de autenticación y solicitud, buenas prácticas de prompts y parámetros, flujos de edición y multiimagen, manejo de errores, patrones de despliegue y consideraciones legales/de seguridad.

¿Qué es Seedream 4.5?

Seedream 4.5 es la última iteración de la familia Seedream: un modelo multimodal de generación y edición de imágenes diseñado para creación de texto a imagen de alta fidelidad y edición de imágenes con comprensión del contexto (imagen a imagen, edición con múltiples referencias, inpainting/outpainting, tipografía y manejo de texto denso). En comparación con versiones anteriores de Seedream, 4.5 se centra en mejorar la consistencia del sujeto en flujos multiimagen, una preservación más estricta de los detalles de referencia, mayor fidelidad tipográfica (texto en imágenes) y mejor calidad de salida hasta 4K/ultra-HD en los ajustes de “alta calidad”. Estas mejoras son fruto de una arquitectura escalada y de un ajuste de prompts/heurísticas del motor actualizados.

Por qué importa: 4.5 está construido intencionalmente para manejar tareas creativas profesionales —variaciones de producto por lotes, ediciones multiimagen coherentes con la marca y recursos de impresión de alta resolución—, a la vez que habilita un control más fino con imágenes de referencia y operaciones de edición especializadas.

Capacidades principales

  • Generación de texto a imagen (individual y por lotes): genera de 1 a 15 imágenes por llamada de API, con modos de calidad seleccionables (Basic vs High) que equilibran velocidad y resolución.
  • Edición de imágenes (i2i / inpainting / outpainting): usa una o más imágenes de referencia; preserva detalles y relaciones espaciales entre múltiples referencias.
  • Mezcla multi-referencia y copia de elementos: se pueden usar hasta ~10 imágenes de referencia en un solo trabajo para trasplantar elementos manteniendo la coherencia de iluminación/perspectiva.
  • Alto rendimiento tipográfico/texto denso: mejor manejo de imágenes con texto o señalética (útil para maquetas, etiquetas de producto, capturas de UI).
  • Streaming/salida progresiva: algunos endpoints de despliegue admiten resultados en streaming para que los clientes reciban resultados parciales mientras continúa la generación.

¿Cómo uso la API de Seedream 4.5 a través de CometAPI?

A continuación se muestra un recorrido práctico, listo para copiar y pegar, para generar imágenes mediante CometAPI (un agregador que expone el modelo Seedream 4.5 como un parámetro de modelo). Usa CometAPI cuando quieras una sola clave de API para acceder a docenas/centenares de modelos y una interfaz REST estable y fácil de integrar. La documentación de CometAPI muestra el alias de modelo doubao-seedream-4-5-251128 y un endpoint estándar de generación de imágenes.

Pasos de alto nivel

  1. Regístrate en CometAPI y obtén una clave de API.
  2. Usa el endpoint de generación de imágenes (POST https://api.cometapi.com/v1/images/generations) con el parámetro model establecido en el identificador de Seedream 4.5 (ejemplo: doubao-seedream-4-5-251128).
  3. Incluye el prompt, imágenes de referencia opcionales (URLs o cargas multipart según el agregador), tamaño/calidad de salida y otros parámetros.
  4. Recibirás una respuesta JSON que contiene URLs de las imágenes generadas (o base64) y metadatos.

Tipos de solicitud y modos

Seedream 4.5 admite comúnmente:

  • Texto → Imagen (prompts de texto → imágenes nuevas)
  • Imagen → Imagen (imágenes de referencia + prompts para transformaciones estilizadas)
  • Edición de imagen / Inpainting (máscara + instrucciones de edición para cambios específicos)
    Las API alojadas admiten modos de tareas asíncronas (enviar trabajo → consultar con taskId) que encajan con renders de larga duración y flujos por lotes. Los enlaces generados suelen tener tiempo limitado (p. ej., válidos durante 24 horas en algunos gateways), así que planifica su almacenamiento/exportación.

Ejemplo con curl (texto a imagen, un solo prompt)

curl -X POST "https://api.cometapi.com/v1/images/generations" \
  -H "Authorization: Bearer COMETAPI_KEY_GOES_HERE" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedream-4-5-251128",
    "prompt": "A cinematic portrait of a cyberpunk fox in neon rain, 4k, detailed lighting, film grain",
    "n": 3,
    "width": 2048,
    "height": 2048,
    "quality": "high",     # or "basic"
    "seed": 12345,
    "style": "photorealistic"
  }'

Notas

  • Sustituye COMETAPI_KEY_GOES_HERE por tu clave de CometAPI.
  • El parámetro n genera múltiples variaciones en una sola llamada (ahorra sobrecarga).
  • quality: "high" normalmente se corresponde con mayor resolución / mayor coste computacional (a menudo compatible con 4K).

Ejemplo en Python con requests (texto a imagen + guardado de resultados)

import requests, base64, os

API_URL = "https://api.cometapi.com/v1/images/generations"
API_KEY = os.environ.get("COMETAPI_KEY")  # set env var for safety

payload = {
  "model": "doubao-seedream-4-5-251128",
  "prompt": "Studio shot of a ceramic mug on a wooden table, warm natural light, ultra-detailed, 2k",
  "n": 2,
  "width": 1024,
  "height": 1024,
  "quality": "basic"
}

resp = requests.post(API_URL, json=payload, headers={
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
})
resp.raise_for_status()
data = resp.json()

# Example: each item has 'b64_json' or 'url' depending on provider
for i, item in enumerate(data.get("data", [])):
    img_b64 = item.get("b64_json")
    if img_b64:
        img_bytes = base64.b64decode(img_b64)
        with open(f"seedream_result_{i}.png", "wb") as f:
            f.write(img_bytes)
    else:
        print("Image URL:", item.get("url"))

¿Por qué este patrón? Los agregadores suelen devolver un payload base64 o URLs hospedadas; el código maneja ambos. El endpoint normalmente devolverá un task_id. Consulta el endpoint GET /tasks/{task_id} hasta que el estado sea succeeded y luego descarga el resultado. Muchos proveedores incluyen SDKs con utilidades integradas para este patrón.

¿Cómo optimizar la calidad de imagen y mantener el texto legible?

  1. Usa imágenes de referencia para mantener el contexto y la concordancia de color.
  2. Especifica la tipografía explícitamente en el prompt (familia tipográfica, grosor, alineación) y considera añadir el texto exacto como una superposición en un segundo paso para asegurar la legibilidad.
  3. Ejecuta un proceso en dos pasos: (a) genera la composición base; (b) vuelve a renderizar o edita en una segunda pasada centrándote en primeros planos o áreas con etiquetas a mayor resolución.

¿Cómo escribir prompts para Seedream 4.5?

Principios de ingeniería de prompts

  • Sé explícito: enumera sujeto, acción, estilo, lente/cámara, hora del día y paleta de colores deseada.
  • Usa anclas de identidad: si necesitas la misma cara/objeto en varias imágenes, incluye descriptores persistentes (p. ej., “la misma mujer con pelo corto y ondulado, chaqueta verde, cicatriz en la ceja izquierda”) y aporta de 1 a 3 imágenes de referencia. La fusión multi-referencia de Seedream 4.5 ha mejorado, pero las anclas ayudan.
  • Prompts negativos: indica explícitamente qué evitar (p. ej., “sin texto”, “sin marcas de agua”, “sin extremidades extra”).
  • Híbrido corto + largo: da una instrucción corta canónica y luego amplíala con algunas líneas de detalle y restricciones.

Plantillas de prompts de ejemplo

Toma hero de producto (fotorrealista): "Una toma de producto limpia de un altavoz inalámbrico negro mate colocado sobre una mesa blanca, iluminación de softbox, 50 mm, poca profundidad de campo, fondo de estudio, fotorrealista, sin texto"

Ilustración de fantasía (estilizada): "Paisaje de fantasía épico, un castillo de vidrio encaramado en un acantilado, hora dorada, niebla volumétrica, estilo pictórico, muy detallado, concept art"

Edición de imagen (eliminar objeto) : "Elimina a la persona de la izquierda y extiende el fondo para llenar el espacio, mantén la iluminación consistente, sin artefactos"

Mockup con tipografía predominante: "Maqueta de pantalla de aterrizaje de app móvil en un iPhone 14, con el texto 'Lanzar ahora' en Gotham Bold, haz que el botón sea verde y mantén sombras suaves"

Retrato de personaje: "Retrato heroico de una guerrera, iluminación de contorno cinematográfica, lente de retrato 85 mm, textura de piel ultra detallada, pecas naturales, armadura de cuero, fondo neutro, fotorrealista."

Prompts con múltiples imágenes y referencias

Al usar edición multiimagen, especifica qué imagen de referencia corresponde a qué parte del prompt. Seedream 4.5 mejora al identificar el sujeto principal entre múltiples referencias, pero ser explícito (p. ej., “usa image_1 para el rostro, image_2 para la textura de la ropa”) produce mejores resultados.

Selección de salida y posprocesado

  • Genera N variantes y aplica filtros objetivos: puntuación de similitud facial, comparación de histograma de color, OCR tipográfico para verificar la exactitud del texto.
  • Automatiza umbrales de control de calidad para derivar salidas bajo el umbral a retoque manual.
  • Delega la tipografía final a herramientas de maquetación si necesitas texto al píxel: usa el modelo para fondos e imágenes, luego compón el texto preciso en postproducción. Esto reduce la necesidad de depender de la fidelidad tipográfica del modelo en activos de marketing.

¿Cómo realizar edición de imagen, inpainting y composición multiimagen?

Flujo de trabajo de edición de imágenes

  1. Sube las imágenes de referencia al proveedor o envíalas inline en la solicitud.
  2. Proporciona una máscara (imagen binaria) para inpainting o una anotación delimitadora para ediciones dirigidas.
  3. Envía un prompt de edición que aclare qué regiones cambiar y cuáles preservar.

Muchas APIs admiten modos de edición de imagen única y composición multiimagen; 4.5 está ajustado explícitamente para preservar la identidad del sujeto y mejorar la consistencia multiimagen.

Ejemplo: payload de inpainting (seudocódigo JSON)

{
  "model": "seedream-4.5",
  "mode": "image_edit",
  "image_url": "https://.../original.png",
  "mask_url": "https://.../mask.png",
  "prompt": "Replace background with a sunset beach — keep subject untouched, maintain original lighting on subject",
  "guidance": 9,
  "steps": 40
}

Consejos para una edición multiimagen consistente

  • Usa la misma semilla para renders relacionados y mantener la consistencia entre fotogramas.
  • Mantén coherentes los descriptores de cámara en los prompts (p. ej., “85 mm retrato, softbox, 3/4”) para conservar la consistencia del punto de vista.
  • Al editar rostros, solicita cláusulas de preservación de gran detalle (“preservar la estructura facial, cambiar solo el color del cabello”) para reducir la deriva de identidad.

¿Cuáles son las mejores prácticas al usar Seedream 4.5

¿Cómo solucionar problemas comunes?

Aquí tienes pasos prácticos de solución de problemas cuando los resultados no son los esperados:

Rostros borrosos / detalles incorrectos

Aumenta la especificidad del prompt para detalles faciales (edad, expresión, iluminación), aporta imágenes de referencia de mayor calidad o prueba una instrucción explícita de “preservar rostro” y reduce la strength de edición para mantener más del original. Seedream 4.5 mejora el realismo facial, pero las entradas siguen importando.

El texto es ilegible o está distorsionado

Proporciona texto vectorial o raster como una superposición por separado si necesitas tipografía al píxel; de lo contrario, usa configuraciones de mayor resolución e instrucciones de estilo explícitas como “renderizar texto legible: sí”. 4.5 mejora el manejo de texto denso respecto a versiones anteriores, pero la perfección tipográfica puede requerir composición en post.

Iluminación o composición inconsistente en lotes

Utiliza un prompt con plantilla con menciones fijas de iluminación/cámara o genera dentro de una sola llamada por lotes para aumentar la consistencia. BytePlus y CometAPI proporcionan patrones de inferencia por lotes por ese motivo.

Notas finales y próximos pasos

Seedream 4.5 es un modelo de imágenes maduro y orientado a producción, con mejoras explícitas dirigidas a flujos creativos reales: mejor consistencia, texto y rostros mejorados y soporte multi-referencia. Usa CometAPI u otros agregadores cuando quieras experimentar rápidamente y tener flexibilidad multimodelo.

Los desarrolladores pueden acceder a la API de [Seedream 4.5](http://Seedream 4.5) a través de CometAPI; la versión más reciente del modelo se mantiene siempre actualizada con el sitio oficial. Para comenzar, explora las capacidades del modelo en el Playground y consulta la guía de la API para instrucciones detalladas. Antes de acceder, asegúrate de haber iniciado sesión en CometAPI y de haber obtenido la clave de API. CometAPI ofrece un precio muy inferior al oficial para ayudarte a integrar.

¿Listo para empezar?→ Free trial of Seedream 4.5 !

Si quieres conocer más consejos, guías y noticias sobre IA, síguenos en VK, X y Discord!

SHARE THIS BLOG

500+ Modelos en Una API

Hasta 20% de Descuento