API de pista/gen4_image

CometAPI
AnnaSep 13, 2025
API de pista/gen4_image

imagen gen4 es el modelo insignia de generación de imágenes multimodales de Runway en la familia Gen-4 que admite Generación impulsada más referencias visuales (puede “@mencionar” imágenes de referencia) para producir resultados altamente controlables y estilísticamente consistentes para canales de imágenes y de imágenes→video.

Introducción — ¿qué? Imagen de 4.ª generación is

imagen gen4 es la familia de modelos generativos visuales de cuarta generación de Runway, diseñada para tomar indicaciones de texto + referencias visuales y producir imágenes fijas de alta fidelidad o fotogramas listos para medios que preservan identidad y estilo a través de ángulos e iluminación. El modelo se presenta como parte de una suite Gen-4 más amplia (que incluye variantes de video como gen4_turbo) y está diseñado explícitamente para producción creativa — por ejemplo, representación consistente de personajes, fotografía de productos a escala, prueba virtual y generación de activos de juego.

Características principales

  • Generación basada en referencias (1–3 referencias). Utilice hasta tres imágenes de referencia para que el modelo pueda conservar la identidad, el estilo o la ubicación mientras transforma la pose, la iluminación, el fondo, etc.
  • Alta fidelidad visual (resultados listos para producción). Las salidas apuntan a alta resolución (opciones de 1080p disponibles) con gran detalle y control estilístico.
  • Identidad y consistencia de escena. Diseñado para mantener la coherencia de los mismos personajes o entornos a lo largo de varias generaciones: útil para imágenes de múltiples tomas o recursos centrados en los personajes.
  • Indicaciones multimodales (texto + imágenes). Combine instrucciones en lenguaje natural con imágenes de referencia para orientar la composición, el estado de ánimo, la vestimenta, el ángulo de la cámara, etc.
  • Imagen → imagen más texto → flujos de trabajo de imagen. Funciona como imagen a imagen (editar/transformar) y como texto a imagen utilizando referencias para mantener la continuidad.
  • Nivel de rendimiento (Turbo) disponible. Una variante “Gen-4 Image Turbo” intercambia costo y velocidad (por ejemplo, ~2.5 veces más rápido) mientras conserva las funciones basadas en referencia.
  • Controles y reproducibilidad. Las opciones típicas de API incluyen ajustes preestablecidos de relación de aspecto, resolución (720p/1080p), semilla para reproducibilidad y etiquetas de referencia para señalar entradas específicas.

Detalles técnicos

Entrada: Texto / Imagen

Salidas: Imagen:

flujo de trabajo:

  1. Suministros para el usuario:mensaje de texto + 0–3 imágenes de referencia (y máscaras opcionales, fotogramas clave, instrucciones de movimiento de cámara).
  2. PreprocesoLas referencias se normalizan y codifican; el texto se tokeniza. Las incrustaciones de identidad y estilo se extraen y almacenan en caché para su reutilización.
  3. Acondicionamiento:Las incrustaciones de texto y referencia se fusionan en la estructura multimodal; se adjuntan señales de control opcionales (pose, profundidad, máscara).
  4. Muestreo/eliminación de ruido:el decodificador ejecuta iteraciones de eliminación de ruido (pasos de difusión) produciendo una imagen (o secuencia de fotogramas para vídeo).

gen4_image — límites concretos

Casos límite temporales/de movimiento. Los revisores y creadores informan sobre artefactos de movimiento ocasionales, dinámicas temporales extrañas (fallas al principio o al final de los clips generados) y fallas en coreografías multiactor muy complejas: pruebe con las escenas de destino.

Cálculo, cálculo de costes y colas. La generación de imágenes y vídeos de alta calidad requiere un uso intensivo de la GPU; los usuarios informan de tiempos de espera y un coste por renderizado que pueden ser significativos para la producción en masa. Planifique el presupuesto y el rendimiento en consecuencia.

Compensaciones creativas versus modelos puramente artísticos. La fortaleza de Gen-4 es la consistencia; si necesita resultados estéticos altamente estilizados, pictóricos o “sorprendentes”, los puntos de control Midjourney o SDXL ajustados pueden producir direcciones artísticas preferidas.

Casos de uso canónicos

  • Preproducción y storyboard: Cree rápidamente variantes de personajes/escenas con estilo consistente a partir de fotografías de referencia.
  • Marketing y generación de contenidos: Producción rápida de imágenes destacadas, clips sociales animados y recursos de campaña con personajes de marca consistentes. (Runway incluye ejemplos empresariales que incluyen giras en vivo y videos musicales).
  • Prototipado de juegos/activos y prueba virtual: generar múltiples ángulos de cámara, variantes de atuendos y conceptos de entorno a partir de un pequeño conjunto de referencias.

Comparación con otros modelos

  • gen4_image→ mejor cuando lo necesites consistencia de referencia/identidad (un solo personaje u objeto se mantiene igual en todas las tomas) y cuando lo desees imagen→video y tuberías de múltiples disparos.
  • DALL·E 3 → mejor para una fidelidad de imagen precisa y un flujo de edición conversacional impulsado por ChatGPT, además de trabajo de seguridad y procedencia integrado.
  • SDXL (familia de difusión estable) → mejor cuando desea modelos abiertos, ajustes locales/personalizados e implementación con costos flexibles.
  • A mitad de camino → mejor para representaciones altamente estilizadas y artísticamente agradables y ajustes preestablecidos / controles de "estilización" impulsados ​​por la comunidad.
  • Runway Gen-4 vs. ByteDance Seedream 4.0 / Modelos tipo "Nano Banana" de Google: Los lanzamientos recientes de la competencia (por ejemplo, Seedream 4.0) enfatizan Renderizado ultrarrápido y manejo de múltiples referencias Dirigido a creadores comerciales, la ventaja de Runway es un flujo de trabajo de imagen→video estrechamente integrado y controles orientados a la producción, además de un ecosistema API y SDK maduro.

Como llamar imagen gen4 API de CometAPI

Precio$0.32000

Pasos requeridos

  • Inicia sesión en cometapi.comSi aún no eres nuestro usuario, por favor regístrate primero.
  • Obtenga la clave API de credenciales de acceso de la interfaz. Haga clic en "Agregar token" en el token API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.
  • Obtenga la URL de este sitio: https://api.cometapi.com/

Método de uso

  1. Seleccione el punto final "gen4_image" para enviar la solicitud de API y configure el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también ofrece la prueba de Apifox para su comodidad.
  2. Reemplazar con su clave CometAPI real de su cuenta.
  3. Inserte su pregunta o solicitud en el campo de contenido: esto es lo que responderá el modelo.
  4. . Procesa la respuesta de la API para obtener la respuesta generada.

CometAPI proporciona una API REST totalmente compatible para una migración fluida. Detalles clave para  Documento API:

  • Punto final: https://api.cometapi.com/runwayml/v1/text_to_image
  • Parámetro del modelo: gen4_image
  • Autenticación: Bearer YOUR_CometAPI_API_KEY
  • Tipo de contenido: application/json .
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \  
--header 'X-Runway-Version: 2024-11-06' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"promptText": "cat",  
"ratio": "1920:1080",  
"seed": 4294967295,  
"model": "gen4_image",  
"referenceImages": ,  
"contentModeration": {  
"publicFigureThreshold": "auto"  
}  
}'

Vea también Pasarela/Acto dos

Leer Más

500+ Modelos en Una API

Hasta 20% de Descuento