imagen gen4 es el modelo insignia de generación de imágenes multimodales de Runway en la familia Gen-4 que admite Generación impulsada más referencias visuales (puede “@mencionar” imágenes de referencia) para producir resultados altamente controlables y estilísticamente consistentes para canales de imágenes y de imágenes→video.
Introducción — ¿qué? Imagen de 4.ª generación is
imagen gen4 es la familia de modelos generativos visuales de cuarta generación de Runway, diseñada para tomar indicaciones de texto + referencias visuales y producir imágenes fijas de alta fidelidad o fotogramas listos para medios que preservan identidad y estilo a través de ángulos e iluminación. El modelo se presenta como parte de una suite Gen-4 más amplia (que incluye variantes de video como gen4_turbo) y está diseñado explícitamente para producción creativa — por ejemplo, representación consistente de personajes, fotografía de productos a escala, prueba virtual y generación de activos de juego.
Características principales
- Generación basada en referencias (1–3 referencias). Utilice hasta tres imágenes de referencia para que el modelo pueda conservar la identidad, el estilo o la ubicación mientras transforma la pose, la iluminación, el fondo, etc.
- Alta fidelidad visual (resultados listos para producción). Las salidas apuntan a alta resolución (opciones de 1080p disponibles) con gran detalle y control estilístico.
- Identidad y consistencia de escena. Diseñado para mantener la coherencia de los mismos personajes o entornos a lo largo de varias generaciones: útil para imágenes de múltiples tomas o recursos centrados en los personajes.
- Indicaciones multimodales (texto + imágenes). Combine instrucciones en lenguaje natural con imágenes de referencia para orientar la composición, el estado de ánimo, la vestimenta, el ángulo de la cámara, etc.
- Imagen → imagen más texto → flujos de trabajo de imagen. Funciona como imagen a imagen (editar/transformar) y como texto a imagen utilizando referencias para mantener la continuidad.
- Nivel de rendimiento (Turbo) disponible. Una variante “Gen-4 Image Turbo” intercambia costo y velocidad (por ejemplo, ~2.5 veces más rápido) mientras conserva las funciones basadas en referencia.
- Controles y reproducibilidad. Las opciones típicas de API incluyen ajustes preestablecidos de relación de aspecto, resolución (720p/1080p), semilla para reproducibilidad y etiquetas de referencia para señalar entradas específicas.
Detalles técnicos
Entrada: Texto / Imagen
Salidas: Imagen:
flujo de trabajo:
- Suministros para el usuario:mensaje de texto + 0–3 imágenes de referencia (y máscaras opcionales, fotogramas clave, instrucciones de movimiento de cámara).
- PreprocesoLas referencias se normalizan y codifican; el texto se tokeniza. Las incrustaciones de identidad y estilo se extraen y almacenan en caché para su reutilización.
- Acondicionamiento:Las incrustaciones de texto y referencia se fusionan en la estructura multimodal; se adjuntan señales de control opcionales (pose, profundidad, máscara).
- Muestreo/eliminación de ruido:el decodificador ejecuta iteraciones de eliminación de ruido (pasos de difusión) produciendo una imagen (o secuencia de fotogramas para vídeo).
gen4_image — límites concretos
Casos límite temporales/de movimiento. Los revisores y creadores informan sobre artefactos de movimiento ocasionales, dinámicas temporales extrañas (fallas al principio o al final de los clips generados) y fallas en coreografías multiactor muy complejas: pruebe con las escenas de destino.
Cálculo, cálculo de costes y colas. La generación de imágenes y vídeos de alta calidad requiere un uso intensivo de la GPU; los usuarios informan de tiempos de espera y un coste por renderizado que pueden ser significativos para la producción en masa. Planifique el presupuesto y el rendimiento en consecuencia.
Compensaciones creativas versus modelos puramente artísticos. La fortaleza de Gen-4 es la consistencia; si necesita resultados estéticos altamente estilizados, pictóricos o “sorprendentes”, los puntos de control Midjourney o SDXL ajustados pueden producir direcciones artísticas preferidas.
Casos de uso canónicos
- Preproducción y storyboard: Cree rápidamente variantes de personajes/escenas con estilo consistente a partir de fotografías de referencia.
- Marketing y generación de contenidos: Producción rápida de imágenes destacadas, clips sociales animados y recursos de campaña con personajes de marca consistentes. (Runway incluye ejemplos empresariales que incluyen giras en vivo y videos musicales).
- Prototipado de juegos/activos y prueba virtual: generar múltiples ángulos de cámara, variantes de atuendos y conceptos de entorno a partir de un pequeño conjunto de referencias.
Comparación con otros modelos
- gen4_image→ mejor cuando lo necesites consistencia de referencia/identidad (un solo personaje u objeto se mantiene igual en todas las tomas) y cuando lo desees imagen→video y tuberías de múltiples disparos.
- DALL·E 3 → mejor para una fidelidad de imagen precisa y un flujo de edición conversacional impulsado por ChatGPT, además de trabajo de seguridad y procedencia integrado.
- SDXL (familia de difusión estable) → mejor cuando desea modelos abiertos, ajustes locales/personalizados e implementación con costos flexibles.
- A mitad de camino → mejor para representaciones altamente estilizadas y artísticamente agradables y ajustes preestablecidos / controles de "estilización" impulsados por la comunidad.
- Runway Gen-4 vs. ByteDance Seedream 4.0 / Modelos tipo "Nano Banana" de Google: Los lanzamientos recientes de la competencia (por ejemplo, Seedream 4.0) enfatizan Renderizado ultrarrápido y manejo de múltiples referencias Dirigido a creadores comerciales, la ventaja de Runway es un flujo de trabajo de imagen→video estrechamente integrado y controles orientados a la producción, además de un ecosistema API y SDK maduro.
Como llamar imagen gen4 API de CometAPI
| Precio | $0.32000 |
Pasos requeridos
- Inicia sesión en cometapi.comSi aún no eres nuestro usuario, por favor regístrate primero.
- Obtenga la clave API de credenciales de acceso de la interfaz. Haga clic en "Agregar token" en el token API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.
- Obtenga la URL de este sitio: https://api.cometapi.com/
Método de uso
- Seleccione el punto final "gen4_image" para enviar la solicitud de API y configure el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también ofrece la prueba de Apifox para su comodidad.
- Reemplazar con su clave CometAPI real de su cuenta.
- Inserte su pregunta o solicitud en el campo de contenido: esto es lo que responderá el modelo.
- . Procesa la respuesta de la API para obtener la respuesta generada.
CometAPI proporciona una API REST totalmente compatible para una migración fluida. Detalles clave para Documento API:
- Punto final:
https://api.cometapi.com/runwayml/v1/text_to_image - Parámetro del modelo:
gen4_image - Autenticación:
Bearer YOUR_CometAPI_API_KEY - Tipo de contenido:
application/json.
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \
--header 'X-Runway-Version: 2024-11-06' \
--header 'Authorization: {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{
"promptText": "cat",
"ratio": "1920:1080",
"seed": 4294967295,
"model": "gen4_image",
"referenceImages": ,
"contentModeration": {
"publicFigureThreshold": "auto"
}
}'
Vea también Pasarela/Acto dos
