Runway/gen4_image API

CometAPI
AnnaSep 13, 2025
Runway/gen4_image API

gen4_image 是 Runway 的 Gen-4 系列中旗舰级的多模态图像生成模型,支持提示生成加视觉参考(你可以“@提及”参考图像),为图像及图像→视频管线产出高度可控、风格一致的结果。

介绍 — Gen-4 Image 是什么

gen4_image 属于 Runway 的第四代视觉生成模型家族,旨在接收文本提示 + 视觉参考并生成高保真静态图像或媒体就绪帧,在不同角度与光照条件下保持身份风格。该模型是更广泛 Gen-4 套件的一部分(包括如 gen4_turbo 的视频变体),并明确面向创意生产——例如一致的角色呈现、大规模产品摄影、虚拟试穿以及游戏资产生成。

关键特性

  • 基于参考的生成(1–3 refs)。 可使用最多三张参考图像,使模型在变换姿态、光照、背景等的同时保持身份、风格或地点。
  • 高视觉保真度(可用于生产的输出)。 输出面向高分辨率(提供 1080p 选项),细节与风格控制力强。
  • 身份与场景一致性。 旨在在多次生成中保持相同角色或环境的一致性——适用于多镜头画面或以角色为核心的资产。
  • 多模态(文本 + 图像)提示。 将自然语言指令与参考图像结合,以引导构图、氛围、服装、机位等。
  • 图像→图像与文本→图像工作流。 既可进行图像到图像(编辑/变换),也可在文本到图像中使用参考以维持连续性。
  • 提供性能档位(Turbo)。 “Gen-4 Image Turbo” 变体在成本与速度上进行取舍(例如约快 ~2.5×),同时保留参考驱动特性。
  • 控制与可重现性。 典型 API 选项包括纵横比预设、分辨率(720p/1080p)、用于可重现性的种子,以及指向特定输入的参考标签。

技术细节

输入: 文本/图像

输出: 图像

工作流:

  1. 用户提供:文本提示 + 0–3 张参考图像(以及可选的掩膜、关键帧、镜头运动指令)。
  2. 预处理:对参考进行归一化与编码;文本进行标记化。提取身份/风格嵌入并缓存以便复用。
  3. 条件化:在多模态骨干中融合文本与参考嵌入;附加可选控制信号(姿态、深度、掩膜)。
  4. 采样/去噪:解码器执行去噪迭代(扩散步骤),生成图像(或用于视频的帧序列)。

gen4_image — 明确的限制

时间/运动边缘案例。 评审者与创作者报告偶发的运动伪影、异常的时间动态(在生成片段的前期/后期出现故障),以及在非常复杂的多演员编排上失败——请用你的目标场景进行测试。

计算、成本与排队。 高质量的图像→视频生成高度依赖 GPU;用户报告队列时间与每次渲染成本,在大规模生产中可能较为显著。请相应规划预算与吞吐。

与纯艺术性模型的创意取舍。 Gen-4 的优势在于一致性;如果你需要高度风格化、绘画感或“出人意料”的审美输出,Midjourney 或经过调优的 SDXL 检查点可能提供更理想的艺术方向。

典型用例

  • 前期制作与分镜设计: 根据参考照片快速生成风格一致的角色/场景变体。
  • 营销与内容生成: 快速制作主视觉、动画社媒短片与活动资产,并保持品牌角色一致性。(Runway 列举了企业案例,包括现场巡演与音乐视频。)
  • 游戏/资产原型与虚拟试穿: 基于少量参考生成多个机位角度、服装变体与环境概念。

与其他模型的比较

  • gen4_image → 最佳于需要参考/身份一致性(在不同镜头保持同一角色或对象)以及希望构建图像→视频与多镜头管线的场景。
  • DALL·E 3 → 最佳于严格的提示到图像忠实度,以及由 ChatGPT 驱动的对话式编辑流程,且内置安全/溯源能力。
  • SDXL(Stable Diffusion 家族)→ 最佳于需要开源模型、本地/自定义微调以及成本灵活部署。
  • Midjourney → 最佳于高度风格化、艺术性强的渲染,以及社区驱动的预设/“stylize” 控制。
  • Runway Gen-4 vs. ByteDance Seedream 4.0 / Google “Nano Banana” 类型模型: 近期竞品(如 Seedream 4.0)强调超快渲染与多参考处理,面向商业创作者;Runway 的优势是紧密集成的图像→视频管线与面向生产的控制,以及成熟的 API 与 SDK 生态。

如何通过 CometAPI 调用 gen4_image API

价格$0.32000

必要步骤

  • 登录 cometapi.com。若你尚未成为我们的用户,请先注册。
  • 获取接口的访问凭证 API key。在个人中心的 API token 处点击 “Add Token”,获取 token key:sk-xxxxx 并提交。
  • 获取该站点的 URL:https://api.cometapi.com/

使用方法

  1. 选择 “gen4_image” 端点发送 API 请求,并设置请求体。请求方法与请求体可从我们网站的 API 文档获取。我们的网站也提供 Apifox 测试,方便你的使用。
  2. 将 <YOUR_API_KEY> 替换为你账户中的实际 CometAPI key。
  3. 将你的问题或请求插入到 content 字段——模型将对此作出响应。
  4. . 处理 API 响应以获取生成的结果。

CometAPI 提供完全兼容的 REST API——便于无缝迁移。关键细节参见 API 文档:

  • Endpoint: https://api.cometapi.com/runwayml/v1/text_to_image
  • Model Parameter: gen4_image
  • Authentication: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \  
--header 'X-Runway-Version: 2024-11-06' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"promptText": "cat",  
"ratio": "1920:1080",  
"seed": 4294967295,  
"model": "gen4_image",  
"referenceImages": ,  
"contentModeration": {  
"publicFigureThreshold": "auto"  
}  
}'

另见 Runway/Act_two

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣