Runway 发布了其全新的 AI 视频模型 Gen-4。该公司表示,该模型能够在多镜头中创建一致的场景和角色。用户在 AI 生成视频中很难讲述连贯的故事,尤其是在角色生成方面。根据 Runway 在 X 上分享的新闻稿,新的 Gen-4 将在叙事过程中为用户提供更强的连续性与控制力。

什么是 Runway Gen-4?
Runway Gen-4 是由位于纽约的初创公司 Runway AI Inc. 开发的最新一代人工智能(AI)视频生成技术。该尖端模型针对 AI 生成视频中的一大难题:在多个镜头之间保持角色、物体和场景的一致性。通过同时利用视觉线索与文本提示,Gen-4 无需进行大量训练,即可生成连贯且富有动感的视频内容。
Gen-4 带来了多项技术进步,使其有别于以往版本和竞品:
- 逼真的运动生成:该模型擅长生成具有栩栩如生运动的视频,确保平滑的转场和自然的动作,满足高质量制作的需求。
- 对真实世界物理的理解:Gen-4 在视觉生成模型模拟真实物理方面实现了重要突破,提升了生成内容的真实感。
- 达到制作级的视频质量:模型可生成 1080p 分辨率的视频,符合专业电影制作的标准。
Runway Gen4 的突破有哪些?
角色与场景一致性
Gen-4 的一大亮点是能够在多个镜头中保持角色与场景的一致性。它解决了 AI 生成视频中常见的问题,即角色和物体在不同场景之间常常出现不一致。借助 Gen-4,用户可以生成人物外观保持一致、环境稳定的视频,从而增强叙事体验。
此外,Gen-4 能以多个角度渲染场景,为创作者提供对环境与主体的全面覆盖。这一能力通过在同一段落中提供多样化视角,显著提升创作灵活性。
视频合成
Gen-4 允许用户仅用一张参考图像在多个镜头中生成一致的角色与物体。通过提供参考图像并描述期望的构图,模型可以在多个角度与语境下生成一致的输出。这一特性带来了前所未有的创作自由,支持构建具有连贯叙事的复杂场景。
提升视频的真实感与运动效果
该模型在生成高度动态且运动逼真的视频方面表现出色。它能够理解并模拟真实世界的物理规律,实现平滑的转场与栩栩如生的动作。此能力对于生成更贴近真实影像、具有更强吸引力与可信度的视频至关重要。
如何访问 Runway Gen-4?
Gen-4 面向所有付费订阅用户与企业客户开放。公司提供多种订阅方案以满足不同用户需求:
- Standard Plan:每月 $15,包含每月 625 点数、无限视频项目数量、访问 Gen-3 Alpha Turbo(Image to Video)最长 10 秒、100GB 素材存储、每个工作区最多 5 位用户。
- Pro Plan:每月 $35,包含 2,250 每月点数、Standard Plan 的全部功能、500GB 素材存储、可为 Lip Sync 和 Text-to-Speech 创建自定义语音、每个工作区最多 10 位用户。
- Unlimited Plan:每位用户每月 $95,包含 Pro Plan 的全部功能,并提供无限视频生成、每个工作区最多 10 位用户。
按年支付可享 20% 折扣。企业解决方案亦可用,价格结构可按需定制。
如何使用 Runway Gen-4?
使用 Gen-4 的流程简单直观,将用户输入与模型的高级能力结合:
- 提供参考图像:先上传一张你希望在视频中保持一致的角色或物体的参考图像。
- 输入文本提示:用清晰简洁的语言描述期望的构图、场景或动作。例如:“一位女性在日落时分走过繁忙的城市街道。”
- 配置相机控制(可选):Gen-4 提供高级相机控制功能,允许指定变焦(zoom)、平移(pan)、俯仰(tilt)和滚转(roll)等运动。调节这些设置可增强视频的动感。
- 生成视频:设置完成后启动生成流程。Gen-4 将根据你的要求生成视频,并在全程保持一致性与真实感。
- 审阅与微调:生成后对视频进行审阅,通过调整提示或设置来达到理想效果。
如何实现逼真的运动与场景覆盖?
借助 Runway Gen-4 的高级 AI 能力,可生成动态、逼真的视频。以下是充分发挥 Gen-4 潜力的方法:
提供详细的场景描述: 开始时输入全面的文本描述,包括环境、光照、动作及你希望呈现的特定元素。详尽的提示有助于 Gen-4 生成符合创作愿景的场景。
加入参考图像: 为角色、物体或场景提供参考图像,作为视觉线索,帮助 Gen-4 在不同镜头中保持一致性并准确呈现所需元素。
利用多角度生成: Gen-4 支持从多个视角与位置重生成场景。通过在提示中指定不同机位或视角,可实现对同一场景的全面覆盖。
确保镜头间一致性: 在不同场景中使用相同的参考图像与风格描述。Gen-4 擅长保持独特的风格、氛围与电影化元素,确保视觉叙事的连贯性。
利用真实物理模拟: Gen-4 旨在模拟真实世界物理,有助于生成自然的运动与交互,从而提升视频的真实感。
迭代并优化: 审阅生成结果,并按需优化提示或参考材料。通过迭代调整获得理想的真实感与场景覆盖效果。
面向开发者:API 访问
CometAPI 提供远低于官方价格的方案,帮助你集成 Runway Gen-4 API,并且注册登录后你的账户将获得 $1!欢迎注册体验 CometAPI。
CometAPI 作为多个领先 AI 模型 API 的集中枢纽,无需分别对接多个 API 提供商。
详情请参阅 Runway Gen-3 Alpha API 和 Runway Gen-4 API。
结论
通过合理结合详细的文本提示与相关参考图像,并利用 Gen-4 的多角度与物理模拟特性,你可以创作出运动逼真、场景覆盖全面、契合创作目标的视频。
