Luma AI 发布 Ray3: 全球首个“具备推理能力”的视频模型

CometAPI
AnnaSep 18, 2025
Luma AI 发布 Ray3: 全球首个“具备推理能力”的视频模型

Luma AI 发布了 Ray3,这是一款新一代生成式视频模型,号称业界首个具备推理能力(Luma 将其称为“reasoning”)的视频模型——也是首个能够原生生成影棚级高动态范围(HDR)视频的模型,支持导出可用于专业流程的 10、12 和 16 位 ACES/EXR 母版。

Ray3 不仅理解语言和视觉信息,还会自评生成结果,以确保更准确的创意执行。它也是首个能够生成影棚级 HDR 视频的 AI 模型,支持最高 16 位高动态范围输出,以保留更多细节与色彩。

Ray3 的承诺

Ray3 旨在打通创意构思与落地制作。不同于将提示词直接映射为像素,Luma 将 Ray3 描述为把创意简报拆解为多个步骤(概念 → 镜头 → 运动 → 光照 → 渲染),在每一步生成中间笔记/标注并验证空间与时间一致性——在预可视化与渲染阶段等同于一个自动化的创意伙伴。这一“推理”层是 Luma 叙述的核心:它让模型能够修正问题、打磨草稿,并产出更可预测、可用于生产的结果。

主要技术主张包括:

  • 原生 HDR 高达 16 位(亦支持 10 位与 12 位工作流),并提供面向 VFX/后期流程的 EXR 导出。
  • 首个可生成专业级 HDR 视频且具备丰富色彩的 AI。
  • Ray3 是全球首个“推理”视频模型,具备理解与思考能力。
  • Hi-Fi diffusion pass:两阶段流程,先低成本快速探索草稿,再将最佳版本升级为 4K HDR 的 “Hi-Fi” 母版。
  • Draft Mode 用于快速构思:Luma 称草稿模式最多快 5× 且便宜 5×,使在投入高保真渲染前能进行更多迭代。
  • 可视化标注:创作者可直接在帧上绘制(箭头、草图、标记),Ray3 会将这些涂鸦解读为运动、镜头/机位调度与走位编排——无须文本提示。
  • 面向影棚工作流的高级支持:包含物理模拟、群体/角色一致性、真实的运动模糊、交互式光照与反射等。

Ray3 能理解创作者意图,并按步骤构建复杂场景与动作。Ray3 将多模态推理与面向生产的输出格式结合起来。不同于仅把提示词映射为像素,该模型可以规划连贯场景,草稿会自我评估并迭代优化,并在生成过程中持续打磨直至达到质量标准——Luma 将这种能力定位为“推理”或具备推理能力的视频生成。

Ray3 提供达产就绪的保真度,支持高速运动、结构保真、物理模拟、场景探索、复杂群体动画、交互式光照、焦散、运动模糊、真实图形与细节呈现,输出的视频可直接进入高端创意制作流水线。

在真实工作流中的适配

Luma 将 Ray3 定位为影棚就绪:原生 HDR 与 EXR 导出意味着生成素材可直接放入 Nuke/Resolve/After Effects 的时间线进行调色与合成,而 Draft Mode 则能在投入 Hi-Fi 母版渲染预算前加速创意探索。该模型已在 Luma 的 Dream Machine 网页与 iOS 应用上线,同时 Luma 宣布了将 Ray3 引入其他创作套件的合作(与 Adobe Firefly 的集成在 Luma 发布时同步宣布)。早期报道指出,在演示中实际使用的输出长度目前约为 ~10 秒

公司还提供 Ray3 API 以及团队/工作区功能,便于影棚进行批量生成、协作与资产流程集成。定价层级(包括带有限草稿的免费层)列在 Luma 的定价页面。

实际限制与关注点

  • 片段长度与复杂度:当前演示与合作方报道聚焦于很短的电影化片段(在部分集成中大约至 ~10 秒),更长的叙事场景仍需要拼接与剪辑工作。
  • 集成 vs. 控制:尽管 Ray3 的 EXR/16 位输出面向后期流程,影棚仍需要明确的边界与确定性控制(跨镜一致的身体/面部一致性、对 IP 的使用、素材溯源)。目前的报道强调能力出众,同时也提示常见的制作 QA 需求。
  • 伦理与法律考量:和其他生成式工具一样,采用过程中会涉及训练数据、版权,以及如何对 AI 生成资产进行署名与授权;这些讨论通常伴随重大发布而来,并将影响影棚对 Ray3 的采用方式。(业内媒体已开始报道商业合作条款与可用窗口期。)

重要性所在——技术与创作层面的突破

两项能力让 Ray3 有别于早期文生视频与生成式视频模型:

  1. 影棚级 HDR 输出: 以往模型通常只生成 SDR 或经转换的近似;Ray3 原生支持 10/12/16 位 HDR 生成与 EXR 导出,消除专业采纳的一大障碍,保留调色与 VFX 所需的扩展色彩与亮度信息。正是这种兼容性使其输出能够直接进入高端后期流水线。
  2. 用于视觉叙事的推理能力: Luma 将 Ray3 定位为能够对场景进行“推理”的模型(规划运动、保持角色与物理一致性、自评草稿并重试),提高单次生成可用于制作的概率,从而减少手工清理,加速复杂多步骤场景的迭代。

业内观察者指出,与 Adobe 的合作显示第三方创作平台已准备好向大量用户提供并呈现更高保真的生成式视频模型。Firefly 的早期集成让更广泛的创意群体能在既有设计工作流中直接试用 Ray3。

入门

CometAPI 是一个统一的 API 平台,将来自 OpenAI 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等领先提供商的 500 多个 AI 模型聚合到单一、对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理,CometAPI 大幅简化了将 AI 能力集成到应用中的过程。无论你在构建聊天机器人、图像生成器、音乐创作工具,还是数据驱动的分析应用,CometAPI 都能帮助你更快迭代、控制成本、保持供应商中立,同时紧跟 AI 生态的最新突破。

开始之前,可在 luma ray2Playground 中探索其能力,并查阅 API 指南 获取详细说明。访问前请确保已登录 CometAPI 并获取 API key。CometAPI 提供远低于官方价的价格,帮助你完成集成。

最新的 Ray3 集成即将登陆 CometAPI,敬请期待!在我们完善 Ray3 集成期间,欢迎在 Models 页面探索其他模型,或在 AI Playground 中试用。准备好开始了吗?→ 立即注册 CometAPI

结论

Ray3 体现了 Luma AI 将生成式视频从新奇演示推向影棚工具链的明确方向——结合新颖的“推理”架构(迭代规划与自我纠错)、快速草稿工作流,以及面向后期的原生 16 位 HDR 输出。其在 Dream Machine 的即时可用与 Adobe Firefly 等集成,使其成为 2025 年更具影响力的生成式视频发布之一;它能否重塑制作习惯,取决于片段长度的扩展能力、在更长序列上的可靠性,以及影棚将其纳入既有 VFX 与剪辑流程的速度。

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣