Luma AI 亮相 Ray3,該公司稱其為下一代生成視頻模型,是業界第一個具有推理能力(Luma 稱之為“推理”)的視頻模型,也是第一個原生製作工作室級高動態範圍(HDR)視頻的模型,包括可導出的 10 位、12 位和 16 位 ACES/EXR 母版,用於專業管道。
Ray3 不僅能夠理解語言和視覺訊息,還能評估自身的生成結果,以確保更精準的創意執行。它也是首個能夠產生工作室級 HDR 影片的 AI 模型,支援高達 16 位元的高動態範圍輸出,從而實現更豐富的細節和色彩保留。
Ray3 的承諾
Ray3 旨在連結創意與製作。 Luma 表示,Ray3 並非將提示直接映射到像素,而是將創意簡報分解為多個步驟(概念 → 鏡頭 → 運動 → 燈光 → 渲染),產生中間註釋/註解,並在每個步驟中驗證空間和時間的一致性——在預可視化和渲染過程中,它實際上就像一個自動化的創意夥伴。這個「推理」層是 Luma 宣傳的核心:它讓模型能夠解決問題、完善草稿,並產生更可預測、更易於生產的結果。
主要技術要求包括:
- 原生 HDR 高達 16 位元 (也支援 10 位元和 12 位元工作流程)具有 EXR 匯出功能,可用於 VFX/後製流程。
- 第一個產生色彩豐富的專業級 HDR 影片的 AI。
- Ray3是世界上第一個「推理」影片模型,具有理解和思考的能力。
- Hi-Fi 擴散通道:一個兩階段流程,探索快速、低成本的草稿,並將最佳鏡頭升級為 4K HDR「Hi-Fi」母版。
- 草稿模式 快速構思:Luma 表示草案最多 速度快 5 倍,價格便宜 5 倍,在進行高保真渲染之前可以進行更多次迭代。
- 視覺註釋:創作者可以直接在框架上繪圖(箭頭、草圖、標記),Ray3 會將這些塗鴉解釋為動作、攝影機阻擋和編排——而無需文字提示。
- 高級支援 物理模擬、人群/角色一致性、逼真的運動模糊、互動式照明和反射,針對工作室工作流程。
Ray3 能夠理解創作者的意圖,並逐步建立複雜的場景和動作。 Ray3 將多模態推理與生產級輸出格式結合。該模型不僅僅是將提示映射到像素,還可以規劃連貫的場景,對草稿進行自我判斷和改進,並在生成過程中不斷優化結果,直至達到品質標準——Luma 將這一功能定義為「推理」或具有推理能力的視訊生成。
Ray3 提供可用於生產的保真度,支援高速運動、結構保存、實體模擬、場景探索、複雜人群動畫、互動式照明、焦散、運動模糊、逼真的圖形和詳細的表現,提供可用於高端創意製作流程的視訊輸出。
如何融入實際工作流程
Luma 將 Ray3 定位為工作室級產品:原生 HDR 和 EXR 匯出表示產生的素材可以匯入 Nuke/Resolve/After Effects 時間軸進行調色和合成,而「草稿模式」則可在將渲染預算交給 Hi-Fi 大師之前加快創意探索速度。該模式可在 Luma 的 Dream Machine 網頁版和 iOS 應用程式中使用,並且 Luma 已宣布與 Adobe Firefly 合作,將 Ray3 整合到其他創意套件中(Adobe Firefly 整合與 Luma 的發布同時宣布)。早期報道指出,Ray3 的素材長度最多可達 ~10秒 是目前演示中使用的實際輸出長度。
該公司還為需要大量生成、協作和整合到資源管線的工作室提供 Ray3 API 和團隊/工作區功能。 Luma 的定價頁面上列出了定價等級(包括包含有限草稿的免費等級)。
實際限制和需要注意的問題
- 剪輯長度和複雜度:目前的演示和合作夥伴的寫作重點關注非常短的電影剪輯(在某些整合中長達 10 秒左右),因此較長的敘事場景仍然需要拼接和編輯工作。
- 整合與控制:雖然 Ray3 的 EXR/16 位元輸出專為後製工作流程而設計,但工作室需要清晰的防護措施和對素材的確定性控制(例如,不同鏡頭中身體/臉部的一致性、IP 的使用、素材來源)。迄今為止的報導強調了其強大的功能,但也提及了常見的製作品質保證需求。
- 道德和法律考慮:與其他生成工具一樣,採用 Ray3 也引發了關於訓練資料、版權以及 AI 生成資產的歸屬和授權方式的問題;這些爭論通常發生在重大發布之後,並將影響工作室對 Ray3 的採用。 (產業媒體已開始報告 Ray3 的商業合作條款和上市時間。)
為什麼這很重要——技術和創造性的突破
Ray3 有兩個功能與早期的文字轉影片和生成影片模型不同:
- 工作室級 HDR 輸出: 先前的型號通常產生 SDR 或轉換後的近似值;Ray3 原生的 10/12/16 位元 HDR 生成和 EXR 導出功能,透過保留調色和視覺特效所需的擴展色彩和亮度信息,消除了專業應用的一大障礙。這種相容性使得輸出可以直接進入高階後製流程。
- 視覺敘事的推理/推理: Luma 將 Ray3 定位為能夠 原因 場景的智慧化(規劃動作、維護角色和物理一致性、審查草稿並重試),提高了單次生成可用於生產環境的可能性。這減少了手動清理工作,並加快了複雜多步驟場景的迭代速度。
產業觀察家指出,與 Adobe 的合作意義重大,顯示第三方創意平台已準備好向廣大用戶群提供更高保真度的生成影片模型。 Firefly 的早期整合讓更廣泛的創意社群能夠直接在現有的設計工作流程中嘗試 Ray3。
入門
CometAPI 是一個統一的 API 平台,它將來自領先供應商的 500 多個 AI 模型(例如 OpenAI 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。
首先,探索 亮度射線2 的能力 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。
最新的 Ray3 整合即將在 CometAPI 上線,敬請期待! Ray3 上傳工作即將完成,歡迎前往「模型」頁面探索其他模型,或在 AI Playground 中試用。準備好了嗎? → 立即註冊 CometAPI !
結論
Ray3 代表了 Luma AI 的明確推動,即將生成影片從新穎的演示轉移到工作室工具鏈中——結合了新穎的「推理」架構(迭代規劃和自我修正)、快速起草工作流程,以及 原生 16 位元 HDR 輸出 旨在用於後製。它可在 Dream Machine 上立即使用,並與 Adobe Firefly 等集成,使其成為 2025 年最重要的生成影片發布之一;它是否會重塑製作習慣,將取決於剪輯長度的縮放、較長序列的可靠性,以及工作室將其融入現有視覺特效和剪輯流程的速度。


