即將推出

D

Doubao-Seedance-2-pro

輸入:$60/M
輸出:$240/M
即將推出;Seedance 2.0 是 ByteDance 的新一代多模態影片基礎模型,聚焦於具電影感的多鏡頭敘事影片生成。不同於單鏡頭的文字轉影片示範,Seedance 2.0 著重於基於參考的控制(圖片、短片、音訊)、跨鏡頭的角色與風格的一致與連貫性,以及原生的影音同步—旨在讓 AI 影片可用於專業創意與前期視覺化工作流程。
商業用途

Seedance 2.0 的技術規格

項目Seedance 2.0(公開報導)
模型家族Seedance(ByteDance/Seed 模型家族)。
輸入類型多模態:文字提示、參考圖片、短參考影片片段與音訊(一次請求可結合多種類型)。
輸出類型影片(支援原生音訊 — 音訊與影片聯合生成),單一鏡頭或多鏡頭序列。
典型解析度公開資料強調 1080p(Full HD)輸出;以 1080p 作為基準輸出品質。
典型片段長度據報導的生成長度通常為每次作業 ~5–60 秒(可透過拼接/參考序列獲得更長的多鏡頭輸出)。
主要使用情境創意製作(廣告、短片)、電影/遊戲的預視化、行銷內容、自動化剪輯/延展、影音原型製作。

什麼是 Seedance 2.0?

Seedance 2.0 是 ByteDance 的次世代多模態影片基礎模型,專注於 電影感的多鏡頭敘事影片 生成。不同於單鏡頭的文字轉影片示範,Seedance 2.0 強調 以參考為主的控制(圖片、短片、音訊)、在鏡頭間保持角色/風格的一致性,以及原生的音訊/影片同步 —— 旨在讓 AI 影片在專業創作與預視化工作流程中更具實用性。


Seedance 2.0 的主要功能

  1. 多模態參考輸入 — 結合文字、多張圖片、短片段與音訊,以引導風格、運動與節奏。
  2. 多鏡頭/敘事連貫性 — 旨在於多個連續鏡頭間維持角色與風格的一致性,降低單鏡頭影片生成常見的“漂移”現象。
  3. 原生音訊 + 口型同步 — 支援音訊條件化的生成,並在多種語言中提供同步的語音/音素對齊。
  4. 電影級控制基元 — 在提示詞或供應商封裝器中提供明確的攝影機/運動/場面調度控制(景別、鏡頭移動、節奏約束)。
  5. 針對性編輯與延展 — 在保留未編輯區域的同時,編輯或延長現有片段(更換背景/角色、插入場景)。
  6. 推論優化 — Seedance 系譜的工程投入優先強化推論速度與多鏡頭穩定性(Seedance 1.0 曾報導多階段蒸餾與執行期加速)。

Seedance 2.0 與其他知名文字轉影片系統

能力Seedance 2.0(ByteDance)Runway Gen-2/Gen-4(Runway)
多模態參考(圖片/影片/音訊)是 — 豐富的多模態參考輸入與音訊條件化。是 — 圖片/影片/文字的條件化,含風格遷移與來源影片結構。
多鏡頭敘事一致性強調(2.0 的核心主張)。在各代版本持續改進;Runway 強調構圖與風格遷移,但多鏡頭連貫性歷來表現不一。
原生音訊/口型同步是(宣稱) — 多語言的音訊與對齊的口型同步在供應商頁面中明確標示。Runway 支援獨立的語音/影音工作流程;整合的口型同步因模型與介面而異。
典型輸出品質電影感的 1080p(部分流程有 2K 報導);具備強大的美學控制。Runway 提供快速迭代、高品質(部分 Gen 版本最高可達 4K),以及多種創意預設。

解讀: Seedance 2.0 將自身定位為電影化、以參考為先、具音訊感知的影片基礎模型,特別強調多鏡頭敘事的一致性 —— 這些領域與 Runway 的創意工作流程重點以及 Google 研究的擴散 + 上採樣研究有所重疊,但側重點不同。

創意使用情境

  1. 電影與遊戲的預視化 — 從劇本與分鏡快速產出場景原型,協助導演/創作者迭代構圖與動作。
  2. 行銷與短格式內容 — 快速生成廣告/短片,並保持品牌角色與視覺風格一致。
  3. 自動化影片剪輯與延展 — 在保持連貫性的同時,新增場景、替換背景/角色或延長素材。
  4. 攝影原型/分鏡設計 — 依據分鏡與音訊引導,生成可播放且具口型同步的場景樣稿。
  5. 多語影音示範與在地化素材 — 以多種語言產生同步的音訊+影片,用於國際行銷測試。

常見問題

更多模型