Wan 2.7 技術規格
| 項目 | Wan 2.7(影片套件) |
|---|---|
| 提供方 | Alibaba Tongyi Lab |
| 模型系列 | Wan 2.7 Video Suite |
| 架構 | 27B 參數的專家混合(MoE) |
| 輸入類型 | 文字、圖片、影片、音訊參考 |
| 輸出類型 | 生成/編輯的影片剪輯(可選音訊) |
| 支援模式 | 文字轉影片(T2V)、圖片轉影片(I2V)、參考轉影片(R2V)、影片編輯 |
| 解析度 | 720P 與 1080P 輸出 |
| 影片時長 | 2–15 秒 |
| 音訊支援 | 原生音訊生成、語音參考、口型同步工作流程 |
| 參考能力 | 多參考圖片/影片,身份一致性 |
| 角色一致性 | 視工作流程而定,可支援多個參考主體 |
| 版本代際 | Wan 2.6 的主要後續版本 |
什麼是 Wan 2.7?
Wan 2.7 是 Alibaba 的旗艦多模態影片生成套件,面向可控的 AI 影片製作工作流程,而非僅僅是簡單的提示轉影片。該模型系列將生成、編輯、延續與基於參考的穩定一致性整合為一個系統,使創作者能以更強的主體保留與場景控制能力打造短篇電影感片段。
不同於早期主要聚焦於提示品質的影片生成器,Wan 2.7 透過幀錨定、參考輸入、音訊同步與結構化多鏡頭工作流程強調可控性。
Wan 2.7 主要特性
- Thinking Mode 規劃管線:模型在渲染前規劃場景構圖與運動,提升對提示的遵循度並降低連貫性失誤。
- 首幀與末幀控制:使用者可定義開場與結尾幀,系統在兩者之間插值運動。
- 以參考為驅動的身份一致性:在多個鏡頭間維持角色外觀、服裝、物件與風格的一致。
- 原生多模態工作流程:在同一工作流程中支援文字、圖片、音訊與影片參考。
- 整合音訊生成:可在影像之外同時生成背景音樂、環境聲與語音同步。
- 支援編輯與延續:可在不從零開始的情況下延長、轉換或重塑現有影片。
Wan 2.7 的基準表現
相較於文字類 LLM,Wan 2.7 的公開基準披露仍較有限,但第三方評測與社群測試顯示其在運動穩定性、提示遵循與可控性方面相較 Wan 2.6 有顯著提升。
生態系觀察報告包括:
- 相比早期 Wan 發布版本,運動連續性更強。
- 在第三方文字轉影片評測榜單上的名次更高。
- 多主體一致性與參考保真度提升。
- 相較許多較早的開源影片模型,音訊整合更佳。
正式基準的透明度仍然有限,故對效能聲稱應審慎解讀。
Wan 2.7 與其他影片模型比較
| 特性 | Wan 2.7 | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|
| 原生音訊工作流程 | 強 | 強 | 中等 |
| 參考驅動的一致性 | 強 | 中等 | 中等 |
| 首 + 末幀控制 | 是 | 部分 | 有限 |
| 影片編輯工作流程 | 是 | 是 | 有限 |
| 最大常見解析度 | 1080P | 更高端的電影級輸出 | 1080P |
| 多參考支援 | 強調 | 中等 | 中等 |
Wan 2.7 的限制
- 相較長篇製作工具,片段時長較短。
- 1080P 的最大輸出限制了超高解析度工作流程。
- 快速運動場景仍可能出現不穩定偽影。
- 多參考工作流程提高了複雜度與提示工程需求。
- 公開基準報告依然相對稀少。
代表性使用情境
- 角色一致性的短片與分鏡腳本。
- 具音訊同步的行銷短片。
- 社群媒體影片生成。
- 產品可視化與概念預告片。
- 影片延續與場景插值工作流程。
- 基於參考的頭像與角色動畫。
如何在 CometAPI 中使用 WAN 2.7 Video API
步驟 1:在 Kie Al Playground 試用 WAN 2.7 Video API
首先,在 CometAPI Playground 使用 WAN 2.7 Video API 測試 WAN 2.7 的功能。上傳圖片、添加提示或使用參考,在將 WAN 2.7 AI 影片整合到您的製作流程之前,先預覽生成的 WAN 影片。
步驟 2:取得 WAN 2.7 API 金鑰並查閱 API 文件
從 CometAPI 控制台取得 WAN 2.7 API 金鑰並查閱文件。瞭解 WAN 2.7 Video API 的端點、驗證與參數,以支援文字轉影片、圖片轉影片與 WAN 影片工作流程。
步驟 3:生成 WAN 2.7 AI 影片並整合至您的工作流程
使用 WAN 2.7 Video API 透過提示、圖片或參考生成 WAN 2.7 AI 影片。將 WAN 2.7 的輸出整合到產品工作流程、內容管線或 AI 影片工具中,以實現可擴展的影片創作。