Wan 2.7 の技術仕様
| Item | Wan 2.7 (Video Suite) |
|---|---|
| Provider | Alibaba Tongyi Lab |
| Model family | Wan 2.7 Video Suite |
| Architecture | 27B パラメータの Mixture-of-Experts(MoE) |
| Input types | テキスト、画像、動画、音声リファレンス |
| Output types | オーディオ任意付きの生成/編集済み動画クリップ |
| Supported modes | テキストから動画(T2V)、画像から動画(I2V)、リファレンスから動画(R2V)、動画編集 |
| Resolution | 720P および 1080P 出力 |
| Video duration | 2–15 秒 |
| Audio support | ネイティブ音声生成、音声リファレンス、リップシンクのワークフロー |
| Reference capability | 複数の参照画像/動画、アイデンティティの一貫性 |
| Character consistency | ワークフローに応じて複数の参照被写体をサポート |
| Release generation | Wan 2.6 のメジャー後継 |
Wan 2.7 とは?
Wan 2.7 は、単純なプロンプトから動画を作るだけでなく、制御可能な AI 映像制作ワークフローに特化した Alibaba のフラグシップなマルチモーダル動画生成スイートです。生成、編集、継続、参照駆動の一貫性を 1 つのシステムに統合し、被写体の保持とシーン制御を強化した短尺のシネマティッククリップを制作できるようにします。
従来のプロンプト品質に依存しがちな動画生成器と異なり、Wan 2.7 はフレームのアンカリング、参照入力、オーディオ同期、構造化されたマルチショット・ワークフローによるコントロール性を重視します。
Wan 2.7 の主な機能
- Thinking Mode の計画パイプライン: レンダリング前にシーン構成とモーションを計画し、プロンプト遵守性を高め、コヒーレンスの破綻を低減します。
- 最初のフレームと最後のフレームの制御: ユーザーがオープニングとエンディングのフレームを定義でき、システムがその間の動きを補間します。
- 参照駆動の同一性一貫性: 複数ショットにわたりキャラクターの外観、衣装、オブジェクト、スタイルを維持します。
- ネイティブなマルチモーダル・ワークフロー: 同一ワークフロー内でテキスト、画像、音声、動画の参照をサポートします。
- 統合オーディオ生成: 背景音楽、環境音、音声同期を映像とあわせて生成できます。
- 編集と継続のサポート: 既存動画を最初から作り直すことなく拡張、変換、再スタイル化できます。
Wan 2.7 のベンチマーク性能
テキスト LLM と比べると Wan 2.7 の公開ベンチマーク開示は依然として限られていますが、サードパーティ評価やコミュニティのテストでは、Wan 2.6 と比べてモーションの安定性、プロンプト遵守、コントロール性に顕著な改善が示されています。
報告されているエコシステム上の観察事項には次が含まれます:
- 以前の Wan リリースと比べてより強固なモーション連続性。
- サードパーティのテキストから動画評価での上位ランク入り。
- 複数被写体の一貫性および参照維持の改善。
- 多くの従来のオープン動画モデルより優れたオーディオ統合。
正式なベンチマークの透明性は依然として限定的であり、性能に関する主張は慎重に解釈する必要があります。
Wan 2.7 と他の動画モデルの比較
| Feature | Wan 2.7 | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|
| Native audio workflows | 強い | 強い | 中程度 |
| Reference-driven consistency | 強い | 中程度 | 中程度 |
| First + Last Frame control | あり | 一部 | 限定的 |
| Video editing workflows | あり | あり | 限定的 |
| Max common resolution | 1080P | ハイエンドのシネマティック出力 | 1080P |
| Multi-reference support | 強く重視 | 中程度 | 中程度 |
Wan 2.7 の制限事項
- 長編制作ツールと比べてクリップの尺が短い。
- 最大 1080P 出力のため超高解像度ワークフローには不向き。
- 速い動きのシーンでは依然として不安定なアーティファクトが生じうる。
- マルチリファレンスのワークフローは複雑さとプロンプト設計の要求を増大させる。
- 公開ベンチマークの報告が比較的少ない。
代表的なユースケース
- キャラクター一貫性のある短編映画や絵コンテ。
- 音声同期を伴うマーケティング用クリップ。
- ソーシャルメディア向けの動画生成。
- 製品ビジュアライゼーションやコンセプトトレーラー。
- 動画の継続生成やシーン間補間ワークフロー。
- 参照ベースのアバター/キャラクターアニメーション。
CometAPI で WAN 2.7 Video API を使用する方法
Step 1: Kie Al Playground で WAN 2.7 Video API を試す
まず、CometAPI の Playground で WAN 2.7 Video API を使って WAN 2.7 の機能をテストします。画像をアップロードし、プロンプトを追加するか参照を使用して、WAN 生成動画を本番ワークフローに統合する前にプレビューします。
Step 2: WAN 2.7 の API キーを取得し、API ドキュメントを確認する
CometAPI コンソールから WAN 2.7 の API キーを取得し、ドキュメントを確認します。テキストから動画、画像から動画、WAN 動画ワークフローをサポートするため、WAN 2.7 Video API のエンドポイント、認証、パラメータを把握します。
Step 3: WAN 2.7 AI 動画を生成し、ワークフローに統合する
WAN 2.7 Video API を使用して、プロンプト、画像、または参照を用いて WAN 2.7 AI 動画を生成します。製品ワークフロー、コンテンツパイプライン、または AI 動画ツールに WAN 2.7 の出力を統合し、スケーラブルな動画制作を実現します。