Spesifikasi Teknikal Wan 2.7
| Item | Wan 2.7 (Video Suite) |
|---|---|
| Provider | Alibaba Tongyi Lab |
| Model family | Wan 2.7 Video Suite |
| Architecture | Campuran Pakar (MoE) 27B parameter |
| Input types | Teks, imej, video, rujukan audio |
| Output types | Klip video dijana / disunting dengan audio pilihan |
| Supported modes | Teks-ke-video (T2V), Imej-ke-video (I2V), Rujukan-ke-video (R2V), Penyuntingan Video |
| Resolution | Output 720P dan 1080P |
| Video duration | 2–15 saat |
| Audio support | Penjanaan audio natif, rujukan suara, aliran kerja lip-sync |
| Reference capability | Imej/video berbilang rujukan, konsistensi identiti |
| Character consistency | Menyokong sehingga pelbagai subjek rujukan bergantung pada aliran kerja |
| Release generation | Penerus utama kepada Wan 2.6 |
Apakah Wan 2.7?
Wan 2.7 ialah suit penjanaan video multimodal utama Alibaba yang dibina untuk aliran kerja perfileman AI yang boleh dikawal, bukannya sekadar penciptaan prompt-ke-video yang ringkas. Keluarga model ini menggabungkan penjanaan, penyuntingan, kesinambungan, dan konsistensi berpandukan rujukan dalam satu sistem, membolehkan pencipta membina klip sinematik pendek dengan pemeliharaan subjek dan kawalan adegan yang lebih kukuh.
Berbeza dengan penjana video terdahulu yang banyak memfokuskan pada kualiti prompt, Wan 2.7 menekankan kebolehkawalan melalui penjangkaran bingkai, input rujukan, penyegerakan audio, dan aliran kerja berbilang shot yang berstruktur.
Ciri Utama Wan 2.7
- Rangkaian perancangan Thinking Mode: Model merancang komposisi adegan dan pergerakan sebelum rendering, meningkatkan pematuhan terhadap prompt dan mengurangkan kegagalan koherensi.
- Kawalan bingkai pertama dan terakhir: Pengguna boleh mentakrifkan bingkai pembukaan dan penutup agar sistem menginterpolasi pergerakan di antara keduanya.
- Konsistensi identiti berpandukan rujukan: Mengekalkan rupa watak, pakaian, objek dan gaya merentas berbilang shot.
- Aliran kerja multimodal natif: Menyokong teks, imej, audio, dan rujukan video dalam aliran kerja yang sama.
- Penjanaan audio bersepadu: Muzik latar, bunyi persekitaran dan penyegerakan suara boleh dijana seiring visual.
- Sokongan penyuntingan dan kesinambungan: Video sedia ada boleh dipanjangkan, diubah suai, atau digaya semula tanpa membina semula dari awal.
Prestasi Penanda Aras Wan 2.7
Pendedahan penanda aras awam untuk Wan 2.7 masih terhad berbanding LLM teks, namun penilaian pihak ketiga dan ujian komuniti menunjukkan peningkatan ketara dalam kestabilan gerakan, pematuhan terhadap prompt, dan kebolehkawalan berbanding Wan 2.6.
Pemerhatian ekosistem yang dilaporkan termasuk:
- Kelangsungan gerakan yang lebih kukuh berbanding keluaran Wan terdahulu.
- Kedudukan papan pendahulu yang lebih tinggi dalam penilaian teks-ke-video pihak ketiga.
- Peningkatan konsistensi pelbagai subjek dan pemeliharaan rujukan.
- Integrasi audio yang lebih baik berbanding banyak model video terbuka terdahulu.
Ketelusan penanda aras rasmi masih terhad, maka dakwaan prestasi harus ditafsir dengan berhati-hati.
Wan 2.7 vs Model Video Lain
| Ciri | Wan 2.7 | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|
| Aliran kerja audio natif | Kuat | Kuat | Sederhana |
| Konsistensi berpandukan rujukan | Kuat | Sederhana | Sederhana |
| Kawalan Bingkai Pertama + Terakhir | Ya | Sebahagian | Terhad |
| Aliran kerja penyuntingan video | Ya | Ya | Terhad |
| Resolusi maksimum lazim | 1080P | Output sinematik kelas tinggi | 1080P |
| Sokongan berbilang rujukan | Penekanan kuat | Sederhana | Sederhana |
Batasan Wan 2.7
- Tempoh klip yang pendek berbanding alat produksi bentuk panjang.
- Output maksimum 1080P mengehadkan aliran kerja resolusi ultra tinggi.
- Adegan pergerakan pantas mungkin masih menghasilkan artifak ketidakstabilan.
- Aliran kerja berbilang rujukan meningkatkan kerumitan dan keperluan kejuruteraan prompt.
- Pelaporan penanda aras awam kekal agak terhad.
Kes Penggunaan Representatif
- Filem pendek dan papan cerita yang konsisten dari segi watak.
- Klip pemasaran dengan penyegerakan audio.
- Penjanaan video media sosial.
- Visualisasi produk dan treler konsep.
- Aliran kerja kesinambungan video dan interpolasi adegan.
- Animasi avatar dan watak berasaskan rujukan.
Cara Menggunakan WAN 2.7 Video API dalam CometAPI
Langkah 1: Cuba WAN 2.7 Video API di Kie Al Playground
Mula-mula, uji fungsi WAN 2.7 menggunakan WAN 2.7 Video API dalam CometAPI Playground. Muat naik imej, tambah prompt, atau gunakan rujukan untuk pratonton video WAN yang dijana sebelum mengintegrasikan video AI WAN 2.7 ke dalam aliran kerja produksi anda.
Langkah 2: Dapatkan kunci API WAN 2.7 dan semak dokumentasi API
Dapatkan kunci API WAN 2.7 daripada konsol CometAPI dan semak dokumentasinya. Fahami titik akhir (endpoint), pengesahan, dan parameter WAN 2.7 Video API untuk menyokong aliran kerja text-to-video, image-to-video, dan WAN video.
Langkah 3: Jana video AI WAN 2.7 dan integrasikannya ke dalam aliran kerja anda
Gunakan WAN 2.7 Video API untuk menjana video AI WAN 2.7 dengan prompt, imej, atau rujukan. Integrasikan output WAN 2.7 ke dalam aliran kerja produk, saluran kandungan, atau alat video AI bagi membolehkan penciptaan video yang boleh diskala.