Spesifikasi Teknikal Wan 2.6
| Item | Wan 2.6 Video Suite |
|---|---|
| Provider | Alibaba / Tongyi Lab |
| Model family | Keluarga model Wan 2.6 |
| Release timeframe | Generasi Disember 2025 |
| Input types | Teks, imej, video rujukan, input audio |
| Output type | Video dengan audio terselaras pilihan |
| Core modes | Teks-ke-Video (T2V), Imej-ke-Video (I2V), Rujukan-ke-Video (R2V) |
| Flash variants | I2V Flash, R2V Flash |
| Resolution support | 720P dan 1080P |
| Duration support | 2–15 saat (bergantung pada aliran kerja) |
| Audio capabilities | Penjanaan audio asli, rujukan suara, penyegerakan bibir |
| Multi-shot support | 2–8 segmen babak dalam satu aliran kerja |
| Reference support | Sehingga 5 rujukan (campuran imej/video bergantung pada aliran kerja) |
| API workflow | Penciptaan tugas asinkron + polling |
Apakah Wan 2.6?
Wan 2.6 ialah sistem penjanaan video multimodal oleh Alibaba yang memfokuskan pada penghasilan bentuk pendek yang boleh dikawal. Bukan semata-mata dipacu oleh prompt, model ini menggabungkan prompt teks, rujukan imej, video rujukan, pengkondisian audio, dan perantaian babak untuk aliran kerja pencipta. Peningkatan utama berbanding keluaran Wan sebelumnya ialah pengenalan konsistensi berasaskan rujukan yang lebih kukuh dan penjanaan naratif yang lebih panjang.
Ciri Utama Wan 2.6
- Aliran kerja rujukan-ke-video: Pengguna boleh membekalkan rujukan imej atau video untuk mengekalkan identiti watak, gaya, dan kesinambungan suara merentas generasi.
- Penjanaan naratif berbilang babak: Menyokong perantaian berbilang prompt untuk peralihan babak dan perkembangan cerita dalam satu aliran kerja penjanaan.
- Penyegerakan audio asli: Sokongan terbina untuk audio terjana, muat naik audio tersuai, dan aliran kerja penyegerakan bibir.
- Mod input yang fleksibel: Menyokong penjanaan berasaskan prompt sahaja, animasi bingkai pertama, dan aliran kerja berasaskan rujukan.
- Varian Flash untuk iterasi: Versi lebih pantas membolehkan pengujian cepat sebelum render akhir berkualiti tinggi.
- Klip lebih panjang: Tempoh klip yang dilanjutkan berbanding generasi terdahulu, menyokong penciptaan kandungan naratif.
Prestasi Penanda Aras Wan 2.6
Ketelusan penanda aras rasmi untuk Wan 2.6 masih terhad; Alibaba telah menerbitkan lebih sedikit angka penanda aras piawai berbanding penyedia LLM teks. Kebanyakan penilaian datang daripada pengujian aliran kerja dan perbandingan ekosistem, bukannya papan pendahulu awam. Ujian komuniti secara konsisten menonjolkan:
- Peningkatan konsistensi watak berbanding keluaran Wan yang lebih lama.
- Penyegerakan audio-video yang lebih baik.
- Kesinambungan berbilang babak yang lebih kukuh.
- Pengkondisian rujukan yang lebih boleh dipercayai.
Oleh kerana penerbitan penanda aras jarang, pengujian produksi kekal penting sebelum pelaksanaan.
Wan 2.6 berbanding Model Video Lain
| Ciri | Wan 2.6 | Wan 2.7 | Model keluarga Veo |
|---|---|---|---|
| Penjanaan audio asli | Kuat | Lebih kuat | Kuat |
| Aliran kerja berbilang babak | Ya | Dipertingkat | Sederhana |
| Rujukan-ke-video | Penekanan kuat | Kawalan lebih kuat | Sederhana |
| Tempoh klip | Sehingga 15s | Serupa / bergantung pada aliran kerja | Berbeza-beza |
| Sokongan berbilang rujukan | Sehingga 5 rujukan | Aliran kerja diperluas | Sederhana |
| Aliran kerja penyuntingan | Sederhana | Sokongan penyuntingan lebih baik | Kuat |
Keterbatasan Wan 2.6
- Tempoh klip yang pendek masih menghadkan penghasilan bentuk panjang.
- Babak bergerak pantas mungkin masih menunjukkan ketidakstabilan temporal.
- Aliran kerja yang banyak bergantung pada rujukan meningkatkan kerumitan persediaan.
- Pelaporan penanda aras awam kekal terhad.
- Saluran penjanaan asinkron meningkatkan kerumitan integrasi.
Kes Penggunaan Perwakilan
- Video pemasaran dengan konsistensi watak.
- Klip media sosial berbilang babak.
- Animasi avatar pencipta.
- Video produk berasaskan rujukan.
- Penceritaan AI dengan audio terselaras.
- Kandungan jenama yang memerlukan pemeliharaan identiti.