Q

Wan2.6

Per Detik:$0.08
Hasilkan video dari teks dan gambar. Buat dan edit gambar dengan konsistensi referensi.
Baru
Penggunaan komersial

Spesifikasi Teknis Wan 2.6

ItemSuite Video Wan 2.6
ProviderAlibaba / Tongyi Lab
Model familyWan 2.6
Release timeframeGenerasi Desember 2025
Input typesTeks, gambar, video referensi, input audio
Output typeVideo dengan audio tersinkron opsional
Core modesTeks-ke-Video (T2V), Gambar-ke-Video (I2V), Referensi-ke-Video (R2V)
Flash variantsI2V Flash, R2V Flash
Resolution support720P dan 1080P
Duration support2–15 detik (bergantung pada alur kerja)
Audio capabilitiesPembuatan audio bawaan, referensi suara, sinkronisasi bibir
Multi-shot support2–8 segmen adegan dalam satu alur kerja
Reference supportHingga 5 referensi (campuran gambar/video bergantung pada alur kerja)
API workflowPembuatan tugas asinkron + polling

Apa itu Wan 2.6?

Wan 2.6 adalah sistem pembuatan video multimodal milik Alibaba yang berfokus pada produksi format pendek yang dapat dikendalikan. Alih-alih semata-mata digerakkan oleh prompt, model ini menggabungkan prompt teks, referensi gambar, video referensi, pengondisian audio, dan perantaian adegan untuk alur kerja kreator. Peningkatan besar dibanding rilis Wan sebelumnya adalah diperkenalkannya konsistensi berbasis referensi yang lebih kuat dan pembuatan narasi yang lebih panjang.

Fitur Utama Wan 2.6

  • Alur kerja referensi-ke-video: Pengguna dapat memasukkan referensi gambar atau video untuk mempertahankan identitas karakter, gaya, dan kesinambungan suara lintas generasi.
  • Pembuatan narasi multi-shot: Mendukung perantaian beberapa prompt untuk transisi adegan dan perkembangan cerita dalam satu alur kerja generasi.
  • Sinkronisasi audio bawaan: Dukungan terintegrasi untuk audio yang dihasilkan, unggahan audio kustom, dan alur kerja sinkronisasi bibir.
  • Mode input fleksibel: Mendukung pembuatan hanya dengan prompt, animasi frame pertama, dan alur kerja berbasis referensi.
  • Varian Flash untuk iterasi: Versi yang lebih cepat memungkinkan pengujian cepat sebelum render akhir berkualitas tinggi.
  • Klip lebih panjang: Durasi klip diperpanjang dibanding generasi sebelumnya, mendukung pembuatan konten naratif.

Kinerja Benchmark Wan 2.6

Transparansi benchmark formal untuk Wan 2.6 masih terbatas; Alibaba menerbitkan lebih sedikit angka benchmark terstandar dibanding penyedia LLM teks. Sebagian besar evaluasi berasal dari pengujian alur kerja dan perbandingan ekosistem alih-alih papan peringkat publik. Pengujian komunitas secara konsisten menyoroti:

  • Peningkatan konsistensi karakter dibanding rilis Wan yang lebih lama.
  • Sinkronisasi audio-video yang lebih baik.
  • Kontinuitas multi-shot yang lebih kuat.
  • Pengondisian referensi yang lebih andal.

Karena publikasi benchmark jarang, pengujian produksi tetap penting sebelum penerapan.

Wan 2.6 vs Model Video Lain

FiturWan 2.6Wan 2.7Model keluarga Veo
Pembuatan audio bawaanKuatLebih kuatKuat
Alur kerja multi-shotYaDitingkatkanModerat
Referensi-ke-videoPenekanan kuatKontrol lebih kuatModerat
Durasi klipHingga 15 detikSerupa / bergantung alur kerjaBervariasi
Dukungan multi-referensiHingga 5 referensiAlur kerja diperluasModerat
Alur kerja pengeditanModeratDukungan pengeditan lebih baikKuat

Keterbatasan Wan 2.6

  • Durasi klip yang pendek masih membatasi produksi format panjang.
  • Adegan dengan gerakan tinggi masih dapat menunjukkan ketidakstabilan temporal.
  • Alur kerja yang sangat bergantung pada referensi meningkatkan kompleksitas penyiapan.
  • Pelaporan benchmark publik tetap terbatas.
  • Pipeline pembuatan asinkron meningkatkan kompleksitas integrasi.

Kasus Penggunaan Representatif

  1. Video pemasaran dengan konsistensi karakter.
  2. Klip media sosial multi-adegan.
  3. Animasi avatar kreator.
  4. Video produk berbasis referensi.
  5. Penceritaan AI dengan audio tersinkron.
  6. Konten merek yang memerlukan pelestarian identitas.

FAQ