Spesifikasi Teknis Wan 2.7
| Item | Wan 2.7 (Video Suite) |
|---|---|
| Penyedia | Alibaba Tongyi Lab |
| Keluarga model | Wan 2.7 Video Suite |
| Arsitektur | Mixture-of-Experts (MoE) 27B parameter |
| Jenis input | Teks, gambar, video, referensi audio |
| Jenis output | Klip video yang dihasilkan/diedit dengan audio opsional |
| Mode yang didukung | Teks-ke-video (T2V), Gambar-ke-video (I2V), Referensi-ke-video (R2V), Pengeditan Video |
| Resolusi | Keluaran 720P dan 1080P |
| Durasi video | 2–15 detik |
| Dukungan audio | Generasi audio native, referensi suara, alur kerja sinkronisasi bibir |
| Kemampuan referensi | Gambar/video multi-referensi, konsistensi identitas |
| Konsistensi karakter | Mendukung hingga beberapa subjek referensi tergantung alur kerja |
| Generasi rilis | Penerus utama Wan 2.6 |
Apa itu Wan 2.7?
Wan 2.7 adalah rangkaian generasi video multimodal unggulan dari Alibaba yang dibangun untuk alur kerja pembuatan film AI yang dapat dikendalikan, bukan sekadar pembuatan prompt-ke-video sederhana. Keluarga model ini menggabungkan generasi, pengeditan, pelanjutan, dan konsistensi berbasis referensi ke dalam satu sistem, memungkinkan kreator membangun klip sinematik pendek dengan pelestarian subjek yang lebih kuat dan kontrol adegan yang lebih baik.
Berbeda dengan generator video sebelumnya yang terutama berfokus pada kualitas prompt, Wan 2.7 menekankan kemampuan kendali melalui penjangkaran frame, input referensi, sinkronisasi audio, dan alur kerja multi-shot terstruktur.
Fitur Utama Wan 2.7
- Pipeline perencanaan Thinking Mode: Model merencanakan komposisi adegan dan gerakan sebelum rendering, meningkatkan kepatuhan terhadap prompt dan mengurangi kegagalan koherensi.
- Kontrol frame pertama dan terakhir: Pengguna dapat menentukan frame pembuka dan penutup sehingga sistem menginterpolasi gerakan di antaranya.
- Konsistensi identitas berbasis referensi: Mempertahankan penampilan karakter, pakaian, objek, dan gaya di banyak shot.
- Alur kerja multimodal native: Mendukung referensi teks, gambar, audio, dan video dalam alur kerja yang sama.
- Generasi audio terintegrasi: Musik latar, suara lingkungan, dan sinkronisasi suara dapat dihasilkan bersamaan dengan visual.
- Dukungan pengeditan dan kelanjutan: Video yang ada dapat diperluas, ditransformasikan, atau diubah gayanya tanpa membangun ulang dari awal.
Kinerja Tolok Ukur Wan 2.7
Pengungkapan tolok ukur publik untuk Wan 2.7 tetap terbatas dibandingkan dengan LLM teks, tetapi evaluasi pihak ketiga dan pengujian komunitas menunjukkan peningkatan yang signifikan dalam stabilitas gerakan, kepatuhan terhadap prompt, dan kemampuan kendali dibandingkan Wan 2.6.
Pengamatan ekosistem yang dilaporkan meliputi:
- Kontinuitas gerakan yang lebih kuat dibandingkan rilis Wan sebelumnya.
- Penempatan pada papan peringkat yang lebih tinggi dalam evaluasi teks-ke-video pihak ketiga.
- Peningkatan konsistensi multi-subjek dan pelestarian referensi.
- Integrasi audio yang lebih baik dibandingkan banyak model video terbuka sebelumnya.
Transparansi tolok ukur formal masih terbatas, sehingga klaim kinerja sebaiknya ditafsirkan dengan hati-hati.
Wan 2.7 vs Model Video Lain
| Fitur | Wan 2.7 | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|
| Alur kerja audio native | Kuat | Kuat | Sedang |
| Konsistensi berbasis referensi | Kuat | Sedang | Sedang |
| Kontrol Frame Pertama + Terakhir | Ya | Parsial | Terbatas |
| Alur kerja pengeditan video | Ya | Ya | Terbatas |
| Resolusi maksimum umum | 1080P | Keluaran sinematik kelas lebih tinggi | 1080P |
| Dukungan multi-referensi | Penekanan kuat | Sedang | Sedang |
Keterbatasan Wan 2.7
- Durasi klip pendek dibandingkan alat produksi bentuk panjang.
- Keluaran maksimum 1080P membatasi alur kerja beresolusi sangat tinggi.
- Adegan gerakan cepat masih dapat menghasilkan artefak ketidakstabilan.
- Alur kerja multi-referensi meningkatkan kompleksitas dan kebutuhan rekayasa prompt.
- Pelaporan tolok ukur publik tetap relatif jarang.
Contoh Kasus Penggunaan
- Film pendek dan storyboard dengan konsistensi karakter.
- Klip pemasaran dengan sinkronisasi audio.
- Pembuatan video media sosial.
- Visualisasi produk dan trailer konsep.
- Pelanjutan video dan alur kerja interpolasi adegan.
- Avatar berbasis referensi dan animasi karakter.
Cara Menggunakan WAN 2.7 Video API di CometAPI
Langkah 1: Coba WAN 2.7 Video API di Kie Al Playground
Pertama, uji fungsionalitas WAN 2.7 menggunakan WAN 2.7 Video API di CometAPI Playground. Unggah gambar, tambahkan prompt, atau gunakan referensi untuk mempratinjau video WAN yang dihasilkan sebelum mengintegrasikan video AI WAN 2.7 ke dalam alur kerja produksi Anda.
Langkah 2: Dapatkan kunci API WAN 2.7 dan tinjau dokumentasi API
Dapatkan kunci API WAN 2.7 dari konsol CometAPI dan tinjau dokumentasinya. Pahami endpoint, autentikasi, dan parameter WAN 2.7 Video API untuk mendukung alur kerja teks-ke-video, gambar-ke-video, dan video WAN.
Langkah 3: Hasilkan video AI WAN 2.7 dan integrasikan ke dalam alur kerja Anda
Gunakan WAN 2.7 Video API untuk menghasilkan video AI WAN 2.7 dengan prompt, gambar, atau referensi. Integrasikan keluaran WAN 2.7 ke dalam alur kerja produk, pipeline konten, atau alat video AI untuk memungkinkan pembuatan video berskala.