Thông số kỹ thuật của Wan 2.7
| Hạng mục | Wan 2.7 (Video Suite) |
|---|---|
| Nhà cung cấp | Alibaba Tongyi Lab |
| Họ mô hình | Wan 2.7 Video Suite |
| Kiến trúc | Mixture-of-Experts (MoE) 27B tham số |
| Loại đầu vào | Văn bản, hình ảnh, video, tham chiếu âm thanh |
| Loại đầu ra | Các đoạn video được tạo / chỉnh sửa với âm thanh tùy chọn |
| Chế độ được hỗ trợ | Văn bản thành video (T2V), Hình ảnh thành video (I2V), Tham chiếu thành video (R2V), Chỉnh sửa video |
| Độ phân giải | Đầu ra 720P và 1080P |
| Độ dài video | 2–15 giây |
| Hỗ trợ âm thanh | Tạo âm thanh gốc, tham chiếu giọng nói, quy trình đồng bộ khẩu hình |
| Khả năng tham chiếu | Đa tham chiếu hình ảnh/video, nhất quán danh tính |
| Tính nhất quán nhân vật | Hỗ trợ tối đa nhiều đối tượng tham chiếu tùy theo quy trình |
| Phiên bản phát hành | Phiên bản kế nhiệm chính cho Wan 2.6 |
Wan 2.7 là gì?
Wan 2.7 là bộ sản phẩm tạo video đa phương thức chủ lực của Alibaba, được xây dựng cho các quy trình làm phim AI có khả năng kiểm soát thay vì chỉ tạo video từ prompt đơn giản. Họ mô hình này kết hợp tạo sinh, chỉnh sửa, nối dài và tính nhất quán dựa trên tham chiếu vào một hệ thống, cho phép người sáng tạo dựng các đoạn clip ngắn mang tính điện ảnh với khả năng bảo toàn chủ thể và kiểm soát cảnh tốt hơn.
Khác với các trình tạo video trước đây vốn chủ yếu dựa vào chất lượng prompt, Wan 2.7 nhấn mạnh khả năng kiểm soát thông qua neo khung hình, đầu vào tham chiếu, đồng bộ âm thanh và các quy trình nhiều cú máy có cấu trúc.
Các tính năng chính của Wan 2.7
- Quy trình lập kế hoạch Thinking Mode: Mô hình lập kế hoạch bố cục cảnh và chuyển động trước khi render, cải thiện mức độ tuân thủ prompt và giảm lỗi mất mạch.
- Kiểm soát khung hình đầu và cuối: Người dùng có thể xác định khung mở đầu và kết thúc để hệ thống nội suy chuyển động giữa chúng.
- Tính nhất quán danh tính dựa trên tham chiếu: Duy trì ngoại hình nhân vật, trang phục, vật thể và phong cách xuyên suốt nhiều cú máy.
- Quy trình đa phương thức gốc: Hỗ trợ văn bản, hình ảnh, âm thanh và tham chiếu video trong cùng một quy trình.
- Tích hợp tạo âm thanh: Có thể tạo nhạc nền, âm thanh môi trường và đồng bộ giọng nói song song với hình ảnh.
- Hỗ trợ chỉnh sửa và nối dài: Video hiện có có thể được mở rộng, biến đổi hoặc tái tạo phong cách mà không cần dựng lại từ đầu.
Hiệu năng benchmark của Wan 2.7
Công bố benchmark công khai cho Wan 2.7 vẫn hạn chế so với các LLM văn bản, nhưng các đánh giá bên thứ ba và thử nghiệm từ cộng đồng cho thấy cải thiện đáng kể về độ ổn định chuyển động, mức độ tuân thủ prompt và khả năng kiểm soát so với Wan 2.6.
Các quan sát trong hệ sinh thái được báo cáo gồm:
- Tính liên tục chuyển động mạnh hơn so với các bản Wan trước.
- Xếp hạng cao hơn trên bảng xếp hạng trong các đánh giá chuyển văn bản thành video của bên thứ ba.
- Cải thiện tính nhất quán đa chủ thể và bảo toàn tham chiếu.
- Tích hợp âm thanh tốt hơn so với nhiều mô hình video mở trước đây.
Tính minh bạch benchmark chính thức vẫn còn hạn chế, vì vậy các tuyên bố về hiệu năng nên được diễn giải thận trọng.
Wan 2.7 so với các mô hình video khác
| Tính năng | Wan 2.7 | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|
| Quy trình âm thanh gốc | Mạnh | Mạnh | Trung bình |
| Tính nhất quán dựa trên tham chiếu | Mạnh | Trung bình | Trung bình |
| Kiểm soát khung hình đầu + cuối | Có | Một phần | Giới hạn |
| Quy trình chỉnh sửa video | Có | Có | Giới hạn |
| Độ phân giải tối đa phổ biến | 1080P | Đầu ra điện ảnh cao cấp hơn | 1080P |
| Hỗ trợ đa tham chiếu | Nhấn mạnh mạnh | Trung bình | Trung bình |
Hạn chế của Wan 2.7
- Thời lượng clip ngắn so với các công cụ sản xuất nội dung dài.
- Đầu ra tối đa 1080P giới hạn các quy trình độ phân giải siêu cao.
- Cảnh chuyển động nhanh vẫn có thể phát sinh tạo tác bất ổn.
- Quy trình đa tham chiếu làm tăng độ phức tạp và yêu cầu về kỹ thuật prompt.
- Báo cáo benchmark công khai vẫn tương đối thưa thớt.
Trường hợp sử dụng tiêu biểu
- Phim ngắn và storyboard nhất quán về nhân vật.
- Clip marketing với đồng bộ âm thanh.
- Tạo video cho mạng xã hội.
- Trình bày sản phẩm và trailer ý tưởng.
- Nối dài video và quy trình nội suy cảnh.
- Hoạt họa avatar và nhân vật dựa trên tham chiếu.
Cách sử dụng WAN 2.7 Video API trong CometAPI
Bước 1: Dùng thử WAN 2.7 Video API trong Kie Al Playground
Trước tiên, hãy thử các tính năng của WAN 2.7 bằng WAN 2.7 Video API trong CometAPI Playground. Tải lên hình ảnh, thêm prompt hoặc sử dụng tham chiếu để xem trước video WAN được tạo trước khi tích hợp video AI WAN 2.7 vào quy trình sản xuất của bạn.
Bước 2: Lấy khóa API WAN 2.7 và xem tài liệu API
Lấy khóa API WAN 2.7 từ bảng điều khiển CometAPI và xem tài liệu. Hiểu các điểm cuối WAN 2.7 Video API, xác thực và tham số để hỗ trợ quy trình chuyển văn bản thành video, chuyển hình ảnh thành video và video WAN.
Bước 3: Tạo video AI WAN 2.7 và tích hợp vào quy trình của bạn
Sử dụng WAN 2.7 Video API để tạo video AI WAN 2.7 với prompt, hình ảnh hoặc tham chiếu. Tích hợp đầu ra WAN 2.7 vào quy trình sản phẩm, pipeline nội dung hoặc công cụ video AI để cho phép tạo video ở quy mô.