ข้อกำหนดทาง技术ของ Wan 2.7
| รายการ | Wan 2.7 (Video Suite) |
|---|---|
| ผู้ให้บริการ | Alibaba Tongyi Lab |
| ตระกูลโมเดล | Wan 2.7 Video Suite |
| สถาปัตยกรรม | Mixture-of-Experts (MoE) พารามิเตอร์ 27B |
| ประเภทอินพุต | ข้อความ, รูปภาพ, วิดีโอ, อ้างอิงเสียง |
| ประเภทเอาต์พุต | คลิปวิดีโอที่สร้าง/แก้ไข พร้อมเสียงแบบเลือกได้ |
| โหมดที่รองรับ | ข้อความเป็นวิดีโอ (T2V), รูปภาพเป็นวิดีโอ (I2V), อ้างอิงเป็นวิดีโอ (R2V), การตัดต่อวิดีโอ |
| ความละเอียด | เอาต์พุต 720P และ 1080P |
| ระยะเวลาวิดีโอ | 2–15 วินาที |
| การรองรับเสียง | การสร้างเสียงแบบเนทีฟ, อ้างอิงเสียงพูด, เวิร์กโฟลว์ลิปซิงก์ |
| ความสามารถด้านอ้างอิง | รูปภาพ/วิดีโอหลายแหล่งอ้างอิง, ความสม่ำเสมอของอัตลักษณ์ |
| ความสม่ำเสมอของตัวละคร | รองรับตัวแบบอ้างอิงได้หลายราย ขึ้นอยู่กับเวิร์กโฟลว์ |
| รุ่นที่วางจำหน่าย | ผู้สืบทอดหลักจาก Wan 2.6 |
Wan 2.7 คืออะไร?
Wan 2.7 คือชุดการสร้างวิดีโอแบบมัลติโมดัลระดับเรือธงของ Alibaba ที่สร้างขึ้นสำหรับเวิร์กโฟลว์การสร้างภาพยนตร์ด้วย AI ที่ควบคุมได้ มากกว่าการสร้างวิดีโอจากพรอมป์ต์แบบง่ายๆ ตระกูลโมเดลนี้ผสานการสร้าง การแก้ไข การต่อเนื่อง และความสม่ำเสมอที่ขับเคลื่อนด้วยอ้างอิงไว้ในระบบเดียว ช่วยให้ผู้สร้างสร้างคลิปสั้นแนวภาพยนตร์ที่รักษาความคงตัวของตัวแบบและควบคุมฉากได้ดียิ่งขึ้น
แตกต่างจากเครื่องมือสร้างวิดีโอรุ่นก่อนที่มุ่งเน้นคุณภาพของพรอมป์ต์เป็นหลัก Wan 2.7 ให้ความสำคัญกับความสามารถในการควบคุมผ่านการยึดเฟรม อินพุตอ้างอิง การซิงโครไนซ์เสียง และเวิร์กโฟลว์หลายช็อตแบบมีโครงสร้าง
คุณสมบัติหลักของ Wan 2.7
- ไปป์ไลน์การวางแผนของ Thinking Mode: โมเดลจะวางแผนองค์ประกอบฉากและการเคลื่อนไหวก่อนเรนเดอร์ ช่วยเพิ่มการยึดตามพรอมป์ต์และลดข้อบกพร่องด้านความสอดคล้อง
- การควบคุมเฟรมแรกและเฟรมสุดท้าย: ผู้ใช้สามารถกำหนดเฟรมเปิดและเฟรมปิด เพื่อให้ระบบอินเทอร์โพเลตการเคลื่อนไหวระหว่างเฟรมเหล่านั้น
- ความสม่ำเสมอของอัตลักษณ์ที่ขับเคลื่อนด้วยอ้างอิง: รักษาลักษณะตัวละคร เสื้อผ้า วัตถุ และสไตล์ให้คงที่ข้ามหลายช็อต
- เวิร์กโฟลว์มัลติโมดัลแบบเนทีฟ: รองรับอ้างอิงข้อความ รูปภาพ เสียง และวิดีโอภายในเวิร์กโฟลว์เดียวกัน
- การสร้างเสียงแบบบูรณาการ: สามารถสร้างเพลงประกอบ เสียงสภาพแวดล้อม และการซิงโครไนซ์เสียงพูดไปพร้อมกับภาพ
- รองรับการแก้ไขและการต่อเนื่อง: สามารถขยาย แปลง หรือปรับสไตล์วิดีโอที่มีอยู่ได้โดยไม่ต้องสร้างใหม่ตั้งแต่ต้น
ประสิทธิภาพตามเกณฑ์มาตรฐานของ Wan 2.7
การเปิดเผยเกณฑ์มาตรฐานสาธารณะสำหรับ Wan 2.7 ยังมีจำกัดเมื่อเทียบกับ LLM แบบข้อความ แต่การประเมินโดยบุคคลที่สามและการทดสอบจากชุมชนบ่งชี้ถึงการปรับปรุงที่เด่นชัดในด้านเสถียรภาพของการเคลื่อนไหว การยึดตามพรอมป์ต์ และความสามารถในการควบคุมเมื่อเทียบกับ Wan 2.6
ข้อสังเกตที่มีรายงานในระบบนิเวศประกอบด้วย:
- ความต่อเนื่องของการเคลื่อนไหวที่ดีขึ้นเมื่อเทียบกับรุ่น Wan ก่อนหน้า
- อันดับที่สูงขึ้นในตารางจัดอันดับการประเมิน text-to-video ของบุคคลที่สาม
- ความสม่ำเสมอของหลายตัวแบบและการคงรักษาอ้างอิงที่ดีขึ้น
- การบูรณาการเสียงที่ดีกว่าโมเดลวิดีโอแบบเปิดรุ่นก่อนจำนวนมาก
ความโปร่งใสของเกณฑ์มาตรฐานอย่างเป็นทางการยังมีจำกัด ดังนั้นควรตีความคำกล่าวอ้างด้านประสิทธิภาพอย่างระมัดระวัง
Wan 2.7 เทียบกับโมเดลวิดีโออื่น
| คุณลักษณะ | Wan 2.7 | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|
| เวิร์กโฟลว์เสียงแบบเนทีฟ | แข็งแกร่ง | แข็งแกร่ง | ปานกลาง |
| ความสม่ำเสมอที่ขับเคลื่อนด้วยอ้างอิง | แข็งแกร่ง | ปานกลาง | ปานกลาง |
| การควบคุมเฟรมแรก + เฟรมสุดท้าย | มี | บางส่วน | จำกัด |
| เวิร์กโฟลว์การตัดต่อวิดีโอ | มี | มี | จำกัด |
| ความละเอียดสูงสุดที่ใช้กันทั่วไป | 1080P | เอาต์พุตเชิงภาพยนตร์ระดับสูงกว่า | 1080P |
| การรองรับหลายอ้างอิง | เน้นย้ำอย่างมาก | ปานกลาง | ปานกลาง |
ข้อจำกัดของ Wan 2.7
- ระยะเวลาคลิปสั้นเมื่อเทียบกับเครื่องมือผลิตงานระยะยาว
- เอาต์พุตสูงสุด 1080P จำกัดเวิร์กโฟลว์ความละเอียดอัลตราไฮ
- ฉากที่มีการเคลื่อนไหวเร็วอาจยังเกิดอาร์ติแฟกต์ความไม่เสถียร
- เวิร์กโฟลว์หลายอ้างอิงเพิ่มความซับซ้อนและข้อกำหนดด้านการออกแบบพรอมป์ต์
- การรายงานเกณฑ์มาตรฐานสาธารณะยังค่อนข้างเบาบาง
กรณีการใช้งานตัวแทน
- ภาพยนตร์สั้นและสตอรีบอร์ดที่คงความสม่ำเสมอของตัวละคร
- คลิปการตลาดพร้อมการซิงโครไนซ์เสียง
- การสร้างวิดีโอสำหรับโซเชียลมีเดีย
- การทำให้เห็นภาพผลิตภัณฑ์และตัวอย่างแนวคิด
- เวิร์กโฟลว์การต่อวิดีโอและการอินเทอร์โพเลตฉาก
- แอนิเมชันอวตารและตัวละครบนพื้นฐานอ้างอิง
วิธีใช้ WAN 2.7 Video API ใน CometAPI
ขั้นตอนที่ 1: ทดลองใช้ WAN 2.7 Video API ใน Kie Al Playground
ก่อนอื่น ทดสอบความสามารถของ WAN 2.7 โดยใช้ WAN 2.7 Video API ใน CometAPI Playground อัปโหลดรูปภาพ เพิ่มพรอมป์ต์ หรือใช้อ้างอิงเพื่อพรีวิว WAN video ที่สร้างขึ้นก่อนบูรณาการ WAN 2.7 AI video เข้าสู่เวิร์กโฟลว์การผลิตของคุณ
ขั้นตอนที่ 2: ขอรับคีย์ WAN 2.7 API และทบทวนเอกสาร API
ขอรับคีย์ WAN 2.7 API จากคอนโซล CometAPI และทบทวนเอกสาร ทำความเข้าใจ endpoints การรับรองความถูกต้อง และพารามิเตอร์ของ WAN 2.7 Video API เพื่อรองรับเวิร์กโฟลว์ text-to-video, image-to-video และ WAN video
ขั้นตอนที่ 3: สร้าง WAN 2.7 AI videos และผสานเข้ากับเวิร์กโฟลว์ของคุณ
ใช้ WAN 2.7 Video API เพื่อสร้าง WAN 2.7 AI videos ด้วยพรอมป์ต์ รูปภาพ หรืออ้างอิง ผสานผลลัพธ์ของ WAN 2.7 เข้ากับเวิร์กโฟลว์ผลิตภัณฑ์ สายงานคอนเทนต์ หรือเครื่องมือ AI video เพื่อให้การสร้างวิดีโอสามารถขยายขนาดได้