Q

Wan2.7

ต่อวินาที:$0.08
สร้างวิดีโอจากข้อความและรูปภาพ. สร้างและแก้ไขรูปภาพโดยรักษาความสม่ำเสมอกับภาพอ้างอิง.
ใหม่
ใช้งานเชิงพาณิชย์

ข้อกำหนดทาง技术ของ Wan 2.7

รายการWan 2.7 (Video Suite)
ผู้ให้บริการAlibaba Tongyi Lab
ตระกูลโมเดลWan 2.7 Video Suite
สถาปัตยกรรมMixture-of-Experts (MoE) พารามิเตอร์ 27B
ประเภทอินพุตข้อความ, รูปภาพ, วิดีโอ, อ้างอิงเสียง
ประเภทเอาต์พุตคลิปวิดีโอที่สร้าง/แก้ไข พร้อมเสียงแบบเลือกได้
โหมดที่รองรับข้อความเป็นวิดีโอ (T2V), รูปภาพเป็นวิดีโอ (I2V), อ้างอิงเป็นวิดีโอ (R2V), การตัดต่อวิดีโอ
ความละเอียดเอาต์พุต 720P และ 1080P
ระยะเวลาวิดีโอ2–15 วินาที
การรองรับเสียงการสร้างเสียงแบบเนทีฟ, อ้างอิงเสียงพูด, เวิร์กโฟลว์ลิปซิงก์
ความสามารถด้านอ้างอิงรูปภาพ/วิดีโอหลายแหล่งอ้างอิง, ความสม่ำเสมอของอัตลักษณ์
ความสม่ำเสมอของตัวละครรองรับตัวแบบอ้างอิงได้หลายราย ขึ้นอยู่กับเวิร์กโฟลว์
รุ่นที่วางจำหน่ายผู้สืบทอดหลักจาก Wan 2.6

Wan 2.7 คืออะไร?

Wan 2.7 คือชุดการสร้างวิดีโอแบบมัลติโมดัลระดับเรือธงของ Alibaba ที่สร้างขึ้นสำหรับเวิร์กโฟลว์การสร้างภาพยนตร์ด้วย AI ที่ควบคุมได้ มากกว่าการสร้างวิดีโอจากพรอมป์ต์แบบง่ายๆ ตระกูลโมเดลนี้ผสานการสร้าง การแก้ไข การต่อเนื่อง และความสม่ำเสมอที่ขับเคลื่อนด้วยอ้างอิงไว้ในระบบเดียว ช่วยให้ผู้สร้างสร้างคลิปสั้นแนวภาพยนตร์ที่รักษาความคงตัวของตัวแบบและควบคุมฉากได้ดียิ่งขึ้น

แตกต่างจากเครื่องมือสร้างวิดีโอรุ่นก่อนที่มุ่งเน้นคุณภาพของพรอมป์ต์เป็นหลัก Wan 2.7 ให้ความสำคัญกับความสามารถในการควบคุมผ่านการยึดเฟรม อินพุตอ้างอิง การซิงโครไนซ์เสียง และเวิร์กโฟลว์หลายช็อตแบบมีโครงสร้าง

คุณสมบัติหลักของ Wan 2.7

  • ไปป์ไลน์การวางแผนของ Thinking Mode: โมเดลจะวางแผนองค์ประกอบฉากและการเคลื่อนไหวก่อนเรนเดอร์ ช่วยเพิ่มการยึดตามพรอมป์ต์และลดข้อบกพร่องด้านความสอดคล้อง
  • การควบคุมเฟรมแรกและเฟรมสุดท้าย: ผู้ใช้สามารถกำหนดเฟรมเปิดและเฟรมปิด เพื่อให้ระบบอินเทอร์โพเลตการเคลื่อนไหวระหว่างเฟรมเหล่านั้น
  • ความสม่ำเสมอของอัตลักษณ์ที่ขับเคลื่อนด้วยอ้างอิง: รักษาลักษณะตัวละคร เสื้อผ้า วัตถุ และสไตล์ให้คงที่ข้ามหลายช็อต
  • เวิร์กโฟลว์มัลติโมดัลแบบเนทีฟ: รองรับอ้างอิงข้อความ รูปภาพ เสียง และวิดีโอภายในเวิร์กโฟลว์เดียวกัน
  • การสร้างเสียงแบบบูรณาการ: สามารถสร้างเพลงประกอบ เสียงสภาพแวดล้อม และการซิงโครไนซ์เสียงพูดไปพร้อมกับภาพ
  • รองรับการแก้ไขและการต่อเนื่อง: สามารถขยาย แปลง หรือปรับสไตล์วิดีโอที่มีอยู่ได้โดยไม่ต้องสร้างใหม่ตั้งแต่ต้น

ประสิทธิภาพตามเกณฑ์มาตรฐานของ Wan 2.7

การเปิดเผยเกณฑ์มาตรฐานสาธารณะสำหรับ Wan 2.7 ยังมีจำกัดเมื่อเทียบกับ LLM แบบข้อความ แต่การประเมินโดยบุคคลที่สามและการทดสอบจากชุมชนบ่งชี้ถึงการปรับปรุงที่เด่นชัดในด้านเสถียรภาพของการเคลื่อนไหว การยึดตามพรอมป์ต์ และความสามารถในการควบคุมเมื่อเทียบกับ Wan 2.6

ข้อสังเกตที่มีรายงานในระบบนิเวศประกอบด้วย:

  • ความต่อเนื่องของการเคลื่อนไหวที่ดีขึ้นเมื่อเทียบกับรุ่น Wan ก่อนหน้า
  • อันดับที่สูงขึ้นในตารางจัดอันดับการประเมิน text-to-video ของบุคคลที่สาม
  • ความสม่ำเสมอของหลายตัวแบบและการคงรักษาอ้างอิงที่ดีขึ้น
  • การบูรณาการเสียงที่ดีกว่าโมเดลวิดีโอแบบเปิดรุ่นก่อนจำนวนมาก

ความโปร่งใสของเกณฑ์มาตรฐานอย่างเป็นทางการยังมีจำกัด ดังนั้นควรตีความคำกล่าวอ้างด้านประสิทธิภาพอย่างระมัดระวัง

Wan 2.7 เทียบกับโมเดลวิดีโออื่น

คุณลักษณะWan 2.7Veo 3.1Seedance 2.0
เวิร์กโฟลว์เสียงแบบเนทีฟแข็งแกร่งแข็งแกร่งปานกลาง
ความสม่ำเสมอที่ขับเคลื่อนด้วยอ้างอิงแข็งแกร่งปานกลางปานกลาง
การควบคุมเฟรมแรก + เฟรมสุดท้ายมีบางส่วนจำกัด
เวิร์กโฟลว์การตัดต่อวิดีโอมีมีจำกัด
ความละเอียดสูงสุดที่ใช้กันทั่วไป1080Pเอาต์พุตเชิงภาพยนตร์ระดับสูงกว่า1080P
การรองรับหลายอ้างอิงเน้นย้ำอย่างมากปานกลางปานกลาง

ข้อจำกัดของ Wan 2.7

  • ระยะเวลาคลิปสั้นเมื่อเทียบกับเครื่องมือผลิตงานระยะยาว
  • เอาต์พุตสูงสุด 1080P จำกัดเวิร์กโฟลว์ความละเอียดอัลตราไฮ
  • ฉากที่มีการเคลื่อนไหวเร็วอาจยังเกิดอาร์ติแฟกต์ความไม่เสถียร
  • เวิร์กโฟลว์หลายอ้างอิงเพิ่มความซับซ้อนและข้อกำหนดด้านการออกแบบพรอมป์ต์
  • การรายงานเกณฑ์มาตรฐานสาธารณะยังค่อนข้างเบาบาง

กรณีการใช้งานตัวแทน

  1. ภาพยนตร์สั้นและสตอรีบอร์ดที่คงความสม่ำเสมอของตัวละคร
  2. คลิปการตลาดพร้อมการซิงโครไนซ์เสียง
  3. การสร้างวิดีโอสำหรับโซเชียลมีเดีย
  4. การทำให้เห็นภาพผลิตภัณฑ์และตัวอย่างแนวคิด
  5. เวิร์กโฟลว์การต่อวิดีโอและการอินเทอร์โพเลตฉาก
  6. แอนิเมชันอวตารและตัวละครบนพื้นฐานอ้างอิง

วิธีใช้ WAN 2.7 Video API ใน CometAPI

ขั้นตอนที่ 1: ทดลองใช้ WAN 2.7 Video API ใน Kie Al Playground

ก่อนอื่น ทดสอบความสามารถของ WAN 2.7 โดยใช้ WAN 2.7 Video API ใน CometAPI Playground อัปโหลดรูปภาพ เพิ่มพรอมป์ต์ หรือใช้อ้างอิงเพื่อพรีวิว WAN video ที่สร้างขึ้นก่อนบูรณาการ WAN 2.7 AI video เข้าสู่เวิร์กโฟลว์การผลิตของคุณ

ขั้นตอนที่ 2: ขอรับคีย์ WAN 2.7 API และทบทวนเอกสาร API

ขอรับคีย์ WAN 2.7 API จากคอนโซล CometAPI และทบทวนเอกสาร ทำความเข้าใจ endpoints การรับรองความถูกต้อง และพารามิเตอร์ของ WAN 2.7 Video API เพื่อรองรับเวิร์กโฟลว์ text-to-video, image-to-video และ WAN video

ขั้นตอนที่ 3: สร้าง WAN 2.7 AI videos และผสานเข้ากับเวิร์กโฟลว์ของคุณ

ใช้ WAN 2.7 Video API เพื่อสร้าง WAN 2.7 AI videos ด้วยพรอมป์ต์ รูปภาพ หรืออ้างอิง ผสานผลลัพธ์ของ WAN 2.7 เข้ากับเวิร์กโฟลว์ผลิตภัณฑ์ สายงานคอนเทนต์ หรือเครื่องมือ AI video เพื่อให้การสร้างวิดีโอสามารถขยายขนาดได้

คำถามที่พบบ่อย