Q

Happy Horse 1.0

ต่อวินาที:$0.112
Happy Horse 1.0 — โมเดลการสร้างสื่อภาพและเสียงคุณภาพสูงที่รองรับการสร้างวิดีโอจากข้อความและจากภาพ สามารถสร้างภาพ เสียง และการขยับริมฝีปากที่ซิงโครไนซ์กัน จึงเหมาะสำหรับภาพยนตร์สั้น งานครีเอทีฟโฆษณา และการนำเสนอสินค้า
ใหม่
ใช้งานเชิงพาณิชย์

ข้อกำหนดทางเทคนิคของ HappyHorse-1.0

รายการHappyHorse-1.0
ผู้ให้บริการAlibaba (มีรายงานต่อสาธารณะหลังจากเปิดตัวแบบไม่เปิดเผยชื่อในเบนช์มาร์ก)
ประเภทโมเดลการสร้างวิดีโอ AI แบบมัลติโมดัล
อินพุตข้อความ, รูปภาพ
เอาต์พุตวิดีโอ + เสียงที่ซิงโครไนซ์
สถาปัตยกรรมTransformer แบบสตรีมเดี่ยวแบบรวม
จำนวนพารามิเตอร์~15B
ความละเอียดการสร้าง 1080p แบบเนทีฟ
โหมดการสร้างการสร้างเสียง-วิดีโอร่วมกัน
การลดสัญญาณรบกวนการอนุมานแบบกลั่น (~8 ขั้นตอนตามรายงาน)
การรองรับภาษาการลิปซิงก์หลายภาษา (รายงานว่า 7 ภาษา)

HappyHorse-1.0 คืออะไร

HappyHorse-1.0 เป็นโมเดลสร้างวิดีโอ AI ระดับแนวหน้าที่ออกแบบมาเพื่อสร้างวิดีโอและเสียงที่ซิงโครไนซ์ในไปป์ไลน์เดียว แทนการผสานหลายโมเดลเข้าด้วยกัน รายงานสาธารณะระบุว่าโมเดลปรากฏตัวอย่างไม่เปิดเผยชื่อในเวทีเบนช์มาร์ก ก่อนจะถูกเชื่อมโยงกับความพยายามด้าน AI ของ Alibaba ในภายหลัง

ต่างจากระบบข้อความสู่วิดีโอแบบดั้งเดิมที่เรนเดอร์ภาพก่อนแล้วค่อยซ้อนเสียงภายหลัง HappyHorse ให้ความสำคัญกับการซิงโครไนซ์แบบเนทีฟระหว่างการเคลื่อนไหว เสียงพูด บรรยากาศ และจังหวะเวลา

คุณสมบัติหลักของ HappyHorse-1.0

  • การสร้างเสียง + วิดีโอร่วมกันในครั้งเดียว
  • เอาต์พุต 1080p แบบเนทีฟ แทนการบังคับอัปสเกล
  • เวิร์กโฟลว์ข้อความสู่วิดีโอและภาพสู่วิดีโอ
  • ไปป์ไลน์การสร้างแบบกลั่นที่รวดเร็ว
  • การลิปซิงก์หลายภาษา
  • การเคลื่อนกล้องเชิงภาพยนตร์และการเน้นความต่อเนื่องของฉาก

ผลการทดสอบเบนช์มาร์กของ HappyHorse-1.0

รายงานเบนช์มาร์กสาธารณะชี้ว่า:

  • Artificial Analysis Arena:
    • Elo ข้อความสู่วิดีโอ: ~1330+
    • Elo ภาพสู่วิดีโอ: ~1390+
  • จัดอยู่ในอันดับที่หรือใกล้เคียง #1 ในสแนปชอตกระดานจัดอันดับสาธารณะช่วงต้นการเปิดตัว

คำตีความเบนช์มาร์ก: คะแนนเหล่านี้เป็นคะแนนกระดานจัดอันดับแบบอิงความชอบ และไม่ควรถูกตีความว่าเป็นการจัดอันดับคุณภาพสากลสำหรับงานผลิตทั้งหมด

HappyHorse-1.0 เทียบกับโมเดลที่คล้ายกัน

ความสามารถHappyHorse-1.0Seedance 2.0Kling 3.0
การรวมเสียง + วิดีโอใช่ใช่บางส่วน
1080p แบบเนทีฟใช่ใช่ใช่
แนวทางการปล่อยแบบเปิดประกาศแล้วเชิงกรรมสิทธิ์เชิงกรรมสิทธิ์
ข้อความ→วิดีโอใช่ใช่ใช่
ภาพ→วิดีโอใช่ใช่ใช่
การลิปซิงก์หลายภาษารายงานว่า 7หลายภาษาหลายภาษา

ฉันจะใช้ HappyHorse-1.0 กับ CometAPI ได้อย่างไร

  1. ขอรับข้อมูลรับรอง API.
  2. เลือก happyhorse-1.0.
  3. ส่งคำขอสร้างด้วยพรอมป์ต์ + ตัวเลือกการสร้าง.
  4. ดึงผลลัพธ์สื่อที่สร้างแล้ว.

คำถามที่พบบ่อย