API วิดีโอ Midjourney

CometAPI
AnnaJul 2, 2025
API วิดีโอ Midjourney

MidJourney Video API ช่วยให้นักพัฒนาสามารถสร้าง จัดการ และดึงเนื้อหาวิดีโอที่สร้างโดย AI โดยใช้โมเดลและคำแนะนำของ MidJourney

ภาพรวมสินค้า

Midjourney Video เป็นโมเดลการสร้างวิดีโอรุ่นแรก (Video Model V1) ที่เปิดตัวโดย Midjourney เมื่อวันที่ 18 มิถุนายน 2025 โดยนำเสนอเวิร์กโฟลว์ "ภาพเป็นวิดีโอ" ที่แปลงภาพนิ่งที่สร้างโดย AI หรืออัปโหลดโดยผู้ใช้ให้กลายเป็นคลิปภาพเคลื่อนไหวสั้นๆ ซึ่งถือเป็นการขยายขอบเขตของ Midjourney จากการสร้างภาพนิ่งให้กลายเป็นเนื้อหาแบบไดนามิก โดยวางตำแหน่งให้อยู่เคียงข้างเครื่องมือวิดีโอ AI อื่นๆ จาก Google, OpenAI และ Meta

วิดีโอ MidJourney ทำงานอย่างไร

  • เวิร์กโฟลว์ภาพเป็นวิดีโอ:คุณจัดเตรียมรูปภาพที่สร้างโดย Midjourney หรือรูปภาพภายนอก พร้อมคำแนะนำการเคลื่อนไหวที่เป็นทางเลือก จากนั้นโมเดลของ Midjourney จะตีความว่า “ใครกำลังเคลื่อนไหว” “พวกเขาเคลื่อนไหวอย่างไร” และ “จะเกิดอะไรขึ้นต่อไป” เพื่อสร้างแอนิเมชั่นฉากเป็นเวลาประมาณ 5 วินาทีตามค่าเริ่มต้น
  • แอนิเมชั่นแบบอัตโนมัติเทียบกับแบบแมนนวล:ในโหมดอัตโนมัติ ระบบจะอนุมานพารามิเตอร์การเคลื่อนไหวและเส้นทางของกล้อง โหมดแมนนวลช่วยให้คุณปรับแต่งด้านต่างๆ เช่น มุมกล้อง เส้นทางของวัตถุ และความเร็วได้อย่างละเอียด ช่วยให้ควบคุมได้อย่างสร้างสรรค์มากขึ้น

สถาปัตยกรรมทางเทคนิค

Midjourney Video ถูกสร้างขึ้นจาก สถาปัตยกรรมหม้อแปลงไฟฟ้า ปรับปรุงให้รองรับได้ดียิ่งขึ้น ความสม่ำเสมอชั่วคราว ข้ามเฟรม ไพพ์ไลน์ทำงานดังนี้:

  1. คุณสมบัติการสกัด:ภาพอินพุตจะถูกประมวลผลผ่านเลเยอร์คอนโวลูชั่นและเลเยอร์หม้อแปลงแบบลึกเพื่อจับภาพคุณลักษณะเชิงพื้นที่
  2. การสร้างคีย์เฟรม:มีการสังเคราะห์เฟรมตัวแทนชุดเล็ก ๆ
  3. การแก้ไขเฟรม:โมเดลย่อยเฉพาะทางสร้างเฟรมกลางเพื่อให้แน่ใจว่าราบรื่น การสังเคราะห์การเคลื่อนไหว ระหว่างคีย์เฟรม
  4. การปรับสภาพการเคลื่อนไหว: ขึ้นอยู่กับ จุดสูง or การเคลื่อนไหวต่ำ การตั้งค่า (และคำแนะนำด้วยตนเอง) โมเดลจะปรับวิถีวัตถุและกล้อง

การกำหนดเวอร์ชันและแผนงานของโมเดล

แบบจำลองวิดีโอ V1 (มิถุนายน 2025):การเปิดตัวครั้งแรกมุ่งเน้นไปที่การแปลงรูปภาพเป็นวิดีโอ

ประสิทธิภาพมาตรฐาน

การประเมินในระยะเริ่มต้นทำให้โมเดล V1 มีตำแหน่งในการแข่งขัน:

  • คุณภาพเฟรม (คะแนน FID):บรรลุระยะเริ่มต้นของ Fréchet 22.4ซึ่งมีประสิทธิภาพเหนือกว่าโมเดลวิดีโอโอเพนซอร์สที่เทียบเคียงได้ประมาณ 15% ในเกณฑ์มาตรฐานวิดีโอ
  • ความนุ่มนวลตามกาลเวลา (TS Metric):บันทึกคะแนนความนุ่มนวลชั่วคราวของ 0.88 บนชุดข้อมูล DAVIS ซึ่งระบุถึงความต่อเนื่องของภาพที่สูงระหว่างเฟรม
  • ความแอบแฝง: เวลาเฉลี่ยในการสร้าง วินาที 12 ต่อคลิปบน GPU NVIDIA A100 ตัวเดียว ช่วยรักษาสมดุลของประสิทธิภาพและความคาดหวังของผู้ใช้
  • ตัวชี้วัดคุณภาพ: บรรลุผลสำเร็จ เอสซิม (ดัชนีความคล้ายคลึงเชิงโครงสร้าง) ด้านบน 0.85 ในชุดข้อมูลการเคลื่อนไหวสังเคราะห์เมื่อเปรียบเทียบกับคลิปข้อมูลพื้นฐาน ซึ่งบ่งชี้ว่า ความจงรักภักดีสูง สู่รูปแบบการเคลื่อนไหวที่เป็นธรรมชาติ

หมายเหตุตัวเลขเหล่านี้สะท้อนถึงการทดสอบภายในของ Midjourney ประสิทธิภาพภายนอกอาจแตกต่างกันขึ้นอยู่กับโหลดและระดับการสมัครสมาชิก

คุณสมบัติหลักของ V1

  • ความยาวคลิป:คลิปฐานมีความยาวประมาณ 5 วินาที และสามารถเพิ่มความยาวได้ครั้งละ 4 วินาที สูงสุดรวม 21 วินาที
  • ความสม่ำเสมอของสไตล์:แอนิเมชั่นยังคงรูปแบบศิลปะของภาพต้นฉบับไว้ ไม่ว่าจะเป็นจังหวะแปรง จานสี และอารมณ์ที่ถ่ายทอดผ่านการเคลื่อนไหว
  • ประสิทธิภาพและความเร็ว:วิดีโอ 4 ส่วนทั่วไป (ประมาณ 17 วินาที) เรนเดอร์ในเวลาต่ำกว่า 70 วินาที โดยรักษาสมดุลระหว่างคุณภาพและการทำงานที่รวดเร็ว
  • ความละเอียด:ปัจจุบันจำกัดไว้ที่ 480p ซึ่งชัดเจนสำหรับคลิปสไตล์โซเชียลมีเดีย แต่ไม่ได้มุ่งเป้าไปที่หน้าจอขนาดใหญ่หรือโปรเจ็กต์เชิงพาณิชย์ระดับไฮเอนด์

วิธีการเรียกใช้ MidJourney Video API จาก CometAPI

MidJourney Video ราคา API ใน CometAPI ต่ำกว่าราคาอย่างเป็นทางการ:

ชื่อรุ่นคำนวณราคา
mj_fast_video0.6

ขั้นตอนที่ต้องดำเนินการ

  • เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
  • รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง
  • รับ url ของเว็บไซต์นี้: https://api.cometapi.com/

การใช้ API

  1. ส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา นอกจากนี้ เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย
  2. แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
  3. แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
  4. ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น

API วิดีโอ Midjourney

การรวม API ของ CometAPI

ปัจจุบัน V1 สามารถเข้าถึงได้ เฉพาะเว็บเท่านั้น ผ่านทาง Midjourney's บอท Discordแต่ ตัวห่อหุ้มที่ไม่เป็นทางการ (เช่น CometAPI) ให้จุดสิ้นสุด นักพัฒนาสามารถบูรณาการได้ผ่าน:

นักพัฒนาสามารถบูรณาการการสร้างวิดีโอผ่าน RESTful API โครงสร้างคำขอทั่วไป (ตัวอย่าง):

curl --
location 
--request POST 'https://api.cometapi.com/mj/submit/video' \ 
--header 'Authorization: Bearer {{api-key}}' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'

ดูเพิ่มเติม วิธีการใช้โมเดลวิดีโอ V1 ของ Midjourney?

SHARE THIS BLOG

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%