MidJourney Video API ช่วยให้นักพัฒนาสามารถสร้าง จัดการ และดึงเนื้อหาวิดีโอที่สร้างโดย AI โดยใช้โมเดลและคำแนะนำของ MidJourney
ภาพรวมสินค้า
Midjourney Video เป็นโมเดลการสร้างวิดีโอรุ่นแรก (Video Model V1) ที่เปิดตัวโดย Midjourney เมื่อวันที่ 18 มิถุนายน 2025 โดยนำเสนอเวิร์กโฟลว์ "ภาพเป็นวิดีโอ" ที่แปลงภาพนิ่งที่สร้างโดย AI หรืออัปโหลดโดยผู้ใช้ให้กลายเป็นคลิปภาพเคลื่อนไหวสั้นๆ ซึ่งถือเป็นการขยายขอบเขตของ Midjourney จากการสร้างภาพนิ่งให้กลายเป็นเนื้อหาแบบไดนามิก โดยวางตำแหน่งให้อยู่เคียงข้างเครื่องมือวิดีโอ AI อื่นๆ จาก Google, OpenAI และ Meta
วิดีโอ MidJourney ทำงานอย่างไร
- เวิร์กโฟลว์ภาพเป็นวิดีโอ:คุณจัดเตรียมรูปภาพที่สร้างโดย Midjourney หรือรูปภาพภายนอก พร้อมคำแนะนำการเคลื่อนไหวที่เป็นทางเลือก จากนั้นโมเดลของ Midjourney จะตีความว่า “ใครกำลังเคลื่อนไหว” “พวกเขาเคลื่อนไหวอย่างไร” และ “จะเกิดอะไรขึ้นต่อไป” เพื่อสร้างแอนิเมชั่นฉากเป็นเวลาประมาณ 5 วินาทีตามค่าเริ่มต้น
- แอนิเมชั่นแบบอัตโนมัติเทียบกับแบบแมนนวล:ในโหมดอัตโนมัติ ระบบจะอนุมานพารามิเตอร์การเคลื่อนไหวและเส้นทางของกล้อง โหมดแมนนวลช่วยให้คุณปรับแต่งด้านต่างๆ เช่น มุมกล้อง เส้นทางของวัตถุ และความเร็วได้อย่างละเอียด ช่วยให้ควบคุมได้อย่างสร้างสรรค์มากขึ้น
สถาปัตยกรรมทางเทคนิค
Midjourney Video ถูกสร้างขึ้นจาก สถาปัตยกรรมหม้อแปลงไฟฟ้า ปรับปรุงให้รองรับได้ดียิ่งขึ้น ความสม่ำเสมอชั่วคราว ข้ามเฟรม ไพพ์ไลน์ทำงานดังนี้:
- คุณสมบัติการสกัด:ภาพอินพุตจะถูกประมวลผลผ่านเลเยอร์คอนโวลูชั่นและเลเยอร์หม้อแปลงแบบลึกเพื่อจับภาพคุณลักษณะเชิงพื้นที่
- การสร้างคีย์เฟรม:มีการสังเคราะห์เฟรมตัวแทนชุดเล็ก ๆ
- การแก้ไขเฟรม:โมเดลย่อยเฉพาะทางสร้างเฟรมกลางเพื่อให้แน่ใจว่าราบรื่น การสังเคราะห์การเคลื่อนไหว ระหว่างคีย์เฟรม
- การปรับสภาพการเคลื่อนไหว: ขึ้นอยู่กับ จุดสูง or การเคลื่อนไหวต่ำ การตั้งค่า (และคำแนะนำด้วยตนเอง) โมเดลจะปรับวิถีวัตถุและกล้อง
การกำหนดเวอร์ชันและแผนงานของโมเดล
แบบจำลองวิดีโอ V1 (มิถุนายน 2025):การเปิดตัวครั้งแรกมุ่งเน้นไปที่การแปลงรูปภาพเป็นวิดีโอ
ประสิทธิภาพมาตรฐาน
การประเมินในระยะเริ่มต้นทำให้โมเดล V1 มีตำแหน่งในการแข่งขัน:
- คุณภาพเฟรม (คะแนน FID):บรรลุระยะเริ่มต้นของ Fréchet 22.4ซึ่งมีประสิทธิภาพเหนือกว่าโมเดลวิดีโอโอเพนซอร์สที่เทียบเคียงได้ประมาณ 15% ในเกณฑ์มาตรฐานวิดีโอ
- ความนุ่มนวลตามกาลเวลา (TS Metric):บันทึกคะแนนความนุ่มนวลชั่วคราวของ 0.88 บนชุดข้อมูล DAVIS ซึ่งระบุถึงความต่อเนื่องของภาพที่สูงระหว่างเฟรม
- ความแอบแฝง: เวลาเฉลี่ยในการสร้าง วินาที 12 ต่อคลิปบน GPU NVIDIA A100 ตัวเดียว ช่วยรักษาสมดุลของประสิทธิภาพและความคาดหวังของผู้ใช้
- ตัวชี้วัดคุณภาพ: บรรลุผลสำเร็จ เอสซิม (ดัชนีความคล้ายคลึงเชิงโครงสร้าง) ด้านบน 0.85 ในชุดข้อมูลการเคลื่อนไหวสังเคราะห์เมื่อเปรียบเทียบกับคลิปข้อมูลพื้นฐาน ซึ่งบ่งชี้ว่า ความจงรักภักดีสูง สู่รูปแบบการเคลื่อนไหวที่เป็นธรรมชาติ
หมายเหตุตัวเลขเหล่านี้สะท้อนถึงการทดสอบภายในของ Midjourney ประสิทธิภาพภายนอกอาจแตกต่างกันขึ้นอยู่กับโหลดและระดับการสมัครสมาชิก
คุณสมบัติหลักของ V1
- ความยาวคลิป:คลิปฐานมีความยาวประมาณ 5 วินาที และสามารถเพิ่มความยาวได้ครั้งละ 4 วินาที สูงสุดรวม 21 วินาที
- ความสม่ำเสมอของสไตล์:แอนิเมชั่นยังคงรูปแบบศิลปะของภาพต้นฉบับไว้ ไม่ว่าจะเป็นจังหวะแปรง จานสี และอารมณ์ที่ถ่ายทอดผ่านการเคลื่อนไหว
- ประสิทธิภาพและความเร็ว:วิดีโอ 4 ส่วนทั่วไป (ประมาณ 17 วินาที) เรนเดอร์ในเวลาต่ำกว่า 70 วินาที โดยรักษาสมดุลระหว่างคุณภาพและการทำงานที่รวดเร็ว
- ความละเอียด:ปัจจุบันจำกัดไว้ที่ 480p ซึ่งชัดเจนสำหรับคลิปสไตล์โซเชียลมีเดีย แต่ไม่ได้มุ่งเป้าไปที่หน้าจอขนาดใหญ่หรือโปรเจ็กต์เชิงพาณิชย์ระดับไฮเอนด์
วิธีการเรียกใช้ MidJourney Video API จาก CometAPI
MidJourney Video ราคา API ใน CometAPI ต่ำกว่าราคาอย่างเป็นทางการ:
| ชื่อรุ่น | คำนวณราคา |
mj_fast_video | 0.6 |
ขั้นตอนที่ต้องดำเนินการ
- เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
- รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง
- รับ url ของเว็บไซต์นี้: https://api.cometapi.com/
การใช้ API
- ส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา นอกจากนี้ เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย
- แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
- แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
- ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น

การรวม API ของ CometAPI
ปัจจุบัน V1 สามารถเข้าถึงได้ เฉพาะเว็บเท่านั้น ผ่านทาง Midjourney's บอท Discordแต่ ตัวห่อหุ้มที่ไม่เป็นทางการ (เช่น CometAPI) ให้จุดสิ้นสุด นักพัฒนาสามารถบูรณาการได้ผ่าน:
นักพัฒนาสามารถบูรณาการการสร้างวิดีโอผ่าน RESTful API โครงสร้างคำขอทั่วไป (ตัวอย่าง):
curl --
location
--request POST 'https://api.cometapi.com/mj/submit/video' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'
ดูเพิ่มเติม วิธีการใช้โมเดลวิดีโอ V1 ของ Midjourney?



