تتيح واجهة برمجة تطبيقات MidJourney Video للمطورين إنشاء محتوى فيديو تم إنشاؤه بواسطة الذكاء الاصطناعي ومعالجته واسترجاعه برمجيًا باستخدام نماذج MidJourney والمطالبات.
نظرة عامة
فيديو ميدجورني هو أول نموذج لإنشاء الفيديو (نموذج الفيديو الإصدار 1) الذي أطلقته ميدجورني في 18 يونيو 2025. يقدم هذا النموذج سير عمل "تحويل الصور إلى فيديو" الذي يحوّل الصور الثابتة، سواءً المُولّدة بالذكاء الاصطناعي أو التي يرفعها المستخدمون، إلى مقاطع فيديو متحركة قصيرة. يُمثّل هذا توسّع ميدجورني من إنشاء الصور الثابتة إلى محتوى ديناميكي، مما يضعها في مصاف أدوات الفيديو الأخرى القائمة على الذكاء الاصطناعي من جوجل، وOpenAI، وMeta.
كيف يعمل فيديو منتصف الرحلة
- سير عمل تحويل الصورة إلى فيديو:يمكنك توفير صورة مُولّدة من Midjourney أو صورة خارجية، بالإضافة إلى مُطالبة حركة اختيارية. بعد ذلك، يُفسّر نموذج Midjourney "من يتحرك"، "كيف يتحرك"، و"ماذا يحدث بعد ذلك" لتحريك المشهد لمدة 5 ثوانٍ تقريبًا افتراضيًا.
- الرسوم المتحركة التلقائية مقابل الرسوم المتحركة اليدويةفي الوضع التلقائي، يستنتج النظام معلمات الحركة ومسارات الكاميرا. يتيح لك الوضع اليدوي ضبط جوانب مثل زاوية الكاميرا ومسار الهدف والسرعة، مما يمنحك تحكمًا إبداعيًا أكبر.
العمارة الفنية
تم بناء Midjourney Video على أساس هندسة المحولات تم تحسينه للتعامل معه الاتساق الزمني عبر الإطارات. يعمل خط الأنابيب كما يلي:
- ميزة استخراج:يتم معالجة الصورة المدخلة من خلال طبقات التحويل والتلافيفية العميقة لالتقاط الميزات المكانية.
- إنشاء الإطار الرئيسي:تم تجميع مجموعة صغيرة من الإطارات التمثيلية.
- إطار الاستيفاء:تعمل النماذج الفرعية المتخصصة على توليد إطارات وسيطة، مما يضمن سلاسة تركيب الحركة بين الإطارات الرئيسية.
- تكييف الحركة: اعتمادا علي مرتفع or حركة منخفضة من خلال الإعدادات (وأي مطالبات يدوية)، يقوم النموذج بتعديل مسارات الكائنات والكاميرا.
إصدار النموذج وخريطة الطريق
نموذج فيديو V1 (يونيو 2025):الإصدار الأول يركز على تحويل الصور إلى مقاطع فيديو.
الأداء المعياري
تضع التقييمات المبكرة نموذج V1 في وضع تنافسي:
- جودة الإطار (درجة FID):يحقق مسافة بداية فريشيت 22.4، متفوقًا على نماذج الفيديو مفتوحة المصدر القابلة للمقارنة بنحو 15% على معايير الفيديو القياسية.
- السلاسة الزمنية (مقياس TS):يسجل درجة النعومة الزمنية 0.88 على مجموعة بيانات DAVIS، مما يشير إلى استمرارية بصرية عالية عبر الإطارات.
- كمون:متوسط وقت توليد 12 ثانية لكل مقطع على وحدة معالجة رسومية واحدة NVIDIA A100، مما يحقق التوازن بين الأداء وتوقعات المستخدم.
- مقاييس الجودة:يحقق حركة استقلال جنوب السودان (مؤشر التشابه البنيوي) أعلاه 0.85 على مجموعات بيانات الحركة الاصطناعية عند مقارنتها بمقاطع الحقيقة الأرضية، مما يشير إلى الدقة العالية لأنماط الحركة الطبيعية.
ملاحظات:تعكس هذه الأرقام الاختبارات الداخلية التي أجرتها Midjourney؛ وقد يختلف الأداء الخارجي بناءً على مستوى الحمل والاشتراك.
الميزات الرئيسية للإصدار V1
- طول المقطع:تستغرق المقاطع الأساسية حوالي 5 ثوانٍ؛ ويمكنك تمديدها بزيادات قدرها 4 ثوانٍ حتى تصل إلى 21 ثانية إجمالاً.
- تناسق النمطتحافظ الرسوم المتحركة على الأسلوب الفني للصورة الأصلية - حيث تنتقل ضربات الفرشاة ولوحات الألوان والمزاج عبر الحركة.
- الأداء والسرعة:يتم عرض مقطع فيديو نموذجي مكون من 4 أجزاء (حوالي 17 ثانية) في أقل من 70 ثانية، مع تحقيق التوازن بين الجودة والتكرار السريع.
- دقة الشاشة :محدود حاليًا عند 480 بكسل، وهو دقة واضحة لمقاطع الفيديو على غرار وسائل التواصل الاجتماعي ولكنها غير مخصصة للشاشات الكبيرة أو المشاريع التجارية الراقية.
كيفية الاتصال بـ MidJourney Video API من CometAPI
MidJourney Video أسعار API في CometAPI أقل من السعر الرسمي:
| نموذج الاسم | حساب السعر |
mj_fast_video | 0.6 |
الخطوات المطلوبة
- تسجيل الدخول إلى كوميتابي.كوم. إذا لم تكن مستخدمًا لدينا بعد، فيرجى التسجيل أولاً
- احصل على مفتاح API لبيانات اعتماد الوصول للواجهة. انقر على "إضافة رمز" في رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx، ثم أرسله.
- احصل على عنوان URL لهذا الموقع: https://api.cometapi.com/
استخدام API
- أرسل طلب واجهة برمجة التطبيقات (API) وحدد نص الطلب. يمكنك الحصول على طريقة الطلب ونصه من وثيقة واجهة برمجة التطبيقات (API) على موقعنا الإلكتروني. كما يوفر موقعنا اختبار Apifox لتسهيل الأمر عليك.
- يستبدل باستخدام مفتاح CometAPI الفعلي الخاص بك من حسابك.
- أدخل سؤالك أو طلبك في حقل المحتوى - وهذا ما سيستجيب له النموذج.
- . قم بمعالجة استجابة API للحصول على الإجابة الناتجة.

تكامل واجهة برمجة التطبيقات CometAPI
حاليا، V1 متاح للويب فقط عبر Midjourney's بوت ديسكورد، لكن الأغلفة غير الرسمية (على سبيل المثال، CometAPI) توفر نقاط النهاية، ويمكن للمطورين التكامل عبر:
يمكن للمطورين دمج إنشاء الفيديو عبر واجهة برمجة تطبيقات RESTful. هيكل طلب نموذجي (توضيحي):
curl --
location
--request POST 'https://api.cometapi.com/mj/submit/video' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'
انظر أيضا كيفية استخدام نموذج الفيديو V1 الخاص بـ Midjourney؟



