Runway Gen-4.5 هو أحدث نموذج رائد للشركة لتحويل النصوص إلى فيديو، وقد أُعلن عنه في 1 ديسمبر 2025. ويُعدّ تطورًا تدريجيًا وهادفًا مقارنةً بسلسلة Gen-4، مع تحسينات مُركّزة في جودة الحركة، والاستجابة السريعة، والواقعية الزمنية/الفيزيائية - وهي الجوانب التي كانت تُميّز تاريخيًا بين فيديوهات الذكاء الاصطناعي "الجيدة" وفيديوهات الذكاء الاصطناعي "الواقعية". يتصدر Runway Gen-4.5 قائمة أفضل 1,247 نقطة Elo في مجال تحويل النصوص إلى فيديو باستخدام التحليل الاصطناعي، وهو مُصمّم لتقديم مخرجات سينمائية قابلة للتحكم، مع الاحتفاظ ببعض القيود النموذجية للذكاء الاصطناعي التوليدي، مثل عيوب التفاصيل الصغيرة والأخطاء السببية العرضية.
فيما يلي نظرة عميقة وعملية ومدعومة بالأدلة (حيثما أمكن) حول ماهية Gen-4.5، وما الجديد مقارنةً بـ Gen-4، وكيف يقارن بالمنافسين مثل Veo (3.1) من Google وSora 2 من OpenAI، وإشارات الأداء في العالم الحقيقي ومطالبات المعايير، ومناقشة صريحة للقيود والمخاطر وأفضل الممارسات.
ما هو Runway Gen-4.5؟
Runway Gen-4.5 هو أحدث طراز من Runway لتحويل النصوص إلى مقاطع فيديو، وقد طُرح كترقية تكرارية ومهمة لسلسلة Gen-4 من الشركة. تُصنّف Runway الجيل 4.5 كـ"أفق جديد" في مجال تحويل النصوص إلى مقاطع فيديو، مُركّزة على ثلاثة تحسينات رئيسية مُقارنةً بالإصدارات السابقة: دقة فيزيائية مُحسّنة بشكل ملحوظ (أجسام تحمل وزنًا وزخمًا واقعيين)، وثباتًا أسرع (ما تطلبه هو ما تحصل عليه بشكل أكثر موثوقية)، ودقة بصرية أعلى عبر الحركة والوقت (تفاصيل مثل الشعر، ونسيج القماش، وانعكاسية السطح تبقى متماسكة عبر الإطارات). يتصدّر الجيل 4.5 حاليًا قوائم المتصدرين المُحكمة بشريًا والمُستخدمة في مُقارنات تحويل النصوص إلى مقاطع فيديو.
من أين جاء Runway Gen-4.5 ولماذا هذا الأمر مهم؟
تطورت نماذج الفيديو في Runway بسرعة من الجيل الأول إلى الجيل الثالث/ألفا وصولاً إلى الجيل الرابع؛ ويُقدم الجيل الرابع 4.5 كدمج وتحسين للترقيات الهيكلية، واستراتيجيات بيانات ما قبل التدريب، وتقنيات ما بعد التدريب، بهدف تعظيم الديناميكيات والاتساق الزمني وإمكانية التحكم. بالنسبة للمبدعين وفرق الإنتاج، تهدف هذه التحسينات إلى جعل المقاطع المُولّدة بالذكاء الاصطناعي مفيدة وظيفيًا في المعاينة المسبقة، ومحتوى الإعلان والتسويق، وإنتاج السرد القصير، من خلال تقليل طابع "المسودة الأولية" الذي كانت تُقدمه نماذج تحويل النص إلى فيديو السابقة.
4 ميزات رئيسية لـ Runway Gen-4.5
1) تحسين الواقعية الفيزيائية وديناميكيات الحركة
يُركز إصدار Runway Gen-4.5 على حركة أكثر سلاسةً وواقعيةً. يُركز على حركة الأجسام الواقعية - الوزن، القصور الذاتي، السوائل، القماش، والاصطدامات الواقعية - مما يُنتج تسلسلات تبدو فيها التفاعلات أقل "عائمةً" وأكثر واقعيةً. في العروض التوضيحية واختباري، أظهر النموذج مساراتٍ مُحسّنةً للأجسام، وواقعيةً في حركة الكاميرا، وتراجعًا في عيوب "العائمة" التي كانت تُعاني منها نماذج الفيديو السابقة. يُعد هذا أحد أبرز الترقيات مقارنةً بالجيل الرابع.
2) الدقة البصرية وضوابط الأسلوب
يُوسّع Runway Gen-4.5 أوضاع التحكم في Runway (تحويل النص إلى فيديو، وتحويل الصورة إلى فيديو، وتحويل الفيديو إلى فيديو، والإطارات الرئيسية)، ويُحسّن العرض الواقعي للصور، والأسلوب، والتركيب السينمائي. وتزعم Runway أن Gen-4.5 قادر على إنتاج مقاطع واقعية يصعب تمييزها عن اللقطات الحقيقية في تسلسلات قصيرة، خاصةً عند دمجها مع صورة مرجعية جيدة أو إطارات رئيسية.
3) الالتزام السريع والوعي التكويني بشكل أفضل.
يوضح النموذج دقة محسنة عندما تتضمن المطالبات ممثلين متعددين أو اتجاهات الكاميرا أو قيود استمرارية عبر المشهد؛ فهو يلتزم بالتعليمات بشكل أكثر موثوقية مقارنة بالأجيال السابقة. كما يوفر دقة أعلى في اتباع المطالبات الوصفية، مما يؤدي إلى تقليل العناصر المهلوسة أو غير ذات الصلة عبر المقطع.
4) تفاصيل بصرية أعلى واستقرار زمني.
تم تحسين ملمس السطح، واستمرارية الشعر/الخيوط، وثبات الإضاءة عبر الإطارات بشكل ملحوظ. كما قلّ احتمال تغير مظهر الشخصيات والأشياء أثناء التصوير. تدّعي Runway أن هذه التحسينات تحققت مع الحفاظ على زمن انتقال الجيل الرابع. ومن أبرز التطورات الموجهة نحو الإنتاج تحسين تعامل النموذج مع تعابير وجه الشخصية والانفعالات الضمنية في اللقطات. مع أن Runway Gen-4.5 ليس بديلاً عن الممثلين المدربين، إلا أنه يحافظ على الاستمرارية الانفعالية بشكل أفضل (على سبيل المثال، يستمر تعبير الشخصية خلال حركة الكاميرا)، ويمكنه توليد إشارات أداء معقولة من خلال توجيهات موجزة مثل "ابتسامة قلق، نظرة عابرة، تنفس بحدة".
كيف يعمل Runway Gen-4.5 في الاختبارات القياسية والحقيقية؟
تقرير Runway عن درجة ELO 1,247 في قائمة متصدري تحليل النص إلى الفيديو الاصطناعي (حتى تاريخ الإعلان) - مما يضع الجيل 4.5 في صدارة هذا المعيار تحديدًا وقت إعداد التقرير. تستخدم معايير كهذه أحكامًا تفضيلية بشرية أو آلية ثنائية عبر العديد من مخرجات النماذج؛

الأداء العملي (ما يمكن للمستخدمين توقعه)
- أطوال المقاطع والدقة: تم تحسين الجيل 4.5 حاليًا للمقاطع السينمائية القصيرة (عادةً ما تتراوح مخرجات اللقطات الفردية بين 4 و20 ثانية بدقة عالية/1080 بكسل). ركزت Runway على تقديم دقة أعلى دون زيادة زمن الوصول مقارنةً بالجيل 4.
- أوقات العرض والتكلفة: الرسالة التي تبعث بها Runway هي أن التكاليف/الزمن المستغرق قابلة للمقارنة مع الجيل الرابع عبر مستويات الاشتراك؛ وسوف تختلف الأوقات في العالم الحقيقي وفقًا للدقة المختارة وإعدادات الجودة وحمل قائمة الانتظار.
ما هو الفرق بين Runway Gen-4.5 و Gen-4؟
أسس الجيل الرابع أهداف إنتاج Runway: شخصيات متناسقة، وأنماط تحكم من صورة إلى فيديو (صورة ← فيديو، إطارات رئيسية، فيديو ← فيديو)، والتركيز على سير عمل المستخدم. حافظ الجيل الرابع والخامس على هذا الأساس، لكنه دفعه إلى الأمام. نمذجة العالم (الفيزياء والحركة) و الالتزام السريع مزيد من الأداء دون التضحية بالإنتاجية. عمليًا، قد يظل الجيل الرابع ممتازًا للمهام السريعة والمصممة بأسلوب أنيق وبميزانيات أقل؛ أما الجيل الرابع 4.5 فهو الخيار الأمثل عندما تحتاج إلى ديناميكيات أكثر واقعية وتحكم أكثر دقة.
ما الذي تغير من الناحية الفنية (المستوى العالي)
يُصوَّر Runway Gen-4.5 على أنه تطورٌ وليس إعادة صياغةٍ معماريةٍ كاملة. تشير مواد Runway إلى أن النموذج يستفيد من تحسين كفاءة بيانات ما قبل التدريب وتقنيات ما بعد التدريب (مثل الضبط الدقيق المُوجَّه والتنظيم الزمني). عمليًا، يُترجم ذلك إلى نمذجةٍ أفضل للوزن/الحركة، ومشاهد متعددة العناصر أكثر تماسكًا، وحفظٍ مُحسَّنٍ للتفاصيل عالية التردد (مثل الشعر، ونسيج القماش) عبر الإطارات.
الاختلافات العملية التي سيلاحظها المبدعون
- سلوك جسدي أفضل: تخضع الأشياء للكتلة المدركة وتتصرف السوائل بشكل أكثر منطقية.
- انقطاعات أقل في الهوية: من غير المرجح أن تتغير مظهر الشخصيات والأشياء في منتصف المقطع.
- نفس السرعة، جودة أعلى: أداء حالات المدرج (زمن الوصول) يُضاهي أداء الجيل الرابع، مع ارتفاع الجودة. هذا يجعل الجيل الرابع 4.5 جذابًا لفرق الإنتاج التي لا تستطيع تحمّل تأخيرات كبيرة في العرض.
متى تختار الجيل الرابع مقابل الجيل الرابع والخامس؟
- استعمل الجنرال 4 عندما تحتاج إلى دليل مفهوم أرخص وأسرع أو عندما تكون خطوط الأنابيب/عناصر التحكم الموجودة مضبوطة بالفعل على هذا المحرك.
- استعمل الجنرال 4.5 عندما تحتاج إلى تحسين الواقعية، أو تفاعلات معقدة بين عدة كائنات، أو مخرجات إنتاجية حيث تكون فيزياء الحركة والدقة السريعة مهمة (على سبيل المثال، تصورات المنتج، وتصور المؤثرات البصرية، والأفلام القصيرة التي تعتمد على الشخصيات).
التوافق مع عناصر التحكم Gen-4. يتم دمج جميع أوضاع التحرير التي يدعمها Runway (الصورة→الفيديو، الإطارات الرئيسية، الفيديو→الفيديو، مراجع الممثل) في Gen-4.5 حتى يتمكن المبدعون من إعادة استخدام عناصر التحكم المألوفة والحصول على نتائج أفضل.
كيف تتم مقارنة Gen-4.5 مع Veo 3.1 وSora 2؟
كيف يتم مقارنته مع Veo 3.1 من Google؟
Veo 3.1 هو نظام تحويل النصوص إلى فيديو عالي الدقة من جوجل (تحديثات Veo 3 → 3.1). يُشاد بهذا النموذج لنسيجه السينمائي، وأسلوبه القوي، وتحكمه الدقيق في الألوان والإضاءة. تشير المقارنات المستقلة إلى تفوق Veo 3.1 في المشاهد المزاجية والأسلوبية، وهو متاح على نطاق واسع عبر واجهات برمجة تطبيقات جوجل، ولكنه قد يواجه صعوبة في التعامل مع فيزياء الأجسام المتعددة والتماسك الزمني بعيد المدى مقارنةً بأفضل المنافسين المتخصصين. تشير الاختبارات الأولية العمياء وتقارير المستخدمين إلى أن Runway Gen-4.5 يتفوق في معقولية الحركة والالتزام الفوري بالمتطلبات الفيزيائية، بينما يتفوق Veo غالبًا في اختبارات المشهد الواحد الأسلوبي أو التصويري أو السينمائي.
إلى أين يميل Veo إلى القيادة: دقة الصوت وميزات السرد المنظم (Flow/Veo Studio)، والتكامل الوثيق مع نظام Google البيئي (Gemini API/Vertex AI).
**أين يميل الجيل 4.5 إلى القيادة؟**اختبارات تفضيل بشري عمياء للواقعية البصرية، والالتزام الفوري، وسلوكيات الحركة المعقدة (وفقًا لتصنيفات فيديو أرينا التي نقلتها رانواي). في العديد من المقارنات العامة العمياء، يتفوق الجيل 4.5 بفارق ضئيل في نقاط Elo على متغيرات Veo، مع أن الفارق والمعنى يختلفان باختلاف نوع المحتوى.
كيف تقارنه مع Sora 2 من OpenAI؟
سورا 2 (أوبن إيه آي) يُركّز على الدقة المادية، وتزامن الصوت (بما في ذلك الحوار والمؤثرات الصوتية)، وسهولة التحكم. غالبًا ما يُحقق سورا ٢ نجاحًا باهرًا في إنتاج مشاهد رسوم متحركة متماسكة ذات إشارات سردية عالية المستوى، وفي سير العمل حيث يُعدّ الصوت والحوار جزءًا أساسيًا من عملية الإنتاج.
إلى أين يميل سورا 2 إلى القيادة: توليد الصوت المتكامل والمزامنة المتعددة الوسائط في إعدادات معينة؛ يميل إلى إنتاج مقاطع صوتية ذات طابع سرديّ للغاية.
**أين يميل الجيل 4.5 إلى القيادة؟**وفقًا للمقارنات العمياء المستقلة التي استشهد بها موقع Runway، فإن الواقعية البصرية المُدركة، والدقة الفورية، وتناسق الحركة. مرة أخرى، يعتمد الاختيار العملي على قيمك: إذا كان توليد الصوت الأصلي مع الأدوات المتكاملة أمرًا بالغ الأهمية، فقد يكون Sora 2 أو Veo هو الخيار الأفضل؛ أما إذا كانت الدقة البصرية النقية للمشاهد المعقدة هي الأولوية، فإن ميزة الاختبار العمياء للجيل 4.5 تُعدّ ذات أهمية كبيرة.
جدول المقارنة العملية (ملخص)
| المساحة | المدرج Gen-4.5 | المدرج الجيل الرابع (سابقًا) | جوجل فيو 3.1 | أوبن آي سورا 2 |
|---|---|---|---|---|
| الإصدار / التموضع | ديسمبر ٢٠٢٥ - "الجيل ٤.٥": تحسين الجودة والدقة؛ أعلى نتيجة معيارية (١٢٤٧ إيلو) | الجيل الرابع السابق: خطوة رئيسية نحو الاتساق والقدرة على التحكم | Veo 3.1: مُنشئ فيديو من Google؛ صوت أصلي وخيارات سريعة وعالية الجودة | Sora 2: نموذج الفيديو والصوت الرائد من OpenAI؛ يركز على الدقة المادية والصوت المتزامن |
| نقاط القوة الأساسية | جودة الحركة، والدقة السريعة، والمرئيات السينمائية، وتكامل واجهة برمجة التطبيقات | استمرارية الشخصية، اتساق اللقطات المتعددة، القدرة على التحكم | مخرجات سريعة في 8 ثوانٍ، وتوليد صوت/حوار أصلي، مُحسّن للسرعة/تجربة المستخدم | الفيزياء والواقعية، الصوت/الحوار المتزامن، إمكانية التحكم |
| طول الإخراج / التنسيقات | مقاطع سينمائية قصيرة؛ تدعم الصورة→الفيديو، النص→الفيديو، الإطارات الرئيسية، وما إلى ذلك. | مقاطع قصيرة؛ أوضاع تحكم مماثلة | مقاطع فيديو عالية الجودة مدتها 8 ثوانٍ، خيار Veo 3.1 Fast | مخرجات 720 بكسل/1080 بكسل مع الصوت، مع التركيز على الدقة |
| الصوت الأصلي | ليس العنوان الرئيسي (التركيز هو على الدقة البصرية)، لكن Runway يدعم سير عمل الصوت عبر الأدوات | توليد صوت أصلي محدود | إنتاج صوتي أصلي (مؤثرات صوتية، حوار). التركيز على جودة الصوت. | تعتبر المزامنة الصوتية والمؤثرات الصوتية ميزات واضحة. |
| القيود النموذجية | تفاصيل صغيرة (الوجوه/الحشود)، وأخطاء سببية/زمنية عرضية | القطع الأثرية السابقة، المزيد من التناقض من 4.5 في الحركات | المدة القصيرة هي مقايضة بين التصميم والجودة مقابل الطول | أوضاع الفشل الضيقة في المشاهد المعقدة؛ لا تزال قيد التطور |
- الواقعية البصرية والحركة: Gen-4.5 > Veo 3.1 ≈ Sora 2 (يختلف حسب المشهد).
- الصوت والصوت الأصلي: Veo 3.1 ≥ Sora 2 > Runway (يحتوي Runway على أدوات سير عمل صوتية ولكن Veo وSora يدمجان توليد صوت أصلي أعمق في عملية الإنتاج).
- عناصر التحكم والتحرير:يوفر كل من Runway (الإطارات الرئيسية، الصورة→الفيديو، استمرارية المرجع) وVeo (Flow Studio) تحكمًا قويًا؛ ويركز Sora على عناصر التحكم المتعددة الوسائط المتزامنة.
- باختصار: تتميز لعبة Sora 2 بقوة الاستمرارية السردية؛ وتتميز لعبة Veo 3.1 بقوة الملمس السينمائي؛ وتتميز لعبة Gen-4.5 بقوة الواقعية الحركية والقدرة على التحكم.
ما هي القيود والمخاطر الملموسة التي لا تزال قائمة مع الجيل الرابع 4.5؟
لا يوجد نموذج مثالي، وGen-4.5 لديه حدود معروفة ومخاطر واقعية يجب مراعاتها قبل اعتماده.
القيود الفنية
- فيزياء الحالات الحدية والأخطاء السببية: على الرغم من تحسّن النموذج بشكل كبير، إلا أنه لا يزال يُنتج أخطاءً في التسلسل السببي أحيانًا (على سبيل المثال، تأثير يسبق سببه) وفشلًا دقيقًا في ثبات الأشياء عندما تصبح المشاهد شديدة التعقيد. هذه الأخطاء أقل شيوعًا، لكنها لا تزال موجودة.
- التماسك طويل الأمد: كما هو الحال مع معظم نماذج تحويل النصوص إلى فيديو الحالية، تم تحسين الجيل 4.5 للمقاطع القصيرة (بمعدل ثوانٍ). لا يزال إنشاء مشاهد مطولة أو تسلسلات كاملة يتطلب التجميع والتدخل التحريري وسير عمل هجينة.
- الهوية والاتساق على نطاق واسع: يظل إنتاج مئات اللقطات بنفس الشخصية التي تعمل باستمرار أمرًا مرهقًا للغاية؛ وتساعد Gen-4.5 ولكنها لا تلغي أنظمة التصميم المرجعية أو خطوط الأنابيب المركزية للأصول.
المخاطر المتعلقة بالسلامة وسوء الاستخدام والأخلاق
- خطر التزييف العميق/انتحال الشخصية: أي مُولِّد فيديو عالي الدقة يزيد من خطر الوسائط الواقعية والمضلِّلة. ينبغي على المؤسسات تطبيق إجراءات وقائية (مثل وضع العلامات المائية، وسياسات المحتوى، ومسارات التحقق من الهوية) ومراقبة مخاطر إساءة الاستخدام.
- حقوق الطبع والنشر ومصدر مجموعة البيانات: لا يزال مصدر بيانات التدريب مصدر قلق واسع النطاق في هذا المجال. ينبغي على المبدعين وأصحاب الحقوق إدراك أن المخرجات قد تعكس أنماطًا مكتسبة من مواد محمية بحقوق الطبع والنشر، مما يثير تساؤلات قانونية وأخلاقية حول إعادة الاستخدام في السياقات التجارية.
- التحيز والأضرار التمثيلية: قد تُعيد النماذج التوليدية إنتاج التحيزات الموجودة في بيانات التدريب (مثل: الإفراط/النقص في التمثيل، والتصوير النمطي). ولا تزال الاختبارات الدقيقة واستراتيجيات التخفيف من الآثار المباشرة ضرورية.
الخلاصة - مكانة الجيل الرابع 4.5 في مشهد الفيديو المتطور للذكاء الاصطناعي
يُمثل Runway Gen-4.5 تقدمًا ملحوظًا في واقعية تحويل النص إلى فيديو وسهولة التحكم فيه. ويحتل حاليًا مرتبة متقدمة في قوائم المتصدرين المستقلين للتفضيلات العمياء، كما أن رسائل المنتج وتقارير Runway المبكرة تجعله ترقية عملية للمبدعين الذين يحتاجون إلى حركة أكثر إقناعًا، ودقة أعلى في الاستجابة، وتماسك زمني مُحسّن دون المساس بسرعة الإنتاج. في الوقت نفسه، تواصل الأنظمة المنافسة من Google (Veo 3.1) وOpenAI (Sora 2) تعزيز نقاط القوة التكميلية، مثل الصوت المدمج، وأدوات القصة/السرد المُنتجة، وتكاملات أعمق مع النظام البيئي. لا يزال اختيار المنصة المناسبة يعتمد على المشروع: سواءً كنت تُعطي الأولوية للواقعية البصرية، أو الصوت الأصلي، أو تكامل المنصة، أو ضوابط الحوكمة.
يتم طرح Gen-4.5 عبر خطط بأسعار مماثلة لـ Gen-4.
يمكن للمطورين الوصول فيو 3.1 , سورا 2 و المدرج/gen4_aleph إلخ من خلال CometAPI، أحدث إصدار للنموذج يتم تحديثه دائمًا بالموقع الرسمي. للبدء، استكشف إمكانيات النموذج في ملعب واستشر دليل واجهة برمجة التطبيقات للحصول على تعليمات مفصلة. قبل الدخول، يُرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API. كوميت ايه بي اي عرض سعر أقل بكثير من السعر الرسمي لمساعدتك على التكامل.
هل أنت مستعد للذهاب؟→ نسخة تجريبية مجانية من الجيل 4.5 !
إذا كنت تريد معرفة المزيد من النصائح والإرشادات والأخبار حول الذكاء الاصطناعي، فتابعنا على VK, X و ديسكورد!
