تم تطوير Sora 2 بواسطة OpenAI، ويمثل قفزة كبرى في الوسائط التوليدية، إذ يعيد تشكيل طريقة بناء المطورين والمؤسسات والمحترفين الإبداعيين لتطبيقات تضع الفيديو في المقدمة. منذ إصداره في أواخر 2025، نضجت منظومة واجهات برمجة التطبيقات بشكل ملحوظ—بما في ذلك الوصول عبر مزودين تابعين لجهات خارجية مثل CometAPI—مما أدخل قدرات جديدة تستهدف القابلية للتوسع والواقعية والموثوقية بمستوى الإنتاج.
نظرة عامة على التحديثات الخمسة الأساسية
يقدم أحدث تحديث لواجهة Sora 2 البرمجية خمس تحسينات رئيسية:
| الميزة | الوصف | الأثر |
|---|---|---|
| اتساق الدور | هوية شخصية ثابتة عبر المشاهد | يحُلّ مشكلات الاستمرارية |
| طول فيديو 20 ثانية | زِيد من 12 ثانية | يمكّن سرد القصص |
| التوليد على دفعات | مهام فيديو غير متزامنة | إنتاج قابل للتوسع |
| تمديد الفيديو | تمديد المقاطع باستخدام السياق الكامل | سير عمل تحرير أفضل |
| إخراج متعدد الصيغ | 1080p + عمودي/أفقي | النشر عبر الأنظمة الأساسية |
تعالج هذه التحديثات مجتمعة ثلاثة اختناقات أساسية في فيديو الذكاء الاصطناعي:
- الاستمرارية
- الطول
- القابلية للتوسع
ما هو Sora 2 و Sora 2 Pro
Sora 2 هو نموذج توليد فيديو من الجيل التالي أطلقته OpenAI. يمكنه إنشاء فيديوهات عالية الجودة تحتوي على صور وصوت من مدخلات مثل النصوص والصور، وهو مناسب لتطوير التطبيقات وإنتاج المحتوى على نطاق واسع. Sora 2 Pro هو إصدار أعلى مستوى مبني على ذلك، يوفر دقة أعلى، وواقعية بصرية أقوى، وطول فيديو أطول، وقدرات تحكم أكثر دقة. لكنه يتطلب أيضاً تكلفة حوسبة وسعراً أعلى، ويستهدف أساساً إنتاج السينما والتلفزيون الاحترافي، والإبداع الإعلاني، وغيرها من السيناريوهات ذات متطلبات الجودة العالية جداً.
يمثل تحديث مارس 2026 محطة فاصلة: للمرة الأولى، أصبح الفيديو المولّد بالذكاء الاصطناعي ليس مبهرًا بصرياً فحسب، بل أيضاً قابلاً للتوسع تشغيلياً لسير عمل المؤسسات.
1. اتساق الدور (استمرارية الشخصية)
أحد أهم الاختراقات هو اتساق الشخصية، ويشار إليه أيضاً بـ"اتساق الدور".
أكبر تحسين عملي للعديد من الفرق هو القدرة على إعادة استخدام أصول الشخصيات عبر عمليات التوليد. يمكنك رفع كيان غير بشري قابل لإعادة الاستخدام والإشارة إليه عبر عدة فيديوهات للحفاظ على المظهر الأساسي والأسلوب والحضور على الشاشة بشكل متسق. تُعد الحيوانات والتمائم والأشياء حالات استخدام قوية، ويُذكر أن فيديوً واحداً يمكن أن يتضمن حتى شخصيتين.
هذا مهم لأن "اتساق الدور" كان لفترة طويلة من أصعب المشكلات في إنتاج الفيديو بالذكاء الاصطناعي. تحتاج الحملات غالباً إلى ظهور نفس التميمة أو الدعامة الخاصة بالمنتج أو الرمز البصري في لقطات متعددة دون انحراف. يقلل تحديث OpenAI من الحاجة إلى إعادة ذكر قيود الهوية نفسها في كل موجه ويجعل النموذج أكثر فائدة لسرد القصص الحلقية وأصول العلامة التجارية والإنتاج الإبداعي القابل للقوالب. هذا استنتاج من سير عمل الإشارة إلى الشخصية الجديد ووصف OpenAI لاتساق بصري أقوى عبر الأجيال.
هناك قيد مهم، مع ذلك: عمليات الرفع التي تُظهر شبه البشر محجوبة افتراضياً، ولا يمكن توليد أشخاص حقيقيين، كما تُرفض حالياً صور الإدخال التي تحتوي على وجوه بشرية. بعبارة أخرى، أداة الاتساق هذه قوية، لكنها ليست ميزة عامة لـ"جعل أي شخص يبدو مطابقاً في كل مرة". إنها مُحسّنة للكيانات غير البشرية والمحتوى المتوافق مع السياسات.
سابقاً، كانت نماذج الفيديو بالذكاء الاصطناعي تعاني من انحراف بصري، حيث تتغير الشخصيات بشكل غير متوقع بين اللقطات. يضمن النظام الجديد الاستمرارية عبر المشاهد.
لمحة عن الأداء:
- اتساق بالاعتماد على الموجّه فقط: ~70% دقة
- النظام الأصلي (Sora 2): اتساق 95%+
لماذا يهم ذلك:
- أساسي لسرد القصص
- حاسم لبناء العلامة والتسويق
- يمكّن إنتاج محتوى حلقاتي
إنشاء الشخصية يستخدم مقطع MP4 مدته 2–4 ثوانٍ، بدقة 720p–1080p، بنسبة عرض إلى ارتفاع 16:9 أو 9:16. كما يذكر أن فيديوهات مصدر الشخصية تعمل على نحو أفضل عندما تتطابق نسبة العرض إلى الارتفاع مع المخرج المطلوب، وأن الفيديو الواحد يمكن أن يتضمن حتى شخصيتين.
2) حد الـ20 ثانية يمثل تحولاً حقيقياً في سير العمل
زادت مدة Sora 2 القصوى من 12 ثانية إلى 20 ثانية. هذا يعني 8 ثوانٍ إضافية، أو 66.7% مدة تشغيل أكثر من قبل. بمصطلحات إنتاج الفيديو، يكفي ذلك لكشف أطول، أو نبضة حركة إضافية، أو عرض منتج أكثر اكتمالاً دون الحاجة إلى وصل عمليات توليد متعددة على الفور.
حالات الاستخدام:
- إعلانات وسائل التواصل الاجتماعي (15–20 ثانية مثالية)
- سلاسل سرد قصيرة
- عروض توضيحية للمنتجات
السياق التقني:
الفيديوهات الأطول تتطلب:
- تماسكاً زمنياً أفضل
- تحسين إدارة الذاكرة
- تنسيقاً متقدماً بين الانتشار + المحوّل
3) إخراج متعدد الصيغ والدقة
واضح أن أحدث واجهة Sora مهيأة لقنوات التوزيع الحديثة. تقول وثائق OpenAI إنه يجب استخدام sora-2-pro عندما تحتاج إلى تصدير 1080p بدقة 1920×1080 أو 1080×1920، وتقول إرشادات الشخصية إن المقاطع المصدر تعمل على نحو أفضل بنسبة 16:9 أو 9:16. يمنح ذلك الواجهة ملاءمة نظيفة لـ YouTube وصفحات الهبوط والعروض التقديمية وTikTok وReels وShorts ومواضع الإعلانات العمودية.
لماذا يهم ذلك:
- الفيديو العمودي يهيمن على منصات مثل TikTok/Reels
- يلغي الحاجة إلى المعالجة اللاحقة
📈 ترقية في الجودة:
- إخراج 1080p بمستوى احترافي
- مناسب للاستخدام التجاري
4) امتدادات الفيديو تجعل سرد القصص الأطول أكثر سلاسة
يضيف التحديث أيضاً امتدادات الفيديو، والتي تصفها OpenAI بأنها طريقة لمواصلة مقطع مكتمل وإنشاء نتيجة موصولة جديدة. يستخدم سير عمل الامتداد المقطع المصدر الكامل كسياق، وليس الإطار الأخير فقط، وهو أمر مهم بشكل خاص للحفاظ على الحركة واتجاه الكاميرا واستمرارية المشهد.
هذا اختلاف دقيق لكنه مهم عن مجرد الاستكمال المعتمد على إطار واحد. إذا رأى النموذج المقطع المصدر كاملاً، فيمكنه الحفاظ بشكل أفضل على الإيقاع والحركة عبر المقاطع. من المفترض أن يجعل ذلك بناء المشاهد التي تبدو كأنها لقطة واحدة مستمرة أسهل بدلاً من مخرجات موصولة بشكل فضفاض. هذا استنتاج من شرح OpenAI بأن الامتدادات تستخدم المقطع الأولي الكامل كسياق ومقصودة للحفاظ على الحركة والاستمرارية.
تقول OpenAI أيضاً إن كل امتداد يمكن أن يضيف حتى 20 ثانية، ويمكن تمديد الفيديو الواحد حتى ست مرات، وأن الطول الأقصى الإجمالي يمكن أن يصل إلى 120 ثانية. ومع ذلك، تقبل الامتدادات حالياً فيديوً مصدرياً وموجهاً فقط، ولا تدعم الشخصيات أو مراجع الصور. يخلق ذلك حدّاً فاصلاً واضحاً: الامتدادات من أجل الاستمرارية، بينما مراجع الشخصيات من أجل الهوية القابلة لإعادة الاستخدام.
الفوائد الرئيسية:
- الحفاظ على استمرارية المشهد
- تمديد السرد بشكل طبيعي
- تجنب الانتقالات المفاجئة
الاختلاف عن النماذج السابقة:
- النماذج القديمة: كانت تستخدم الإطار الأخير فقط
- Sora 2: يستخدم سياق المقطع بالكامل
5) التوليد على دفعات هو أكبر ترقية للتوسع
دعم واجهة الدُفعات هو التحديث الأكثر أهمية لفرق الإنتاج. تقول OpenAI إنه يمكن استخدام واجهة الدُفعات لتقديم قوائم انتظار تصيير غير متصلة كبيرة، وتذكر وثائقها أنها مناسبة لقوائم اللقطات وقوائم انتظار التصيير المجدولة ومسارات المراجعة وسير عمل الاستوديو. في إرشادات الفيديو الخاصة بالدُفعات، تقول OpenAI إن الدُفعات تدعم حالياً POST /v1/videos فقط، ويجب أن تستخدم الطلبات JSON بدلاً من multipart، ويجب رفع الأصول مسبقاً، ويجب توفير input_reference في جسم طلب JSON.
هناك أيضاً حافز حقيقي من ناحية التكلفة. تقول OpenAI إن واجهة الدُفعات توفّر 50% في المدخلات والمخرجات وتنفذ المهام بشكل غير متزامن على مدى 24 ساعة. في صفحة التسعير، يبلغ معدل 1080p القياسي لـsora-2-pro $0.70 لكل ثانية، بينما يبلغ تسعير الدُفعات لنفس الفئة $0.35 لكل ثانية. هذا يعني أن مقطع 20 ثانية بدقة 1080p سيكلف حوالي $14.00 بالتسعير القياسي وحوالي $7.00 عبر الدُفعات، قبل أي تكاليف سير عمل أخرى. ذلك مقارنة مباشرة مبنية على تسعير OpenAI المنشور.
بالنسبة للفرق التي تنتج العديد من المقاطع دفعة واحدة، يمكن أن يغيّر هذا اقتصاديات التجريب. بدلاً من دفع السعر الكامل لكل تصيير، يمكن للفرق وضع قائمة كبيرة من المتغيرات في الطابور ليلاً ومراجعة أفضل المخرجات في اليوم التالي. هذا بالضبط نوع سير العمل الذي بُنيت من أجله الدُفعات، كما تؤكد إرشادات حدود المعدّل الخاصة بـOpenAI أن مهام الدُفعات تُحتسب بطريقة مختلفة عن الطلبات عبر الإنترنت القياسية.
الخلاصة
مجتمعة، تجعل هذه التحديثات الخمسة Sora 2 أقل شبهاً بمولد طريف وأكثر شبهاً بمنصة إنتاج. مراجع الشخصيات القابلة لإعادة الاستخدام تحسن الاتساق. مقاطع 20 ثانية تقلل عبء الوصل. تصديرات 1080p تجعل الفئة المميزة عملية للتسليمات المصقولة. امتدادات الفيديو تحسن الاستمرارية. التوليد على دفعات يضيف التوسع والكفاءة في التكلفة.
يمكن للمطورين الوصول إلى Sora 2 وSora 2 Pro عبر CometAPI(CometAPI عبارة عن منصة تجميع شاملة لواجهات برمجة النماذج الكبيرة مثل GPT APIs وNano Banana APIs وغيرها) الآن. قبل الوصول، يرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح واجهة برمجة التطبيقات. تقدم CometAPI سعراً أقل بكثير من السعر الرسمي لمساعدتك على الدمج.
