الميزات الرئيسية
- إنشاء متعدد الوسائط (فيديو + صوت) — يُنشئ Sora-2-Pro إطارات الفيديو مع صوت متزامن (حوار، صوت محيطي، مؤثرات صوتية) بدلًا من إنتاج الفيديو والصوت بشكل منفصل.
- درجة "Pro" / دقة أعلى — مُضبط لتحقيق دقة بصرية أعلى، ولقطات أصعب (حركة معقدة، إخفاء، وتفاعلات فيزيائية)، واتساق أطول ضمن المشهد مقارنةً بـ Sora-2 (غير Pro). قد يستغرق العرض وقتًا أطول من نموذج Sora-2 القياسي.
- مرونة الإدخال — يدعم مطالبات نصية خالصة، ويمكنه قبول إطارات إدخال صور أو صور مرجعية لتوجيه التكوين (مسارات input_reference).
- الظهور/حقن الشبه — يمكنه إدراج شبه المستخدم المُلتقط في المشاهد المُولَّدة مع مسارات موافقة داخل التطبيق.
- معقولية فيزيائية: تحسين استمرارية الكائنات ودقة الحركة (مثل الزخم، الطفو)، ما يقلل من شوائب "التنقّل الفوري" غير الواقعية الشائعة في الأنظمة السابقة.
- قابلية التحكم: يدعم المطالبات المُهيكلة وتوجيهات على مستوى اللقطة لتمكين المبدعين من تحديد الكاميرا والإضاءة وتسلسلات متعددة اللقطات.
التفاصيل التقنية وسطح التكامل
عائلة النماذج: Sora 2 (أساسي) وSora 2 Pro (نسخة عالية الجودة).
وسائط الإدخال: مطالبات نصية، مراجع صور، ولقطات كاميو/صوت قصيرة مسجَّلة للشبه.
وسائط الإخراج: فيديو مُرمَّز (مع صوت) — معلمات متاحة عبر نقاط نهاية /v1/videos (اختيار النموذج عبر model: "sora-2-pro"). سطح واجهة API يتبع عائلة نقاط نهاية الفيديو لدى OpenAI لعمليات الإنشاء/الاسترجاع/الإدراج/الحذف.
التدريب والبنية (ملخص عام): تصف OpenAI نموذج Sora 2 بأنه مُدرَّب على بيانات فيديو واسعة النطاق مع تدريب لاحق لتحسين محاكاة العالم؛ التفاصيل الدقيقة (حجم النموذج، مجموعات البيانات المحددة، والترميز) غير مُفصَّلة علنًا بندًا بندًا. توقّع حوسبة كثيفة، ومُرمِّزات/بُنى فيديو متخصصة، ومكونات مواءمة متعددة الوسائط.
نقاط نهاية API وسير العمل: عرض سير عمل قائم على المهام: إرسال طلب إنشاء POST (model="sora-2-pro")، استلام معرّف مهمة أو موقع، ثم الاستطلاع أو الانتظار حتى الاكتمال وتنزيل الملف/الملفات الناتجة. تتضمن المعلمات الشائعة في الأمثلة المنشورة prompt وseconds/duration وsize/resolution وinput_reference لبدء موجه بالصور.
المعلمات النموذجية :
model:"sora-2-pro"prompt: وصف بالمحكية الطبيعية للمشهد، اختياريًا مع مؤشرات حوارseconds/duration: طول المقطع المستهدف (يدعم Pro أعلى جودة ضمن المدد المتاحة)size/resolution: تفيد تقارير المجتمع بأن Pro يدعم حتى 1080p في العديد من الحالات.
مدخلات المحتوى: يمكن تزويده بملفات صور (JPEG/PNG/WEBP) كإطار أو كمرجع؛ عند استخدامها، ينبغي أن تطابق الصورة الدقة المستهدفة وأن تعمل كمرساة للتكوين.
سلوك العرض: تم ضبط Pro لإعطاء الأولوية للتماسك بين الإطارات والفيزياء الواقعية؛ وهذا يعني عادةً وقت حوسبة أطول وتكلفة أعلى لكل مقطع مقارنةً بالإصدارات غير Pro.
أداء القياس المعياري
نقاط القوة النوعية: حسَّنت OpenAI الواقعية، واتساق الفيزياء، والصوت المتزامن** مقارنةً بنماذج الفيديو السابقة. تشير نتائج VBench الأخرى إلى أن Sora-2 ومشتقاته تأتي في صدارة النماذج المغلقة المصدر والمعايير المتعلقة بالتماسك الزمني أو بالقرب منها.
التوقيت/الإنتاجية المستقلة (مثال قياس): حقق Sora-2-Pro متوسطًا قدره ~2.1 دقيقة لمقاطع 1080p بطول 20 ثانية في مقارنة واحدة، بينما كان منافس (Runway Gen-3 Alpha Turbo) أسرع (~1.7 دقيقة) في نفس المهمة — المفاضلات تكون بين الجودة مقابل زمن العرض وتحسين المنصة.
القيود (عملية وسلامة)
- فيزياء/اتساق غير مثاليين — تحسُّن ملحوظ لكن ليس بلا عيوب؛ قد تظهر شوائب، حركة غير طبيعية، أو أخطاء في تزامن الصوت.
- قيود المدة والحوسبة — المقاطع الطويلة كثيفة الحوسبة؛ كثير من مسارات العمل العملية تحدّ المدة لثوانٍ أحادية إلى عشرات قليلة للOutputs عالية الجودة.
- مخاطر الخصوصية/الموافقة — حقن الشبه ("الكاميو") ينطوي على موافقة ومخاطر تضليل؛ لدى OpenAI ضوابط أمان وآليات سحب في التطبيق، لكن التكامل المسؤول مطلوب.
- التكلفة والزمن — عروض Pro قد تكون أغلى وأبطأ من النماذج الأخف أو المنافسين؛ ضع في الحسبان الفوترة لكل ثانية/لكل عرض وقوائم الانتظار.
- تصفية محتوى السلامة — يُقيَّد توليد المحتوى الضار أو المحمي بحقوق؛ تتضمن المنصة طبقات أمان ومُعايرة.
حالات الاستخدام النموذجية والمُوصى بها
حالات الاستخدام:
- نماذج تسويق وإعلانات — إنشاء إثباتات مفاهيم سينمائية بسرعة.
- ما قبل التصوير — لوحات مصورة، حجب الكاميرا، تصور اللقطات.
- محتوى اجتماعي قصير — مقاطع مُنسَّقة مع حوار ومؤثرات صوتية متزامنة.
- كيفية الوصول إلى واجهة Sora 2 Pro البرمجية
الخطوة 1: التسجيل للحصول على مفتاح API
سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يرجى التسجيل أولًا. سجّل الدخول إلى CometAPI console. احصل على بيانات اعتماد الوصول مفتاح API للواجهة. انقر على “Add Token” في API token داخل المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسِل.

الخطوة 2: إرسال الطلبات إلى Sora 2 Pro API
حدِّد نقطة النهاية “sora-2-pro” لإرسال طلب API واضبط جسم الطلب. يتم الحصول على طريقة الطلب وجسمه من وثائق API على موقعنا. يوفر موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي من حسابك. base url is office Create video
أدرِج سؤالك أو طلبك في حقل content — هذا ما سيستجيب له النموذج. عالِج استجابة API للحصول على الإجابة المُولَّدة.
الخطوة 3: استرجاع النتائج والتحقق منها
عالِج استجابة API للحصول على الإجابة المُولَّدة. بعد المعالجة، تُرجِع واجهة API حالة المهمة وبيانات الإخراج.
- تدريب داخلي/محاكاة — توليد مرئيات سيناريو لأبحاث RL أو الروبوتات (بحذر).
- إنتاج إبداعي — عند الدمج مع تحرير بشري (وصل مقاطع قصيرة، تدرّج لوني، استبدال الصوت).