اہم خصوصیات
- ملٹی ماڈل جنریشن (ویڈیو + آڈیو) — Sora-2-Pro ویڈیو فریمز کے ساتھ ہم آہنگ آڈیو (مکالمہ، ماحول کی آوازیں، SFX) بھی تیار کرتا ہے، بجائے اس کے کہ ویڈیو اور آڈیو الگ الگ بنائے۔
- اعلیٰ وفاداری / "Pro" ٹائر — اعلیٰ بصری وفاداری، مشکل شاٹس (پیچیدہ حرکت، اوکلوشن، اور جسمانی تعاملات)، اور فی منظر طویل مستقل مزاجی کے لیے ٹیون کیا گیا ہے، جو Sora-2 (non-Pro) سے بہتر ہے۔ یہ معیاری Sora-2 ماڈل کے مقابلے میں رینڈر ہونے میں زیادہ وقت لے سکتا ہے۔
- ان پٹ کی ہمہ گیری — خالص متن پرامپٹس کو سپورٹ کرتا ہے، اور کمپوزیشن کی رہنمائی کے لیے تصویری ان پٹ فریمز یا حوالہ تصاویر قبول کر سکتا ہے (input_reference ورک فلو)۔
- کیمیو/شباہت کا اندراج — ایپ میں رضامندی کے ورک فلو کے ساتھ صارف کی ریکارڈ کی گئی شباہت کو تیار کردہ مناظر میں داخل کر سکتا ہے۔
- جسمانی معقولیت: آبجیکٹ پرمنینس اور حرکت کی وفاداری (مثلاً مومنٹم، بایونسی) میں بہتری، جس سے پہلے کے سسٹمز میں عام غیر حقیقی "ٹیلی پورٹنگ" آثار کم ہوتے ہیں۔
- قابلیتِ کنٹرول: ساختہ پرامپٹس اور شاٹ سطح ہدایات کی سپورٹ تاکہ تخلیق کار کیمرہ، لائٹنگ، اور ملٹی شاٹ سلسلے متعین کر سکیں۔
تکنیکی تفصیلات اور انٹیگریشن سطح
Model family: Sora 2 (base) اور Sora 2 Pro (اعلیٰ معیار ویریئنٹ)۔
Input modalities: متن پرامپٹس، تصویر ریفرنس، اور likeness کے لیے مختصر ریکارڈ شدہ کیمیو ویڈیو/آڈیو۔
Output modalities: انکوڈڈ ویڈیو (آڈیو کے ساتھ) — پیرامیٹرز /v1/videos اینڈپوائنٹس کے ذریعے دستیاب ہیں (ماڈل کا انتخاب model: "sora-2-pro" کے ذریعے)۔ API سطح create/retrieve/list/delete آپریشنز کے لیے OpenAI کی ویڈیوز اینڈپوائنٹ فیملی کی پیروی کرتی ہے۔
Training & architecture (public summary): OpenAI کے مطابق Sora 2 کو بڑے پیمانے کے ویڈیو ڈیٹا پر ٹرین کیا گیا ہے اور ورلڈ سمولیشن کو بہتر بنانے کے لیے پوسٹ ٹریننگ کی گئی ہے؛ مخصوص تفصیلات (ماڈل سائز، عین ڈیٹاسیٹس، ٹوکنائزیشن) لائن بہ لائن عوامی طور پر بیان نہیں کی گئیں۔ خصوصی کمپیوٹ، ویڈیو ٹوکنائزر/آرکیٹیکچرز اور ملٹی ماڈل الائنمنٹ کمپوننٹس متوقع ہیں۔
API endpoints & workflow: ایک جوب بیسڈ ورک فلو دکھائیں: POST کریئیشن ریکویسٹ جمع کرائیں (model="sora-2-pro")، جوب آئی ڈی یا لوکیشن موصول کریں، پھر تکمیل تک پول کریں یا انتظار کریں اور نتیجہ خیز فائل(یں) ڈاؤن لوڈ کریں۔ شائع شدہ مثالوں میں عام پیرامیٹرز میں prompt, seconds/duration, size/resolution اور تصویر سے رہنمائی والے آغاز کے لیے input_reference شامل ہیں۔
Typical parameters :
model:"sora-2-pro"prompt: قدرتی زبان میں منظر کی تفصیل، بوقت ضرورت مکالمے کے اشاروں کے ساتھseconds/duration: ہدف کلپ کی لمبائی (Pro دستیاب دورانیوں میں اعلیٰ ترین معیار سپورٹ کرتا ہے)size/resolution: کمیونٹی رپورٹس کے مطابق Pro بہت سے استعمالات میں زیادہ سے زیادہ 1080p تک سپورٹ کرتا ہے۔
Content inputs: امیج فائلیں (JPEG/PNG/WEBP) بطور فریم یا ریفرنس فراہم کی جا سکتی ہیں؛ استعمال کی صورت میں تصویر کا ہدف ریزولوشن سے مطابقت رکھنا اور کمپوزیشن اینکر کے طور پر کام کرنا بہتر ہے۔
Rendering behavior: Pro کو فریم بہ فریم یکسانیت اور حقیقت سے قریب فزکس کو ترجیح دینے کے لیے ٹیون کیا گیا ہے؛ اس سے عموماً نان پرو ویریئنٹس کے مقابلے میں زیادہ کمپیوٹ ٹائم اور فی کلپ زیادہ لاگت آتی ہے۔
بینچ مارک کارکردگی
کیفیاتی مضبوطیاں: OpenAI نے سابقہ ویڈیو ماڈلز کے مقابلے میں حقیقت پذیری، فزکس کی یکسانیت، اور ہم آہنگ آڈیو** میں بہتری کی ہے۔ دیگر VBench نتائج سے ظاہر ہوتا ہے کہ Sora-2 اور اس کے مشتقات عصری کلو즈ڈ سورس ماڈلز اور وقتی یکسانی میں سرفہرست یا قریب ہیں۔
آزاد ٹائمنگ/تھرو پٹ (مثالی بینچ): Sora-2-Pro نے 20-second 1080p کلپس کے لیے اوسطاً ~2.1 minutes لیے، جبکہ ایک حریف (Runway Gen-3 Alpha Turbo) اسی کام پر تیز تھا (~1.7 minutes) — معیار بمقابلہ رینڈر لیٹنسی اور پلیٹ فارم آپٹمائزیشن کے سودے۔
حدود (عملی اور حفاظتی)
- فزکس/استحکام کامل نہیں — بہتری کے باوجود نقائص، غیر فطری حرکت، یا آڈیو سنک کی غلطیاں رہ سکتی ہیں۔
- دورانیہ اور کمپیوٹ کی پابندیاں — طویل کلپس کمپیوٹ کے لحاظ سے بھاری ہوتے ہیں؛ عملی ورک فلو میں عموماً مختصر دورانیے (چند سیکنڈ سے کم درجنوں سیکنڈ) کی حدیں ہوتی ہیں۔
- پرائیویسی / رضامندی کے خطرات — شباہت کا اندراج ("کیمیو") رضامندی اور گمراہ کن معلومات کے خدشات پیدا کرتا ہے؛ OpenAI کے ایپ میں واضح سیفٹی کنٹرولز اور ریوکیشن میکانزم موجود ہیں، مگر ذمہ دارانہ انٹیگریشن ضروری ہے۔
- لاگت اور لیٹنسی — Pro معیار کے رینڈرز ہلکے ماڈلز یا حریفوں کے مقابلے زیادہ مہنگے اور سست ہو سکتے ہیں؛ فی سیکنڈ/فی رینڈر بلنگ اور قطار بندی کو مدِنظر رکھیں۔
- سیفٹی کنٹینٹ فلٹرنگ — نقصان دہ یا کاپی رائٹڈ مواد کی جنریشن محدود ہے؛ ماڈل اور پلیٹ فارم میں سیفٹی لیئرز اور ماڈریشن شامل ہیں۔
عام اور تجویز کردہ استعمال کے کیسز
Use cases:
- مارکیٹنگ اور اشتہاری پروٹوٹائپس — سنیماٹک پروف آف کانسیپٹ تیزی سے تیار کریں۔
- پری ویژولائزیشن — اسٹوری بورڈز، کیمرہ بلاکنگ، شاٹ ویزولائزیشن۔
- مختصر سوشل کنٹینٹ — ہم آہنگ مکالمے اور SFX کے ساتھ اسٹائلائزڈ کلپس۔
- Sora 2 Pro API تک کیسے رسائی حاصل کریں
Step 1: API Key کے لیے سائن اپ کریں
cometapi.com میں لاگ اِن کریں۔ اگر آپ ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنی CometAPI console میں سائن اِن کریں۔ انٹرفیس کی رسائی کے اسناد یعنی API key حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر “Add Token” پر کلک کریں، ٹوکن کی کلید حاصل کریں: sk-xxxxx اور جمع کرائیں۔

Step 2: Sora 2 Pro API کو ریکویسٹ بھیجیں
“sora-2-pro” اینڈپوائنٹ منتخب کریں، API ریکویسٹ بھیجیں اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کے API ڈاک سے حاصل کیے جاتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ سے اصل CometAPI key کے ساتھ <YOUR_API_KEY> کو تبدیل کریں۔ base url is office Create video
اپنا سوال یا درخواست content فیلڈ میں درج کریں — یہی وہ چیز ہے جس کا ماڈل جواب دے گا۔ API رسپانس کو پروسیس کریں تاکہ تیار شدہ جواب حاصل کریں۔
Step 3: نتائج حاصل کریں اور تصدیق کریں
API رسپانس کو پروسیس کریں تاکہ تیار شدہ جواب حاصل کریں۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتا ہے۔
- اندرونی ٹریننگ / سمولیشن — RL یا روبوٹکس تحقیق کے لیے منظرنامہ ویژولز تیار کریں (احتیاط کے ساتھ)۔
- تخلیقی پروڈکشن — جب انسانی ایڈیٹنگ کے ساتھ ملایا جائے (مختصر کلپس جوڑنا، گریڈ، آڈیو تبدیل کرنا)۔