Sora-2-pro OpenAI کا ہے۔ فلیگ شپ ویڈیو + آڈیو جنریشن کے ساتھ مختصر، انتہائی حقیقت پسندانہ ویڈیو کلپس بنانے کے لیے ڈیزائن کیا گیا ماڈل مطابقت پذیر مکالمہ، صوتی اثرات، اور مضبوط جسمانی/عالمی تخروپن پچھلے ویڈیو ماڈلز کے مقابلے۔ اسے اعلیٰ معیار کے "پرو" ویرینٹ کے طور پر رکھا گیا ہے جو ادائیگی کرنے والے صارفین کے لیے اور API کے ذریعے پروگرامیٹک جنریشن کے لیے دستیاب ہے۔ ماڈل پر زور دیتا ہے۔ کنٹرول کی صلاحیت, وقتی ہم آہنگی، اور آڈیو مطابقت پذیری سنیما اور سماجی استعمال کے معاملات کے لیے۔
کلیدی خصوصیات
- ملٹی موڈل جنریشن (ویڈیو + آڈیو) - Sora-2-Pro الگ الگ ویڈیو اور آڈیو تیار کرنے کے بجائے مطابقت پذیر آڈیو (مکالمہ، محیطی آواز، SFX) کے ساتھ مل کر ویڈیو فریم تیار کرتا ہے۔
- اعلی مخلص / "پرو" درجے - کے لئے دیکھتے ہیں اعلی بصری وفاداری، سخت شاٹس (پیچیدہ حرکت، رکاوٹ، اور جسمانی تعاملات)، اور Sora-2 (غیر پرو) سے زیادہ فی منظر مستقل مزاجی معیاری Sora-2 ماڈل سے رینڈر ہونے میں زیادہ وقت لگ سکتا ہے۔
- ان پٹ استرتا - خالص ٹیکسٹ پرامپٹس کو سپورٹ کرتا ہے، اور کمپوزیشن (ان پٹ_ریفرنس ورک فلوز) کی رہنمائی کے لیے امیج ان پٹ فریمز یا ریفرنس امیجز کو قبول کر سکتا ہے۔
- Cameos / تشبیہ انجکشن - ایپ میں رضامندی کے ورک فلو کے ساتھ تیار کردہ مناظر میں صارف کی کیپچر کردہ مماثلت داخل کر سکتا ہے۔
- جسمانی تعقل: بہتر آبجیکٹ کی مستقل مزاجی اور حرکت کی مخلصی (مثال کے طور پر، رفتار، فروغ)، غیر حقیقی "ٹیلی پورٹنگ" نمونے کو کم کرنا جو پہلے کے نظاموں میں عام تھے۔
- کنٹرول کی صلاحیت: سٹرکچرڈ پرامپٹس اور شاٹ لیول ڈائریکشنز کو سپورٹ کرتا ہے تاکہ تخلیق کار کیمرہ، لائٹنگ، اور ملٹی شاٹ سیکوینس بتا سکیں۔
تکنیکی تفصیلات اور انضمام کی سطح
ماڈل فیملی: سورہ 2 (بیس) اور سورا 2 پرو (اعلی معیار کی قسم)۔
ان پٹ طریقوں: متن کے اشارے، تصویری حوالہ، اور مماثلت کے لیے مختصر ریکارڈ شدہ کیمیو-ویڈیو/آڈیو۔
آؤٹ پٹ طریقوں: انکوڈ شدہ ویڈیو (آڈیو کے ساتھ) - پیرامیٹرز کے ذریعے بے نقاب /v1/videos اختتامی نقطہ (ماڈل کا انتخاب بذریعہ model: "sora-2-pro"). API سطح تخلیق/ بازیافت/ فہرست/ حذف کرنے کے آپریشنز کے لیے OpenAI کی ویڈیوز اینڈ پوائنٹ فیملی کی پیروی کرتا ہے۔
تربیت اور فن تعمیر (عوامی خلاصہ): OpenAI نے Sora 2 کو بڑے پیمانے پر ویڈیو ڈیٹا پر تربیت یافتہ کے طور پر بیان کیا ہے تاکہ دنیا کی نقل کو بہتر بنانے کے لیے پوسٹ ٹریننگ کے ساتھ؛ تفصیلات (ماڈل سائز، عین مطابق ڈیٹاسیٹس، اور ٹوکنائزیشن) کو عوامی طور پر لائن بہ لائن تفصیل میں شمار نہیں کیا جاتا ہے۔ بھاری کمپیوٹ، خصوصی ویڈیو ٹوکنائزرز/آرکیٹیکچرز اور ملٹی موڈل الائنمنٹ اجزاء کی توقع کریں۔
API اینڈ پوائنٹس اور ورک فلو: کام پر مبنی ورک فلو دکھائیں: POST تخلیق کی درخواست جمع کروائیں (model="sora-2-pro")، نوکری کی شناخت یا مقام حاصل کریں، پھر رائے شماری کریں یا تکمیل کا انتظار کریں اور نتیجے میں آنے والی فائل (فائلیں) ڈاؤن لوڈ کریں۔ شائع شدہ مثالوں میں عام پیرامیٹرز شامل ہیں۔ prompt, seconds/duration, size/resolution، اور input_reference تصویری رہنمائی والے آغاز کے لیے۔
عام پیرامیٹرز:
model:"sora-2-pro"prompt: قدرتی زبان کے منظر کی تفصیل، اختیاری طور پر مکالمے کے اشارے کے ساتھseconds/duration: ٹارگٹ کلپ کی لمبائی (پرو دستیاب دورانیے میں اعلیٰ ترین معیار کی حمایت کرتا ہے)size/resolution: کمیونٹی رپورٹس بتاتی ہیں کہ پرو تک کی حمایت کرتا ہے۔ 1080p بہت سے استعمال کے معاملات میں.
مواد کی معلومات: تصویری فائلیں (JPEG/PNG/WEBP) فریم یا حوالہ کے طور پر فراہم کی جا سکتی ہیں۔ استعمال ہونے پر، تصویر کو ہدف کے ریزولوشن سے مماثل ہونا چاہیے اور کمپوزیشن اینکر کے طور پر کام کرنا چاہیے۔
رینڈرنگ سلوک: پرو کو فریم ٹو فریم ہم آہنگی اور حقیقت پسندانہ طبیعیات کو ترجیح دینے کے لیے بنایا گیا ہے۔ اس کا مطلب عام طور پر لمبا کمپیوٹ ٹائم اور نان پرو ویریئنٹس کے مقابلے فی کلپ زیادہ قیمت ہے۔
بینچ مارک کارکردگی
قابلیت کی طاقت: OpenAI نے حقیقت پسندی، طبیعیات کی مستقل مزاجی، اور مطابقت پذیر آڈیو** کو پہلے کے ویڈیو ماڈلز کے مقابلے میں بہتر بنایا ہے۔ VBench کے دیگر نتائج سے پتہ چلتا ہے کہ Sora-2 اور مشتقات عصری بند ماخذ اور وقتی ہم آہنگی کے اوپر یا اس کے قریب بیٹھتے ہیں۔
آزاد ٹائمنگ/تھرو پٹ (مثال بینچ): سورا-2-پرو اوسط ~ 2.1 منٹ ایک مقابلے میں 20 سیکنڈ کے 1080p کلپس کے لیے، جبکہ ایک مدمقابل (Runway Gen-3 Alpha Turbo) ایک ہی کام پر تیز (~1.7 منٹ) تھا — ٹریڈ آف معیار بمقابلہ رینڈر لیٹنسی اور پلیٹ فارم کی اصلاح ہے۔
حدود (عملی اور حفاظت)
- کامل طبیعیات/مستقل مزاجی نہیں۔ - بہتر لیکن بے عیب نہیں؛ نمونے، غیر فطری حرکت، یا آڈیو مطابقت پذیری کی خرابیاں اب بھی ہو سکتی ہیں۔
- دورانیہ اور حساب کی پابندیاں - لمبے کلپس کمپیوٹ-انٹینسی ہیں؛ بہت سے عملی ورک فلو کلپس کو مختصر دورانیے تک محدود کرتے ہیں (مثال کے طور پر، اعلی معیار کے آؤٹ پٹس کے لیے سنگل ہندسے سے لے کر دسیوں سیکنڈ تک)۔
- رازداری / رضامندی کے خطرات - مماثلت انجیکشن ("کیمیوس") رضامندی اور غلط/غلط معلومات کے خطرات کو بڑھاتا ہے۔ OpenAI کے پاس ایپ میں واضح حفاظتی کنٹرول اور تنسیخ کے طریقہ کار ہیں، لیکن ذمہ دارانہ انضمام کی ضرورت ہے۔
- لاگت اور تاخیر - پرو کوالٹی رینڈر ہلکے ماڈلز یا حریفوں سے زیادہ مہنگے اور سست ہو سکتے ہیں۔ فی سیکنڈ/فی رینڈر بلنگ اور قطار میں فیکٹر۔
- حفاظتی مواد کی فلٹرنگ - نقصان دہ یا کاپی رائٹ والے مواد کی تخلیق پر پابندی ہے۔ ماڈل اور پلیٹ فارم میں حفاظتی پرتیں اور اعتدال شامل ہے۔
عام اور تجویز کردہ استعمال کے معاملات
مقدمات استعمال کریں:
- مارکیٹنگ اور اشتہارات کے پروٹو ٹائپس - تیزی سے تصور کے سنیما ثبوت بنائیں۔
- پیش نظارہ - اسٹوری بورڈز، کیمرہ بلاک کرنا، شاٹ ویژولائزیشن۔
- مختصر سماجی مواد - مطابقت پذیر ڈائیلاگ اور SFX کے ساتھ اسٹائلائزڈ کلپس۔
- اندرونی تربیت / تخروپن - RL یا روبوٹکس ریسرچ کے لیے منظر نامے کی تصویریں تیار کریں (دیکھ بھال کے ساتھ)۔
- تخلیقی پیداوار - جب انسانی ترمیم کے ساتھ ملایا جائے (شارٹ کلپس کو سلائی کرنا، گریڈ کرنا، آڈیو کو تبدیل کرنا)۔
کب استعمال نہ کریں: تیار کردہ کلپس کو حتمی غیر زیر نگرانی دستاویزی ثبوت کے طور پر یا ایسے مواد کے لیے استعمال کرنے سے گریز کریں جس کے لیے تصدیق شدہ شناخت/ رضامندی کی ضرورت ہو (قانونی اور شہرت کا خطرہ)۔
کال کیسے کریں؟ sora-2-pro CometAPI سے API
sora-2-pro CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ:
| واقفیت | قرارداد | قیمت |
|---|---|---|
| پورٹریٹ | 720 × 1280 | $0.30/سیکنڈ |
| زمین کی تزئین | 1280 × 720 | $0.30/سیکنڈ |
| پورٹریٹ | 1024 × 1792 | $0.50/سیکنڈ |
| زمین کی تزئین | 1792 × 1024 | $0.50/سیکنڈ |
مطلوبہ اقدامات
- داخل ہوجاو cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔
- انٹرفیس کی رسائی کی سند API کلید حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔
- اس سائٹ کا یو آر ایل حاصل کریں: https://api.cometapi.com/
طریقہ استعمال کریں
- منتخب کریں “
sora-2-proAPI کی درخواست بھیجنے اور درخواست کا باڈی سیٹ کرنے کے لیے اینڈ پوائنٹ۔ درخواست کا طریقہ اور درخواست کا باڈی ہماری ویب سائٹ API دستاویز سے حاصل کیا جاتا ہے۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ - بدل دیں۔ آپ کے اکاؤنٹ سے اپنی اصل CometAPI کلید کے ساتھ۔
- مواد کے خانے میں اپنا سوال یا درخواست داخل کریں—یہ وہی ہے جس کا ماڈل جواب دے گا۔
- . تیار کردہ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔
CometAPI مکمل طور پر ہم آہنگ REST API فراہم کرتا ہے — بغیر کسی رکاوٹ کے منتقلی کے لیے۔ کلیدی تفصیلات:
- بنیادی URL: (آفیشل) https://api.cometapi.com/v1/videos
- ماڈل کے نام:
sora-2-pro - توثیق:
Bearer YOUR_CometAPI_API_KEYہیڈر - مواد کی قسم:
application/json.
یہ بھی دیکھتے ہیں سورہ 2: یہ کیا ہے، یہ کیا کر سکتا ہے اور کیسے استعمال کرنا ہے۔



