Veo 3.1 اس کے Veo ٹیکسٹ اور امیج→ ویڈیو فیملی کے لیے گوگل کی بڑھتی ہوئی لیکن اہم اپ ڈیٹ ہے، جس میں مزید اضافہ ہوتا ہے مقامی آڈیو، طویل اور زیادہ قابل کنٹرول ویڈیو آؤٹ پٹس، اور بہتر ترمیم اور منظر کی سطح کنٹرول.
بنیادی معلومات - بنیادی خصوصیات
Veo 3.1 پریکٹیکل پر فوکس کرتا ہے۔ مواد تخلیق خصوصیات:
- مقامی آڈیو جنریشن (مکالمہ، محیطی آواز، SFX) آؤٹ پٹ میں مربوط۔ Veo 3.1 پیدا کرتا ہے۔ مقامی آڈیو (مکالمہ + ماحول + SFX) بصری ٹائم لائن کے ساتھ منسلک؛ ماڈل کا مقصد مکالمے اور منظر کے اشارے کے لیے ہونٹوں کی مطابقت پذیری اور آڈیو-بصری سیدھ کو محفوظ رکھنا ہے۔
- طویل آؤٹ پٹس (60 سیکنڈز / 1080p بمقابلہ Veo 3 کے انتہائی مختصر کلپس، 8s تک کی حمایت)، اور ملٹی پرامپٹ کثیر شاٹ داستان کے تسلسل کے سلسلے
- منظر کی توسیع اور پہلا/آخری فریم موڈز جو کلیدی فریموں کے درمیان فوٹیج کو بڑھاتے یا انٹرپولیٹ کرتے ہیں۔
- آبجیکٹ داخل کرنا اور (آنے والا) آبجیکٹ ہٹانا اور فلو کے اندر قدیم چیزوں میں ترمیم کرنا۔
اوپر کی ہر گولی دستی VFX کے کام کو کم کرنے کے لیے ڈیزائن کی گئی ہے: آڈیو اور منظر کا تسلسل اب بعد کے خیالات کے بجائے فرسٹ کلاس آؤٹ پٹ ہیں۔
تکنیکی تفصیلات (ماڈل سلوک اور ان پٹ)
ماڈل فیملی اور مختلف قسمیں: Veo کا تعلق گوگل کے Veo-3 خاندان سے ہے۔ پیش نظارہ ماڈل ID عام طور پر ہے۔ veo3.1-pro; veo3.1 (CometAPI دستاویز)۔ یہ قبول کرتا ہے۔ متن کا اشارہ, تصویری حوالہ جات (سنگل فریم یا تسلسل)، اور ملٹی شاٹ جنریشن کے لیے ساختی ملٹی پرامپٹ لے آؤٹ۔
قرارداد اور مدت: پیش نظارہ دستاویزات میں آؤٹ پٹ کی وضاحت کرتا ہے۔ 720P / 1080P لمبے دورانیے کے اختیارات کے ساتھ (بعض پیش نظارہ ترتیبات میں ~60s تک) اور پہلے Veo ویریئنٹس سے زیادہ مخلص۔
پہلو تناسب: 16:9 (تعاون یافتہ) اور 9:16 (کچھ حوالہ تصویری بہاؤ کے علاوہ تعاون یافتہ)۔
فوری زبان: انگریزی (پیش نظارہ)۔
API حدود: عام پیش نظارہ کی حدود شامل ہیں۔ فی پروجیکٹ زیادہ سے زیادہ 10 API درخواستیں/منٹ, فی درخواست زیادہ سے زیادہ 4 ویڈیوز، اور ویڈیو کی لمبائی کے درمیان منتخب 4، 6، یا 8 سیکنڈ (ریفرنس امیج فلو سپورٹ 8s)۔
بینچ مارک کارکردگی
Google کی داخلی اور عوامی سطح پر خلاصہ شدہ تشخیصی رپورٹ مضبوط ترجیح Veo 3.1 آؤٹ پٹس کے لیے میٹرکس پر انسانی شرح کے موازنہ جیسے متن کی سیدھ, بصری معیار، اور سمعی و بصری ہم آہنگی (متن → ویڈیو اور تصویر → ویڈیو کام)۔
Veo 3.1 حاصل کیا۔ ریاستی آرٹ متعدد معروضی محوروں پر داخلی انسانی ریٹر کے موازنہ کے نتائج — مجموعی ترجیحات، فوری سیدھ (متن → ویڈیو اور تصویر → ویڈیو)، بصری معیار، آڈیو-ویڈیو الائنمنٹ، اور بینچ مارک ڈیٹاسیٹ جیسے مووی گین بینچ اور وی بینچ پر "بصری طور پر حقیقت پسندانہ طبیعیات"۔
حدود اور حفاظت کے تحفظات
حدود:
- نمونے اور عدم مطابقت: بہتری کے باوجود، کچھ روشنی، عمدہ طبیعیات، اور پیچیدہ رکاوٹیں اب بھی نمونے حاصل کر سکتی ہیں۔ تصویر → ویڈیو کی مستقل مزاجی (خاص طور پر طویل دورانیے پر) بہتر ہوئی ہے لیکن کامل نہیں۔
- غلط معلومات / ڈیپ فیک خطرہ: امیر آڈیو + آبجیکٹ داخل کرنا/ہٹانے سے غلط استعمال کا خطرہ بڑھ جاتا ہے (حقیقت پسند جعلی آڈیو اور توسیعی کلپس)۔ گوگل نے تخفیف (پالیسی، حفاظتی اقدامات) کو نوٹ کیا اور اس سے قبل Veo نے ثابت ہونے میں مدد کے لیے حوالہ شدہ واٹر مارکنگ/SynthID کا آغاز کیا۔ تاہم تکنیکی تحفظات غلط استعمال کے خطرے کو ختم نہیں کرتے ہیں۔
- لاگت اور تھرو پٹ رکاوٹیں: اعلی ریزولیوشن، لمبی ویڈیوز کمپیوٹیشنل طور پر مہنگی ہیں اور فی الحال ایک بامعاوضہ پیش نظارہ میں گیٹ ہیں — تصویری ماڈلز کے مقابلے میں زیادہ تاخیر اور لاگت کی توقع ہے۔ کمیونٹی پوسٹس اور گوگل فورم تھریڈز دستیابی ونڈوز اور فال بیک حکمت عملیوں پر تبادلہ خیال کرتے ہیں۔
حفاظتی کنٹرول: Veo3.1 نے پہلے کی Veo ریلیز میں مواد کی پالیسیاں، واٹر مارکنگ/synthID سگنلنگ، اور پیش نظارہ رسائی کنٹرولز کو مربوط کیا ہے۔ صارفین کو مشورہ دیا جاتا ہے کہ وہ پلیٹ فارم کی پالیسی پر عمل کریں اور ہائی رسک آؤٹ پٹ کے لیے انسانی جائزے کو نافذ کریں۔
عملی استعمال کے معاملات
- تخلیقات کے لیے تیز رفتار پروٹو ٹائپنگ: اسٹوری بورڈز → ملٹی شاٹ کلپس اور اینیمیٹکس کے ساتھ مقامی مکالمہ ابتدائی تخلیقی جائزے کے لیے۔
- مارکیٹنگ اور مختصر شکل کا مواد: 15-60 کی دہائی کے پروڈکٹ اسپاٹس، سوشل کلپس، اور تصوراتی ٹیزر جہاں رفتار کامل فوٹو ریئلزم سے زیادہ اہمیت رکھتی ہے۔
- تصویر → ویڈیو موافقت: عکاسیوں، کرداروں، یا دو فریموں کو ہموار منتقلی یا متحرک مناظر میں تبدیل کرنا پہلا/آخری فریم اور منظر کی توسیع.
- ٹولنگ میں اضافہ: تکراری ترمیم (آبجیکٹ داخل کرنا/ہٹانے، لائٹنگ پرسیٹس) کے لیے فلو میں ضم کیا گیا ہے جو دستی VFX پاسز کو کم کرتا ہے۔
دیگر معروف ماڈلز کے ساتھ موازنہ
Veo 3.1 بمقابلہ Veo 3 (سابقہ): Veo 3.1 پر فوکس کرتا ہے۔ بہتر فوری عمل, آڈیو معیار، اور کثیر شاٹ مستقل مزاجی - اضافی لیکن مؤثر اپ ڈیٹس جن کا مقصد نمونے کو کم کرنا اور قابل تدوین کو بہتر بنانا ہے۔
Veo 3.1 بمقابلہ OpenAI سورا 2: پریس میں رپورٹ کردہ تجارت: Veo 3.1 زور دیتا ہے۔ طویل شکل بیانیہ کنٹرول، ضم آڈیو، اور فلو ایڈیٹنگ انضمام؛ سورا 2 (جب پریس میں موازنہ کیا جائے) مختلف طاقتوں (رفتار، مختلف ترمیمی پائپ لائنز) پر توجہ مرکوز کرتا ہے۔ TechRadar اور دیگر آؤٹ لیٹس Veo 3.1 کو بیانیہ اور طویل ویڈیو سپورٹ کے لیے Sora 2 کے Google کے ہدف شدہ مدمقابل کے طور پر تیار کرتے ہیں۔ آزادانہ پہلو بہ پہلو جانچ محدود ہے۔
کال کیسے کریں؟ Veo 3.1 CometAPI سے API
ماڈل ورژن: veo3.1؛ veo3.1-pro
Veo 3.1 CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ:
| veo3.1 | 0.4000 |
| veo3.1-pro | 2.0000 |
مطلوبہ اقدامات
- داخل ہوجاو cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔
- انٹرفیس کی رسائی کی سند API کلید حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔
- اس سائٹ کا یو آر ایل حاصل کریں: https://api.cometapi.com/
طریقہ استعمال کریں
- منتخب کریں “
veo3.1; veo3.1-proAPI کی درخواست بھیجنے اور درخواست کا باڈی سیٹ کرنے کے لیے اینڈ پوائنٹ۔ درخواست کا طریقہ اور درخواست کا باڈی ہماری ویب سائٹ API دستاویز سے حاصل کیا جاتا ہے۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ - بدل دیں۔ آپ کے اکاؤنٹ سے اپنی اصل CometAPI کلید کے ساتھ۔
- مواد کے خانے میں اپنا سوال یا درخواست داخل کریں—یہ وہی ہے جس کا ماڈل جواب دے گا۔
- . تیار کردہ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔
CometAPI مکمل طور پر ہم آہنگ REST API فراہم کرتا ہے — بغیر کسی رکاوٹ کے منتقلی کے لیے۔ کلیدی تفصیلات:
- بنیادی URL: https://api.cometapi.com/v1/chat/completions
- ماڈل کے نام: veo3.1؛ veo3.1-pro
- توثیق:
Bearer YOUR_CometAPI_API_KEYہیڈر - مواد کی قسم:
application/json.
یہ بھی دیکھتے ہیں سورہ 2


