gen4_image Gen-4 فیملی میں رن وے کا فلیگ شپ ملٹی موڈل امیج جنریشن ماڈل ہے جو سپورٹ کرتا ہے۔ حوصلہ افزائی نسل کے علاوہ بصری حوالہ جات (آپ تصویر اور امیج → ویڈیو پائپ لائنز کے لیے انتہائی قابل کنٹرول، سٹائلسٹک طور پر مسلسل آؤٹ پٹ تیار کرنے کے لیے حوالہ جات کی تصاویر کو "@ ذکر" کر سکتے ہیں۔
تعارف - کیا Gen-4 تصویر is
gen4_image رن وے کی چوتھی نسل کا بصری جنریٹو ماڈل فیملی ہے، جسے لینے کے لیے انجنیئر کیا گیا ہے۔ متن کا اشارہ + بصری حوالہ جات اور ہائی فیڈیلیٹی اسٹیل امیجز یا میڈیا کے لیے تیار فریم تیار کرتے ہیں جو محفوظ رہتے ہیں۔ شناخت اور سٹائل زاویوں اور روشنی کے پار۔ ماڈل کو ایک وسیع تر Gen-4 سوٹ کے حصے کے طور پر پیش کیا گیا ہے (بشمول ویڈیو ویریئنٹس جیسے gen4_turbo) اور واضح طور پر اس کے لیے ڈیزائن کیا گیا ہے۔ تخلیقی پیداوار — مثال کے طور پر، مسلسل کریکٹر رینڈرنگ، پیمانے پر پروڈکٹ فوٹوگرافی، ورچوئل ٹرائی آن، اور گیم ایسٹ جنریشن۔
کلیدی خصوصیات
- حوالہ پر مبنی نسل (1–3 refs)۔ تین حوالہ جات تک کی تصاویر استعمال کریں تاکہ ماڈل پوز، لائٹنگ، بیک گراؤنڈ وغیرہ کو تبدیل کرتے ہوئے شناخت، انداز، یا مقام کو محفوظ رکھ سکے۔
- اعلی بصری مخلص (پیداوار کے لیے تیار آؤٹ پٹس)۔ آؤٹ پٹ مضبوط تفصیل اور اسٹائلسٹک کنٹرول کے ساتھ ہائی ریزولوشن (1080p اختیارات دستیاب) کو ہدف بناتے ہیں۔
- شناخت اور منظر کی مطابقت۔ ایک ہی کردار( کرداروں) یا ماحول کو متعدد نسلوں میں یکساں رکھنے کے لیے ڈیزائن کیا گیا — ملٹی شاٹ ویژول یا کریکٹر سنٹرک اثاثوں کے لیے مفید۔
- ملٹی موڈل (ٹیکسٹ + امیجز) کا اشارہ۔ ساخت، مزاج، لباس، کیمرے کے زاویے وغیرہ کو چلانے کے لیے قدرتی زبان کی ہدایات کو حوالہ جاتی تصاویر کے ساتھ جوڑیں۔
- امیج → امیج پلس ٹیکسٹ → امیج ورک فلوز۔ تسلسل کو برقرار رکھنے کے لیے حوالہ جات کا استعمال کرتے ہوئے تصویر سے تصویر (ترمیم/تبدیل) اور متن سے تصویر کے طور پر کام کرتا ہے۔
- کارکردگی کا درجہ (ٹربو) دستیاب ہے۔ ایک "Gen-4 امیج ٹربو" ویریئنٹ حوالہ سے چلنے والی خصوصیات کو برقرار رکھتے ہوئے لاگت اور رفتار (مثلاً ~2.5× تیز) تجارت کرتا ہے۔
- کنٹرولز اور تولیدی صلاحیت۔ عام API کے اختیارات میں پہلو تناسب کے پیش سیٹ، ریزولوشن (720p/1080p)، تولیدی صلاحیت کے لیے بیج، اور مخصوص ان پٹس کی طرف اشارہ کرنے کے لیے حوالہ ٹیگ شامل ہیں۔
تکنیکی تفصیلات
ان پٹ: متن/تصویر
نتائج: تصویر
ورک فلو:
- صارف کی فراہمی: ٹیکسٹ پرامپٹ + 0–3 حوالہ جات کی تصاویر (اور اختیاری ماسک، کی فریمز، کیمرہ موشن ہدایات)۔
- پری پروسیس: حوالہ جات کو عام اور انکوڈ کیا جاتا ہے۔ متن ٹوکنائزڈ ہے۔ شناخت/اسٹائل ایمبیڈنگز کو نکالا جاتا ہے اور دوبارہ استعمال کے لیے کیش کیا جاتا ہے۔
- کنڈیشنگ: متن اور حوالہ ایمبیڈنگ ملٹی موڈل ریڑھ کی ہڈی میں جوڑے جاتے ہیں۔ اختیاری کنٹرول سگنل (پوز، گہرائی، ماسک) منسلک ہیں.
- نمونہ لینا/ denoising: ڈیکوڈر ایک تصویر (یا ویڈیو کے لیے فریموں کی ترتیب) تیار کرنے والے تکراری تکرار ( بازی کے مراحل) کو چلاتا ہے۔
gen4_image — ٹھوس حدود
دنیاوی / تحریک کنارے مقدمات. جائزہ لینے والے اور تخلیق کار کبھی کبھار حرکت کے نمونے، عجیب وقتی حرکیات (جنریٹڈ کلپس میں جلد/دیر سے خرابیاں) اور بہت ہی پیچیدہ ملٹی ایکٹر کوریوگرافی میں ناکامیوں کی اطلاع دیتے ہیں — اپنے ہدف والے مناظر کے ساتھ جانچ کریں۔
حساب، لاگت اور قطار۔ اعلی معیار کی تصویر → ویڈیو جنریشن GPU بھاری ہے۔ صارفین قطار کے اوقات اور لاگت/فی رینڈر کی اطلاع دیتے ہیں جو بڑے پیمانے پر پیداوار کے لیے اہم ہو سکتے ہیں۔ اس کے مطابق بجٹ/تھرو پٹ کی منصوبہ بندی کریں۔
تخلیقی تجارت بمقابلہ خالص فنکارانہ ماڈل۔ Gen-4 کی طاقت مستقل مزاجی ہے۔ اگر آپ کو انتہائی اسٹائلائزڈ، پینٹری، یا "حیران کن" جمالیاتی آؤٹ پٹ کی ضرورت ہے، تو مڈجرنی یا ٹیونڈ SDXL چیک پوائنٹس ترجیحی آرٹ ڈائریکشنز تیار کر سکتے ہیں۔
کیننیکل استعمال کے معاملات
- پری پروڈکشن اور اسٹوری بورڈنگ: حوالہ جاتی تصویروں سے تیزی سے طرز کے مطابق کردار/منظر کی مختلف حالتیں بنائیں۔
- مارکیٹنگ اور مواد کی تیاری: مسلسل برانڈ کرداروں کے ساتھ ہیرو امیجز، اینیمیٹڈ سوشل کلپس، اور مہم کے اثاثوں کی تیز پیداوار۔ (رن وے انٹرپرائز کی مثالوں کی فہرست دیتا ہے بشمول لائیو ٹور اور میوزک ویڈیوز۔)
- گیم/اثاثہ پروٹو ٹائپنگ اور ورچوئل ٹرائی آن: حوالہ جات کے ایک چھوٹے سیٹ سے متعدد کیمرہ زاویے، لباس کی مختلف حالتیں اور ماحولیات کے تصورات تیار کریں۔
دوسرے ماڈلز سے موازنہ
- gen4_image→ بہترین جب آپ کو ضرورت ہو حوالہ / شناخت کی مستقل مزاجی (سنگل کریکٹر یا آبجیکٹ کو شاٹس میں ایک جیسا رکھا گیا) اور جب آپ چاہیں۔ تصویر → ویڈیو اور ملٹی شاٹ پائپ لائنز۔
- DALL·E 3 → بہترین سخت پرامپٹ ٹو امیج کی مخلصی اور بات چیت کے لیے چیٹ جی پی ٹی سے چلنے والے ایڈیٹنگ فلو کے علاوہ بلٹ ان سیفٹی/ پرووننس ورک۔
- SDXL (مستحکم ڈفیوژن فیملی) → بہترین جب آپ کھلے ماڈلز، مقامی/اپنی مرضی کے مطابق فائن ٹیوننگ، اور لاگت میں لچکدار تعیناتی چاہتے ہیں۔
- درمیانی سفر → بہترین انتہائی اسٹائلائزڈ، فنکارانہ طور پر خوش کن رینڈرز اور مضبوط کمیونٹی سے چلنے والے پرسیٹس / "اسٹائلائز" کنٹرولز کے لیے۔
- Runway Gen-4 بمقابلہ ByteDance Seedream 4.0 / Google "Nano Banana" قسم کے ماڈل: حالیہ مدمقابل لانچز (جیسے سیڈریم 4.0) زور دیتے ہیں۔ الٹرا فاسٹ رینڈرنگ اور ملٹی ریفرنس ہینڈلنگ تجارتی تخلیق کاروں کا مقصد؛ رن وے کا فائدہ ایک مضبوطی سے مربوط امیج → ویڈیو پائپ لائن اور پروڈکشن پر مبنی کنٹرول کے علاوہ ایک بالغ API اور SDK ماحولیاتی نظام ہے۔
کال کیسے کریں؟ gen4_image CometAPI سے API
| قیمت | $0.32000 |
مطلوبہ اقدامات
- داخل ہوجاو cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔
- انٹرفیس کی رسائی کی سند API کلید حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔
- اس سائٹ کا یو آر ایل حاصل کریں: https://api.cometapi.com/
طریقہ استعمال کریں
- API کی درخواست بھیجنے کے لیے "gen4_image" اینڈ پوائنٹ کو منتخب کریں اور درخواست کا باڈی سیٹ کریں۔ درخواست کا طریقہ اور درخواست کا باڈی ہماری ویب سائٹ API دستاویز سے حاصل کی گئی ہے۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔
- بدل دیں۔ آپ کے اکاؤنٹ سے اپنی اصل CometAPI کلید کے ساتھ۔
- مواد کے خانے میں اپنا سوال یا درخواست داخل کریں—یہ وہی ہے جس کا ماڈل جواب دے گا۔
- . تیار کردہ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔
CometAPI مکمل طور پر ہم آہنگ REST API فراہم کرتا ہے — بغیر کسی رکاوٹ کے منتقلی کے لیے۔ کی اہم تفصیلات API دستاویز:
- اختتامی نقطہ:
https://api.cometapi.com/runwayml/v1/text_to_image - ماڈل پیرامیٹر:
gen4_image - توثیق:
Bearer YOUR_CometAPI_API_KEY - مواد کی قسم:
application/json.
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \
--header 'X-Runway-Version: 2024-11-06' \
--header 'Authorization: {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{
"promptText": "cat",
"ratio": "1920:1080",
"seed": 4294967295,
"model": "gen4_image",
"referenceImages": ,
"contentModeration": {
"publicFigureThreshold": "auto"
}
}'
یہ بھی دیکھتے ہیں رن وے/ایکٹ_ٹو
