گوگل میجر نے گوگل I/O 4 میں امیجن 4، امیجن 3 الٹرا اور ویو 2025 ماڈل لانچ کیے

گوگل اپنے اگلی نسل کے جنریٹو AI ماڈلز کی نقاب کشائی کرنے کے لیے تیار ہے۔تصویر 4, تصویر 4 الٹرا، اور ویو 3اپنی سالانہ Google I/O ڈویلپر کانفرنس کے دوران 20 مئی ، 2025. پیش نظارہ شناخت کنندگان کے ابتدائی لیکس (مثال کے طور پر، imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) تصویر اور ویڈیو سنتھیسز ڈومینز دونوں میں مرحلہ وار رول آؤٹ اور متعدد صلاحیتوں کے درجات کا اشارہ کرتا ہے۔ امیجن 4 کا مقصد تصویری حقیقت پسندی، فوری مخلصی، اور سٹائلسٹک مستقل مزاجی میں امیجین 3 کے مقابلے میں نمایاں فائدہ پہنچانا ہے، جبکہ "الٹرا" ویرینٹ اس سے بھی زیادہ ریزولوشن یا خصوصی کارکردگی کے موڈز پیش کر سکتا ہے۔ ویڈیو کی طرف، Veo 3 Veo 2 کے مقابلے میں زیادہ مربوط کلپ ٹو کلپ تسلسل اور مضبوط انداز کی پابندی کا وعدہ کرتا ہے۔ تینوں ماڈلز سے توقع کی جاتی ہے کہ وہ گوگل کے جیمنی AI ماحولیاتی نظام کے ساتھ مضبوطی سے مربوط ہوں گے، جس سے متن کے اشارے سے تصاویر یا ویڈیوز تک ایک ہی ورک فلو میں ہموار منتقلی ممکن ہو گی۔

پیش نظارہ شناخت کنندگان اور رول آؤٹ حکمت عملی

اسٹیجڈ پیش نظارہ: اندرونی حوالہ جات جیسے

imagen-4.0-generate-preview-05-20
imagen-4.0-ultra-generate-exp-05-20
veo-3.0-generate-preview

گوگل میجر نے گوگل I/O 4 میں امیجن 4، امیجن 3 الٹرا اور ویو 2025 ماڈل لانچ کیے

کوڈ ریپوزٹریز اور API کے پیش نظارہ میں منظر عام پر آئے ہیں، جو تصویر بنانے کے لیے معیاری اور "الٹرا" کارکردگی کے دونوں درجات پیش کرنے کے ساتھ ساتھ ابتدائی ٹیسٹرز کے لیے جدید ویڈیو ماڈل کا پیش نظارہ پیش کرنے کے گوگل کے ارادے کی نشاندہی کرتے ہیں۔

گوگل I/O لانچ:

یہ شناخت کنندگان سختی سے تجویز کرتے ہیں کہ Google نمائش کرے گا اور ممکنہ طور پر I/O پر ڈویلپرز کو پیش نظارہ رسائی فراہم کرے گا۔ 20 مئی ، 2025, Imagen 3 اور Veo 2 کے لیے پچھلے رول آؤٹس کی عکس بندی کر رہا ہے۔

Imagen 4 میں نیا کیا ہے۔

فوٹو ریئلزم اور مخلصی۔

بہتر رینڈرنگ: Imagen 4 مبینہ طور پر زیادہ فوٹوریئلسٹک تفصیلات حاصل کرتا ہے، نمونے کو کم کرتا ہے اور رنگ کی درستگی کو بہتر بناتا ہے۔ ابتدائی افواہیں پیچیدہ اشارے کو سمجھنے میں بہتری کی تجویز کرتی ہیں، جیسے کہ باریک روشنی یا عکاسی۔
فوری پابندی: ماڈل سے توقع کی جاتی ہے کہ وہ صارف کی ہدایات پر زیادہ درست طریقے سے عمل کرے گا، ایسی تصاویر فراہم کرے گا جو مواد اور طرز ہدایت دونوں سے بہتر طور پر میل کھاتی ہوں (مثال کے طور پر، "پہاڑوں پر غروب آفتاب کی آئل پینٹنگ")۔

انداز کی مطابقت

ملٹی امیج ہم آہنگی۔: Imagen 4 کو متعدد آؤٹ پٹس میں ایک مستقل بصری انداز کو برقرار رکھنے کے لیے ڈیزائن کیا گیا ہے، جس سے اسٹوری بورڈنگ یا پروڈکٹ کیٹلاگ کی تخلیق جیسے استعمال کے معاملات کو فائدہ پہنچتا ہے، جہاں یکسانیت اہم ہے۔
الٹرا ویرینٹ: "الٹرا" ٹائر (امیجن-4.0-الٹرا) ممکنہ طور پر انٹرپرائز اور تخلیقی پیشہ ور افراد کے لیے اعلی ریزولیوشن آؤٹ پٹ یا خصوصی اصلاح (مثلاً، پرنٹ میڈیا کے لیے انتہائی اعلی مخلص) پیش کرتا ہے۔

Veo 3 میں نیا کیا ہے۔

بہتر ہم آہنگی

کلپ ٹو کلپ تسلسل: Veo 3 کا مقصد ویڈیو کی ترتیب بنانا ہے جہاں یکے بعد دیگرے شاٹس مسلسل فریمنگ، لائٹنگ، اور کردار کی ظاہری شکل کو برقرار رکھتے ہیں، Veo 2 میں وقت کے ساتھ بصری بڑھے ہوئے حدود کو دور کرتے ہیں۔
انداز مخلصی: ماڈل فنکارانہ یا سنیما سٹائل کو زیادہ ایمانداری سے نقل کرنے پر توجہ مرکوز کرتا ہے، جس سے مطلوبہ جمالیاتی (مثلاً، نوئر، پیسٹل اینیمیشن) میں ویڈیوز بنانا آسان ہو جاتا ہے۔

SynthID واٹر مارکنگ کا انضمام

ڈیجیٹل واٹر مارکنگ: DeepMind کی SynthID ٹیکنالوجی کا فائدہ اٹھاتے ہوئے (Veo 2 کے ساتھ متعارف کرایا گیا)، Veo 3 ناقابل تصور واٹر مارکس کو سرایت کرے گا تاکہ AI سے تیار کردہ مواد کی شناخت اور غلط استعمال کو روکنے میں مدد ملے۔

Gemini AI کے ساتھ انضمام

ہموار رسائی: Imagen 4 اور Veo 3 دونوں ہی Google کے Gemini انٹرفیس کے ذریعے براہ راست قابل رسائی ہونے کی توقع کی جاتی ہے — جو صارفین کو چیٹ پر مبنی پرامپٹس کے اندر یا Google Photos اور Google Slides جیسے پروڈکٹ انٹرفیس کے ذریعے تصاویر یا ویڈیوز بنانے کے قابل بناتے ہیں۔
جیمنی جواہرات: حسب ضرورت AI "Gems" ان ماڈلز کو شامل کر سکتا ہے، جس سے صارفین کو خصوصی معاونین بنانے کی اجازت ملتی ہے (مثال کے طور پر، سفر کی منصوبہ بندی کرنے والا جواہر جو سفر کی تصاویر اور جائزہ ویڈیوز بناتا ہے) اور انہیں ChatGPT کے GPT اسٹور کی طرح بازار میں شیئر کر سکتا ہے۔

دستیابی اور اگلے اقدامات

عوامی پیش نظارہ: ڈویلپرز اور انٹرپرائز ٹیسٹرز کو امیجن 4 (معیاری اور الٹرا) اور Veo 3 کے آغاز کے ساتھ تجربہ کرنے کی دعوتیں موصول ہو سکتی ہیں۔ 20 مئی ، 2025 Google I/O پر، اگلے ہفتوں میں Labs اور Vertex AI میں وسیع تر رول آؤٹ کے ساتھ۔

تاثرات اور تکرار: جیسا کہ پہلے لانچوں کے ساتھ ہوتا ہے، Google ممکنہ طور پر عام دستیابی سے پہلے حفاظتی فلٹرز، واٹر مارکنگ کی مضبوطی، اور کارکردگی کو بہتر بنانے کے لیے صارف کے تاثرات طلب کرے گا۔

اس جگہ کو دیکھیں: دلچسپی رکھنے والے ڈویلپرز کی نگرانی کرنی چاہیے۔ CometAPI.

نئے ماڈل API کو CometAPI پر درج کیا جائے گا، اور آپ کے انضمام کی سہولت کے لیے Google سے کم قیمتیں فراہم کرنے کا وعدہ کیا گیا ہے۔ براہ کرم توجہ دیتے رہیں API دستاویز.