اہم خصوصیات
- بلٹ اِن تصویر سازی اور ترمیم — قدرتی زبان کے پرامپٹس کے ذریعے تصاویر بنائیں یا موجودہ فوٹوز میں ترمیم کریں۔ (جنریٹ / ایڈٹ).
- ملٹی امیج فیوژن — متعدد ان پٹ تصاویر کو ایک حقیقت نما منظر میں یکجا کریں۔
- کردار کی مطابقت — ترمیمات اور پرامپٹس کے دوران ایک ہی موضوع یا کردار کی ظاہری شکل برقرار رکھیں۔ (مطابقت).
- SynthID واٹرمارکنگ — تمام آؤٹ پٹ میں غیر مرئی SynthID شامل ہوتا ہے جو AI سے تیار کردہ مواد کی شناخت کرتا ہے۔ (واٹرمارک).
تکنیکی تفصیلات
- آرکیٹیکچر اور پوزیشننگ: Gemini 2.5 Flash فیملی پر مبنی — اسے کم تاخیر والا “Flash” ویریئنٹ بنایا گیا ہے جو فی کال بہت تیز ردِعمل اور لاگت کی افادیت کے لیے کچھ ماڈل سائز/تھرُوپُٹ کی قربانی دیتا ہے، جبکہ پہلے کے Flash ٹیئرز کے مقابلے میں زیادہ مضبوط استدلال برقرار رکھتا ہے۔
- ان پٹ فارمیٹس اور حدود: چھوٹے ان پٹس کے لیے inline base64 تصاویر قبول کرتا ہے اور بڑی تصاویر کے لیے File API کے ذریعے فائل اپ لوڈز ( >20 MB کے لیے تجویز کردہ )۔ عام MIME اقسام کو سپورٹ کرتا ہے (JPEG, PNG).
- عمل کے موڈز: ٹیکسٹ-ٹو-امیج، امیج ایڈٹنگ (ان پینٹنگ / سیمینٹک ماسکنگ)، اسٹائل ٹرانسفر، ملٹی امیج کمپوزیشن، اور انٹرلیویڈ ٹیکسٹ+امیج جوابات (مصور ہدایات، ترکیبیں، یا مخلوط مواد کے لیے مفید)۔
- ماخذ اور حفاظتی میکانزم: AI آؤٹ پٹس پر مرئی واٹر مارکس کے ساتھ مخفی SynthID مارکرز اور پالیسی نفاذ کی تہیں، تاکہ واضح طور پر غیر مجاز مواد کو محدود کیا جا سکے۔
حدود اور معلوم خطرات
- مواد کی پالیسی کی پابندیاں: ماڈلز مواد کی پالیسیوں کو نافذ کرتے ہیں (مثلاً واضح جنسی مواد اور کچھ غیر قانونی مواد کی ممانعت)، مگر نفاذ کامل نہیں — کچھ حالات میں عوامی شخصیات یا متنازعہ علامات کی تصاویر بنانا پھر بھی ممکن ہو سکتا ہے، لہٰذا پالیسی چیکس ضروری ہیں. )
- ناکامی کے موڈز: انتہائی ترمیمات میں ممکنہ شناخت کا انحراف, کبھی کبھار معنوی عدم مطابقت (جب پرامپٹس کم وضاحت شدہ ہوں)، اور بہت پیچیدہ مناظر یا انتہائی نقطۂ نظر کی تبدیلیوں میں آرٹیفیکٹس۔
- ماخذ اور غلط استعمال: اگرچہ واٹر مارکس اور SynthID موجود ہیں، یہ غلط استعمال کو نہیں روکتے — یہ دریافت اور انتساب میں مدد دیتے ہیں مگر حساس ورک فلو میں انسانی جائزے کا متبادل نہیں ہیں۔
عام استعمال کے منظرنامے
- پروڈکٹ اور ای کامرس: لائف اسٹائل شاٹس میں مصنوعات رکھیں/کیٹلاگ کریں ملٹی امیج فیوژن کے ذریعے۔
- کریئیٹو ٹولنگ / ڈیزائن: تیز تر تکرار ڈیزائن ایپس میں (Adobe Firefly انٹیگریشن مذکور)۔
- فوٹو ایڈٹنگ اور ری ٹچنگ: قدرتی زبان سے مقامی ترمیمات (اشیاء ہٹائیں، رنگ/روشنی تبدیل کریں، دوبارہ اسٹائل کریں)۔
- اسٹوری ٹیلنگ / کردار اثاثے: کرداروں کو مسلسل ایک جیسا رکھیں پینلز اور مناظر میں۔