گوگل نینو کیلے پرو (آفیشل ماڈل آئی ڈی gemini-3-pro-image-preview) جیمنی 3 پرو کا امیج جنریشن / امیج ایڈیٹنگ ویرینٹ ہے۔ یہ ایک پیش نظارہ مرحلہ ہے، پیشہ ورانہ گریڈ امیج ماڈل جو 2K/4K آؤٹ پٹ، ہائی فیڈیلیٹی ملٹی امیج کمپوزیشن (تک 14 حوالہ جات کی تصاویر، کردار کی مستقل مزاجی کے لیے 5 لوگوں تک)، مضبوط ٹیکسٹ ان امیج رینڈرنگ، اور حقیقی دنیا کی حقیقت کے لیے بنیاد تلاش کریں۔
بنیادی خصوصیات
- متن → تصویر: مضبوط فوری پابندی کے ساتھ مکمل فوری طور پر چلنے والی نسل۔
- تصویر → تصویر (ترمیم): متعدد ترامیم میں برقرار موضوع/کردار کی مستقل مزاجی کے ساتھ عمدہ، ہدفی ترمیمات۔
- زیادہ سے زیادہ آؤٹ پٹ ریزولوشن: تک 4K (مثالوں اور معاون عین مطابق پکسل سائز کا انحصار پہلو کے تناسب پر؛ API 1K/2K/4K پیش سیٹوں کو ظاہر کرتا ہے)
- تکراری منصوبہ بندی اور خود اصلاح: ایک اندرونی "ملٹی اسٹیج" پائپ لائن جو عام بصری غلطیوں کا پتہ لگاتی ہے اور درست کرتی ہے (نقطہ نظر، متن، ٹھیک جیومیٹری)۔
- اعلی درجے کی ان امیج ٹیکسٹ رینڈرنگ: واضح، قابل فہم کثیر زبانی متن (مختصر سرخیوں سے لے کر طویل پیراگراف تک) پوسٹرز، موک اپس اور انفوگرافکس کے لیے موزوں ہے۔
- 5 حروف اور تک کے لئے وفاداری 14 اشیاء/حوالہ کی تصاویر ایک ہی ورک فلو میں۔
- واٹر مارکنگ / پرویننس: تمام تیار کردہ تصاویر میں ایک SynthID واٹر مارک شامل ہے۔ ماڈل کچھ پروڈکٹ انٹیگریشنز میں پرووینس کے لیے C2PA میٹا ڈیٹا کو سرایت کرتا ہے۔
جیمنی 3 پرو امیج ورژن اور نام
gemini-3-pro-image-previewgemini-3-pro-image
تکنیکی تفصیلات
آرکیٹیکچر
- نسب / ریڑھ کی ہڈی: Nano Banana Pro کو گوگل کے تیار ہوتے جیمنی امیج اسٹیک پر بنایا گیا ہے — خاص طور پر نیا Gemini 3 Pro امیج / GEMPIX 2 فن تعمیر (ایک اعلی صلاحیت کا ملٹی موڈل امیج + ٹیکسٹ فریم ورک)۔ سے ایک ارتقاء ہے۔ جیمنی 2.5 فلیش امیج (اصل "نینو-کیلا") وسیع وژن زبان کی استدلال کی صلاحیتوں کے ساتھ مقامی طور پر ملٹی موڈل امیج ماڈل میں۔
- ماڈل سلوک: مقامی ملٹی موڈیلٹی (تصویر + متن + عالمی علم)، ملٹی امیج فیوژن کے لیے واضح پائپ لائنز، اور ایک اندرونی اسٹیجڈ پلانر جو ایک ہی جامد نمونہ تیار کرنے کے بجائے متعدد پاسوں پر آؤٹ پٹ کو بہتر کرتا ہے۔ ابتدائی رپورٹیں پہلے کے ورژن کے مقابلے مضبوط ہندسی/نظری استدلال (گلاس، ریفریکشن) کی نشاندہی کرتی ہیں۔
- سوچ / اندرونی تطہیر: ماڈل کمپوزیشن کو بہتر بنانے کے لیے اندرونی طور پر ایک مرئی "سوچنے" کے عمل کا استعمال کرتا ہے (API اس طرز عمل کو دستاویز کرتا ہے اور نوٹ کرتا ہے کہ ان اندرونی مراحل کو حتمی تصویری ٹوکن کے طور پر چارج نہیں کیا جاتا ہے)۔
- گراؤنڈنگ اور ٹولز: کی حمایت کرتا ہے۔ گراؤنڈنگ تلاش کریں۔ (ڈائیگرام/انفوگرافک جنریشن میں ویب حقائق کو شامل کر سکتے ہیں)۔ یہ زیادہ متعین کنٹرول کے لیے سسٹم ہدایات کی بھی حمایت کرتا ہے۔
کلیدی API پیرامیٹرز:
thinking_level(کم / زیادہ) تجارت میں تاخیر بمقابلہ استدلال کی گہرائی؛media_resolution(کم/درمیانی/اعلی) تصویر کو کنٹرول کرنے کے لیے OCR/تفصیل پڑھنے والے ٹوکنز؛generationConfig.imageConfigامیج آؤٹ پٹس میں اسپیکٹ ریشو/ریزولوشن کو کنٹرول کرنے کے لیے۔
تصویر کی حدود:
- ان پٹ طریقوں کی حمایت کی گئی: متن اور تصاویر (ماڈل آڈیو یا ویڈیو کو امیج جنریشن ان پٹ کے طور پر قبول نہیں کرتا ہے)۔
- فی پرامپٹ زیادہ سے زیادہ تصاویر: 14 (جیمنی 3 پرو امیج کے پیش نظارہ کے لیے)۔
- زیادہ سے زیادہ تصویر کا سائز (اپ لوڈ): 7 MB فی ان پٹ امیج۔
- تائید شدہ پہلو تناسب: 1:1، 3:2، 16:9، 9:16، 21:9، وغیرہ۔
آؤٹ پٹ امیجز / ٹوکنز: اعلی حدود، 4K/4096px تعاون یافتہ کے ساتھ۔
بینچ مارک کارکردگی
مختصر خلاصہ: عوامی/ابتدائی معیارات اب تک زیادہ تر کوالٹیٹیو/کمیونٹی پر مبنی ہیں، لیکن اصل نینو کیلے (جیمنی 2.5 فلیش امیج) کے مقابلے میں مستقل طور پر ریزولوشن، آرٹفیکٹ میں کمی، اور جسمانی وفاداری میں خاطر خواہ بہتری کی اطلاع دیتے ہیں۔ مخصوص نام والے "چیلنجز" نے واضح بصری فوائد دکھائے ہیں، لیکن ابھی تک (عوامی) معیاری عددی بینچ مارک ٹیبلز نہیں ہیں جو گوگل کی جانب سے معیاری امیج جنریشن میٹرکس میں v1 → v2 کا موازنہ کرتے ہیں۔
- کوالٹیٹو کمیونٹی ٹیسٹ: صاف ستھرا کناروں، تیز مائیکرو تفصیلات، سچے رنگ، اور زیادہ ایماندار فوری پابندی (کم ہیلوسینیٹڈ پروپس، زیادہ مستقل کردار)۔ مقبول غیر رسمی ٹیسٹوں میں نام نہاد "وائن گلاس ٹیسٹ" اور "گلاس برگر چیلنج" شامل ہیں، جہاں GEMPIX2 (Nano Banana Pro) شفافیت اور ریفریکشن کو پہلے کی تعمیر کے مقابلے میں نمایاں طور پر بہتر طریقے سے ہینڈل کرتا ہے۔
- ٹیکسٹ ہینڈلنگ: Nano Banana Pro تصاویر کے اندر نمایاں طور پر بہتر ٹائپوگرافی اور ٹیکسٹ پلیسمنٹ دکھاتا ہے (بہت سے امیج ماڈلز کے لیے ایک مستقل کمزوری)۔ کمیونٹی کا موازنہ کم گڑبڑ شدہ گالیفس کی نشاندہی کرتا ہے۔
- تھرو پٹ / یو ایکس: تیز تر تکرار کی رفتار اور ایک UX جو بیک اینڈ پر ملٹی اسٹیج ریفائنمنٹ انجام دیتا ہے تاکہ صارفین زیادہ قابل اعتماد فرسٹ پاس نتائج دیکھیں (دستی ری رولز کو کم کرتے ہوئے)۔
حدود اور خطرات
- مواد کے فلٹرز اور پتہ لگانا: ماڈل کو مربوط کرنے والے پلیٹ فارمز (مثلاً Whisk/Third-party apps) مشہور شخصیت یا مشابہت کا پتہ لگانے کے قابل ہو سکتے ہیں اور کچھ آؤٹ پٹس کو روک سکتے ہیں، جو تخلیقی ورک فلو کو متاثر کرتے ہیں جو حقیقت پسندانہ مشابہت پر انحصار کرتے ہیں۔
- ہیلوسینیشن / استدلال کے کنارے کے معاملات: بہتر ہونے کے باوجود، ماڈل اب بھی جسمانی طور پر غیر حقیقی نمونے تیار کر سکتا ہے، خاص طور پر تصاویر کے اندر گھنے علامتی متن یا انتہائی تکنیکی خاکوں کے ساتھ — حالانکہ NB2 ان غلطیوں کو پہلے کے ورژن کے مقابلے میں کم کرتا دکھائی دیتا ہے۔
- حفاظت اور غلط استعمال: جنریٹیو امیج ماڈلز کو مشکل یا نقصان دہ مواد بنانے کے لیے استعمال کیا جا سکتا ہے۔ گوگل رکاوٹوں، مواد کے فلٹرز، اور SynthID واٹر مارک کا اطلاق کرتا ہے اس کے باوجود، غلط استعمال ہوا ہے (سیاسی طور پر حساس ماحول میں نینو کیلے کی تخلیق کردہ تصویر سے منسلک ہائی پروفائل تنازعہ)۔
نینو کیلے پرو دوسرے ماڈلز کے مقابلے میں کس طرح اسٹیک اپ ہوتا ہے۔
- Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro امیج) — مضبوط موبائل انٹیگریشن، ملٹی امیج فیوژن، تکراری خود کی اصلاح، 2K مقامی/4K اپ اسکیلنگ، مضبوطی سے گوگل ایپس (تلاش، تصاویر، ورک اسپیس/جیمنی) میں مربوط۔ ایسے ورک فلو کے لیے بہترین ہے جنہیں Google سروسز کے ساتھ قابل اعتماد ترامیم، تسلسل اور انضمام کی ضرورت ہے۔
- درمیانی سفر - اسٹائلائزڈ آرٹسٹک آؤٹ پٹس اور کمیونٹی سے چلنے والے پرامپٹ انجینئرنگ میں مہارت عام طور پر فوٹو درست ملٹی امیج فیوژن یا ڈیپ ملٹی موڈل ایڈیٹنگ پائپ لائنز کو نشانہ نہیں بنایا جاتا ہے۔
- مستحکم بازی / کھلے وزن - مکمل طور پر کھلا، انتہائی حسب ضرورت، اور مقامی طور پر قابل میزبان؛ چیک پوائنٹس اور فائن ٹیوننگ کا ماحولیاتی نظام تحقیق اور آف لائن استعمال کے لیے ایک فیصلہ کن فائدہ ہے۔ نینو کیلے پرو کے مقابلے میں کم "ایک کلک" موبائل انضمام اور کم مستقل ملٹی امیج ایڈیٹنگ ہم آہنگی سے باہر ہے۔
- Seedream 4.0 (ByteDance) — حال ہی میں واضح طور پر نینو کیلے کے مدمقابل کے طور پر پوزیشن میں ہے، الٹرا فاسٹ رینڈرنگ، 2K آؤٹ پٹ، اور بہت سی حوالہ جاتی تصاویر (چھ تک) کے لیے سپورٹ پر زور دیتا ہے۔ حامی/تخلیق کار متبادل کے طور پر پوزیشن میں ہے۔
(یہ موازنہ اعلیٰ درجے کے ہیں؛ ٹول کو اپنے ورک فلو سے ملا کر ایک فاتح کا انتخاب کریں: کشادگی/حسب ضرورت → مستحکم بازی؛ اسٹائلائزڈ آرٹ → مڈجرنی؛ مربوط، مسلسل موبائل ایڈیٹنگ کے ساتھ جارحانہ تکرار → Nano Banana Pro/ Gemini 3 Pro امیج فیملی۔)
حقیقی دنیا کے استعمال کے معاملات۔
- موبائل فوٹو ایڈیٹنگ اور تخلیقی فلٹرز (گوگل فوٹو انٹیگریشنز — ری اسٹائلنگ، بیک گراؤنڈ فیوژن، پورٹریٹ ری کمپوزیشن)۔
- مارکیٹنگ اور اشتہاری اثاثے۔ - تیز تصور کی نسل، ایک سے زیادہ فریموں/زاویوں میں مسلسل برانڈ کردار۔
- تصور آرٹ اور اسٹوری بورڈنگ - ملٹی امیج فیوژن تمام پینلز میں کردار کا تسلسل برقرار رکھنے میں مدد کرتا ہے۔
- ای کامرس / مصنوعات کی نقل - مختلف سیاق و سباق/روشنی کے حالات میں مسلسل پروڈکٹ شاٹس تیار کریں۔
- AR/VR اثاثوں کے لیے تیزی سے پروٹو ٹائپنگ — اعلیٰ معیار کے 2K/4K آؤٹ پٹس جنہیں عمیق استعمال کے لیے بڑھایا جا سکتا ہے۔
جیمنی 3 پرو امیج کو کیسے کال کریںنینو کیلے پرو) API
CometAPI میں Nano Banana API کی قیمت، 20% آفیشل قیمت کی چھوٹ:
| قیمت | $0.19200 |
مطلوبہ اقدامات
- داخل ہوجاو cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔
- انٹرفیس کی رسائی کی سند API کلید حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔
- اس سائٹ کا یو آر ایل حاصل کریں: https://api.cometapi.com/
طریقہ استعمال کریں
- منتخب کریں “
gemini-3-pro-imageAPI کی درخواست بھیجنے اور درخواست کا باڈی سیٹ کرنے کے لیے اینڈ پوائنٹ۔ درخواست کا طریقہ اور درخواست کا باڈی ہماری ویب سائٹ API دستاویز سے حاصل کیا جاتا ہے۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ - بدل دیں۔ آپ کے اکاؤنٹ سے اپنی اصل CometAPI کلید کے ساتھ۔
- مواد کے خانے میں اپنا سوال یا درخواست داخل کریں—یہ وہی ہے جس کا ماڈل جواب دے گا۔
- . تیار کردہ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔
CometAPI مکمل طور پر ہم آہنگ REST API فراہم کرتا ہے — بغیر کسی رکاوٹ کے منتقلی کے لیے۔ اہم تفصیلات:
- بنیادی URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
- ماڈل کے نام:
gemini-3-pro-image - توثیق:
Bearer YOUR_CometAPI_API_KEYہیڈر - مواد کی قسم:
application/json.
یہ بھی دیکھتے ہیں Gemini 2.5 Flash Image API (Nano-Banana)



