Gemini 3.1 Flash Image Preview کی تکنیکی خصوصیات
| آئٹم | Gemini 3.1 Flash Image Preview |
|---|---|
| فراہم کنندہ | |
| ماڈل فیملی | Gemini 3.1 (Flash tier) |
| بنیادی توجہ | تصویر پریویو کے ساتھ تیز ملٹی موڈل جنریشن |
| ان پٹ اقسام | Text, Image |
| آؤٹ پٹ اقسام | Text, Image (preview generation) |
| کانٹیکسٹ ونڈو | زیادہ سے زیادہ 1M tokens (Gemini 3.x Flash tier standard) |
| لیٹنسی ٹئیر | کم لیٹنسی، ہائی تھروپٹ |
| اسٹریمنگ سپورٹ | Yes |
| ٹول کالنگ | Yes (Gemini API tools framework) |
| ورژن | 3.1 |
Nano Banana 2 کیا ہے
Nano Banana 2 پریس اور ڈویلپر کمیونٹی میں نئے جاری کردہ Gemini-3.1-Flash-Image ماڈل کا مقبول عرفی نام ہے۔ Google اسے “Flash” ٹئیر کے امیج انجن کے طور پر پیش کرتا ہے جو کم لیٹنسی اور لاگت پر تقریباً Pro درجے کی بصری وفاداری لاتا ہے — جو بڑی مقدار میں جنریشن، تیز رفتار تکراری ایڈیٹنگ، اور Google سروسز میں مربوط پروڈکٹ ورک فلو کے لیے موزوں ہے۔ یہ Gemini 3.1 کی ملٹی موڈل ریزننگ کو اپناتا ہے اور تصویر مرکوز صلاحیتیں شامل کرتا ہے (تصاویر میں واضح متن، متعدد تصاویر کی کمپوزیشن، وسیع ایسپیکٹ ریشو سپورٹ، native 4K)۔
اہم خصوصیات
- تیز رفتار، ملٹی ریزولوشن جنریشن: Flash-tier رفتار کے ساتھ 0.5K / 1K / 2K / 4K آؤٹ پٹس کے آپشنز اور نئے انتہائی ایسپیکٹ ریشوز (1:4, 4:1, 1:8, 8:1)۔
- ریئل ٹائم ویب گراؤنڈنگ: جب “Thinking” یا سرچ گراؤنڈنگ فعال ہو تو تیار کردہ مواد کو موجودہ ویب معلومات میں گراؤنڈ کرنے کے لیے متن اور تصویر کی سرچ کے نتائج کو یکجا کرتا ہے۔ تازہ ترین حوالہ جات اور حقائق پر مبنی انفروگرافکس کے لیے مفید۔
- متن کی بہتر رینڈرنگ: پچھلے Flash ماڈلز کے مقابلے میں مختصر متن اور گرافک ٹیکسٹ (فونٹس، سائز) کی بہتر رینڈرنگ؛ طویل پیراگراف/باریک متن پر اب بھی کامل نہیں۔
- ملٹی ان پٹ ایڈیٹنگ اور ملٹی ٹرن ورک فلو: متعدد تصاویر کو بطور ان پٹ جوڑنے اور کئی ٹرنز میں تکراری ایڈیٹس کے لیے مضبوط سپورٹ۔
📊 بینچ مارک کارکردگی — امیج جنریشن اور ایڈیٹنگ (Elo اسکورز)
| صلاحیت | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| ٹیکسٹ ٹو امیج — مجموعی ترجیح | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| ٹیکسٹ ٹو امیج — بصری معیار | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| ٹیکسٹ ٹو امیج — انفروگرافکس (حقانیت) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| ایڈیٹنگ — عمومی | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| ایڈیٹنگ — کردار | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| ایڈیٹنگ — تخلیقی | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| ایڈیٹنگ — شے/ماحول | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| ایڈیٹنگ — ملٹی ان پٹ | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| ایڈیٹنگ — اسٹائلائزیشن | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
اہم نکات (اس بینچ مارک جدول سے):
- ٹیکسٹ ٹو امیج جنریشن اور امیج ایڈیٹنگ دونوں زمروں میں، Gemini 3.1 Flash Image مسلسل طور پر سب سے بلند اسکورز کی قیادت کرتا ہے یا ان کے برابر رہتا ہے، چاہے Flash-tier میں ہو یا کئی مسابقتی امیج ماڈلز کے مقابل۔
- ماڈل خصوصاً بصری معیار اور انفروگرافکس (حقانیت) کے بینچ مارکس میں مضبوط نتائج دکھاتا ہے—جس سے ظاہر ہوتا ہے کہ یہ صرف جمالیاتی معیار ہی نہیں بلکہ ساختی طور پر درست مواد بھی بہتر انداز میں پیش کرتا ہے۔
- ملٹی ان پٹ ایڈیٹنگ پر، Nano Banana 2 بھی مضبوط عمومی اطلاقیت دکھاتا ہے، جو اس کے سابقہ Flash جنریشن سے بلند اسکورز میں نظر آتی ہے۔
یہ جائزے متنوع بینچ مارک سوئٹ پر انسانی سائیڈ بائی سائیڈ Elo تقابلات کے ذریعے کیے گئے ہیں، جو عام طور پر استعمال ہونے والے امیج جنریشن/ایڈیٹنگ کاموں میں ترجیح اور وفاداری دونوں کی عکاسی کرتے ہیں۔
Nano Banana 2 بمقابلہ Nano Banana بمقابلہ Nano Banana Pro
| ماڈل | پوزیشننگ | نمایندہ بینچ مارک/نوٹس |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Flash tier: رفتار + اعلیٰ بصری معیار (2K–4K) | مجموعی ترجیح 1079.0 ± 7.0؛ بصری معیار 1140 ± 6.0 (اندرونی GenAI-Bench). |
| Gemini 2.5 Flash Image (Nano Banana) | ابتدائی Flash ریلیز (کم وفاداری) | 3.1 کے مقابلے میں ترجیح/بصری اسکور قدرے کم۔ |
| Gemini 3 Pro Image (Nano Banana Pro) | Pro tier: پیچیدہ کاموں کے لیے زیادہ محسوس شدہ وفاداری، زیادہ لاگت/لیٹنسی | مختلف ٹریڈ آفز؛ کچھ میٹرکس مخصوص کاموں میں مختلف نسبتی درجہ بندی دکھاتے ہیں۔ |
| GPT-Image 1.5 / دیگر کمرشل ماڈلز | حریف (اوپن/کلوزڈ) | Google کے اندرونی بینچ مارکس میں رپورٹڈ ایوال میں بصری معیار اور مجموعی ترجیح پر GPT-Image اور دیگر کے اسکورز Gemini 3.1 سے کم رہے۔ آزاد تیسرے فریق کے تقابلی نتائج مختلف ہو سکتے ہیں۔ |
Flash Image Preview کب منتخب کریں:
- ایپس میں ریئل ٹائم امیج پریویو
- لاگت حساس بڑے پیمانے پر امیج جنریشن
- انٹرایکٹو ڈیزائن اسسٹنٹس
Nano Banana 2 تک رسائی اور انضمام کیسے کریں
مرحلہ 1: API Key کے لیے سائن اپ کریں
cometapi.com میں لاگ اِن کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن اِن کریں۔ انٹرفیس کا ایکسیس کریڈینشل API key حاصل کریں۔ ذاتی مرکز میں API token پر “Add Token” پر کلک کریں، ٹوکن key حاصل کریں: sk-xxxxx اور سبمٹ کریں۔
مرحلہ 2: Nano Banana 2 API کو درخواستیں بھیجیں
API درخواست بھیجنے کے لیے “gemini-3.1-flash-image-preview8” اینڈ پوائنٹ منتخب کریں اور ریکویسٹ باڈی سیٹ کریں۔ درخواست کا طریقہ اور درخواست کی باڈی ہماری ویب سائٹ کے API ڈاک سے حاصل کیے جاتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ کی اصل CometAPI key سے <YOUR_API_KEY> کو تبدیل کریں۔ اسے کہاں کال کرنا ہے: Gemini امیج جنریشن
Nano Banana 2 امیج ایڈیٹنگ، امیج جنریشن، اور ملٹی امیج ورک فلو سپورٹ کرتا ہے۔ امیج ایڈیٹنگ کے لیے، آپ کو امیج URL اپ لوڈ کرنا ہوگا۔ مزید پیرامیٹرز کے لیے براہ کرم دستاویزات دیکھیں۔
مرحلہ 3: نتائج حاصل کریں اور تصدیق کریں
API ریسپانس پراسیس کر کے تیار شدہ جواب حاصل کریں۔ پراسیسنگ کے بعد، API ٹاسک کی حیثیت اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔ آپ پلے گراؤنڈ میں تصویر کو براہ راست اپنی مشین پر ڈاؤن لوڈ کر سکتے ہیں (عام طور پر PNG فارمیٹ میں)۔ API عمل کے دوران ایک امیج URL جنریٹ ہوتا ہے؛ براہ کرم اسے فوراً ڈاؤن لوڈ کریں۔