Gemini 3.1 فلیش امیج پری ویو کی تکنیکی مشخصات
| Item | Gemini 3.1 فلیش امیج پری ویو |
|---|---|
| Provider | |
| Model family | Gemini 3.1 (فلیش ٹئیر) |
| Primary focus | تصویر پری ویو کے ساتھ تیز رفتار ملٹی موڈل جنریشن |
| Input types | متن، تصویر |
| Output types | متن، تصویر (پری ویو جنریشن) |
| Context window | زیادہ سے زیادہ 1M ٹوکنز (Gemini 3.x فلیش ٹئیر معیار) |
| Latency tier | کم تاخیر، زیادہ تھروپٹ |
| Streaming support | ہاں |
| Tool calling | ہاں (Gemini API ٹولز فریم ورک) |
| Version | 3.1 |
Nano Banana 2 کیا ہے
Nano Banana 2 نئی جاری کردہ Gemini-3.1-Flash-Image ماڈل کے لیے پریس اور ڈویلپر کمیونٹی میں مستعمل مقبول عرفی نام ہے۔ Google اسے “فلیش” ٹئیر کے امیج انجن کے طور پر پیش کرتا ہے جو تقریباً پرو سطح کی بصری وفاداری کو بہت کم تاخیر اور لاگت والے درجے میں لاتا ہے — بڑے پیمانے پر جنریشن، تیز رفتار تکراری ایڈیٹنگ، اور Google خدمات میں مربوط پروڈکٹ ورک فلوز کے لیے موزوں۔ یہ Gemini 3.1 کی ملٹی موڈل ریزننگ کو وراثت میں لیتا ہے اور امیج مرکوز صلاحیتیں شامل کرتا ہے (تصاویر میں قابلِ مطالعہ متن، متعدد تصاویر کی کمپوزیشن، وسیع ایسپیکٹ ریشو سپورٹ، نیٹو 4K)۔
اہم خصوصیات
- تیز رفتار، ملٹی ریزولوشن جنریشن: فلیش ٹئیر کی رفتار کے ساتھ 0.5K / 1K / 2K / 4K آؤٹ پٹس اور نئے انتہائی ایسپیکٹ ریشوز (1:4, 4:1, 1:8, 8:1) کی آپشنز۔
- ریئل ٹائم ویب گراؤنڈنگ: جب “Thinking” یا سرچ گراؤنڈنگ فعال ہو تو موجودہ ویب معلومات میں پیدا شدہ مواد کو گراؤنڈ کرنے کے لیے متن اور تصویر دونوں کی سرچ نتائج کو ضم کرتا ہے۔ تازہ حوالہ جات اور فیکچوئل اِنفوگرافکس کے لیے مفید۔
- بہتر ٹیکسٹ رینڈرنگ: سابقہ فلیش ماڈلز کے مقابلے میں مختصر متن اور گرافک متن (فونٹس، سائز) کی بہتر رینڈرنگ؛ طویل پیراگراف/چھوٹے متن پر اب بھی مکمل نہیں۔
- ملٹی اِن پٹ ایڈیٹنگ اور ملٹی ٹرن ورک فلو: متعدد تصاویر کو بطور اِن پٹ یکجا کرنے اور متعدد ٹرنز میں تکراری ایڈیٹس کے لیے مضبوط سپورٹ۔
📊 بینچ مارک کارکردگی — امیج جنریشن اور ایڈیٹنگ (Elo اسکورز)
| Capability | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| متن سے تصویر — مجموعی ترجیح | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| متن سے تصویر — بصری معیار | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| انفوگرافکس (حقائق پر مبنی) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| ایڈیٹنگ — عمومی | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| ایڈیٹنگ — کریکٹر | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| ایڈیٹنگ — تخلیقی | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| ایڈیٹنگ — آبجیکٹ/ماحول | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| ایڈیٹنگ — ملٹی اِن پٹ | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| ایڈیٹنگ — اسٹائلائزیشن | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
اس بینچ مارک جدول سے اہم نکات:
- متن سے تصویر جنریشن اور تصویر ایڈیٹنگ کے زمروں میں، Gemini 3.1 Flash Image مسلسل طور پر سب سے اعلیٰ اسکورز کی قیادت کرتا ہے یا ان کے برابر آتا ہے—فلیش ٹئیر اور کئی مقابل ماڈلز کے درمیان۔
- ماڈل خاص طور پر بصری معیار اور انفوگرافکس (فیکچوئلٹی) بینچ مارکس میں مضبوط نتائج دکھاتا ہے—جو ظاہر کرتا ہے کہ یہ صرف جمالیاتی معیار ہی نہیں بلکہ ساختی طور پر درست مواد رینڈر کرنے میں بھی ممتاز ہے۔
- ملٹی اِن پٹ ایڈیٹنگ میں، Nano Banana 2 بھی مضبوط جنر لائزیشن ظاہر کرتا ہے، جس کے اسکورز اس کے سابقہ فلیش جنریشن سے زیادہ ہیں۔
یہ جانچیں انسانی سائیڈ بائی سائیڈ Elo موازنات کے ذریعے متنوع بینچ مارک سوئیٹ پر کی گئی ہیں، جو عام امیج جنریشن/ایڈیٹنگ کاموں میں ترجیح اور وفاداری دونوں کی عکاسی کرتی ہیں۔
Nano Banana 2 بمقابلہ Nano Banana بمقابلہ Nano Banana Pro
| Model | مقام بندی | نمائندہ بینچ مارک/نوٹس |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | فلیش ٹئیر: رفتار + اعلیٰ بصری معیار (2K–4K) | مجموعی ترجیح 1079.0 ± 7.0؛ بصری معیار 1140 ± 6.0 (اندرونی GenAI-Bench)۔ |
| Gemini 2.5 Flash Image (Nano Banana) | پہلے کا فلیش ریلیز (کم وفاداری) | ترجیح/بصری اسکورز 3.1 کے مقابلے میں قدرے کم۔ |
| Gemini 3 Pro Image (Nano Banana Pro) | پرو ٹئیر: پیچیدہ کاموں کے لیے بلند سمجھی جانے والی وفاداری، زیادہ لاگت/تاخیر | مختلف سودے؛ کچھ میٹرکس میں مخصوص کاموں پر مختلف نسبتی درجہ بندیاں نظر آتی ہیں۔ |
| GPT-Image 1.5 / دیگر کمرشل ماڈلز | حریف (اوپن/کلوزڈ) | Google کے اندرونی بینچ مارکس میں GPT-Image اور دیگر کے بصری معیار اور مجموعی ترجیح اسکورز Gemini 3.1 سے کم رہے۔ خود مختار تھرڈ پارٹی تقابلی جائزوں میں نتائج مختلف ہو سکتے ہیں۔ |
Flash Image Preview کب منتخب کریں:
- ایپس میں ریئل ٹائم امیج پری ویو
- کم لاگت، بڑے پیمانے پر امیج جنریشن
- انٹرایکٹو ڈیزائن اسسٹنٹس
Nano Banana 2 تک رسائی اور انضمام کیسے کریں
مرحلہ 1: API Key کے لیے سائن اپ کریں
cometapi.com میں لاگ ان کریں۔ اگر آپ ابھی تک ہمارے یوزر نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن ان کریں۔ انٹرفیس کی ایکسیس کریڈنشل API key حاصل کریں۔ پرسنل سینٹر میں API token پر “Add Token” پر کلک کریں، ٹوکن key حاصل کریں: sk-xxxxx اور سبمٹ کریں۔
مرحلہ 2: Nano Banana 2 API کو درخواستیں بھیجیں
API ریکویسٹ بھیجنے اور ریکویسٹ باڈی سیٹ کرنے کے لیے “gemini-3.1-flash-image-preview8” اینڈ پوائنٹ منتخب کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کے API ڈاک سے حاصل کیے جائیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ کی اصل CometAPI key سے <YOUR_API_KEY> کو تبدیل کریں۔ کہاں کال کریں: Gemini generates image
Nano Banana 2 امیج ایڈیٹنگ، امیج جنریشن، اور ملٹی امیج ورک فلو کو سپورٹ کرتا ہے۔ امیج ایڈیٹنگ کے لیے آپ کو امیج کا URL اپ لوڈ کرنا ہوگا۔ مزید پیرا میٹرز کے لیے دستاویزات ملاحظہ کریں۔
مرحلہ 3: نتائج حاصل کریں اور تصدیق کریں
API ریسپانس کو پروسیس کریں تاکہ جنریٹڈ جواب حاصل ہو سکے۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔ آپ پلے گراؤنڈ میں تصویر براہِ راست اپنی لوکل مشین پر ڈاؤن لوڈ کر سکتے ہیں (عموماً PNG فارمیٹ میں)۔ API عمل میں ایک امیج URL جنریٹ ہوتا ہے؛ براہِ کرم اسے بروقت ڈاؤن لوڈ کر لیں۔



