What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 Google کا جدید ترین AI تصویری جنریشن اور تدوین ماڈل ہے، جو Gemini Flash امیج ٹیکنالوجی پر مبنی ہے تاکہ متن اور تصویر کی ان پٹس پر تیز، اعلیٰ معیار کی بصری تخلیق اور ہدایات کی عین پیروی فراہم کرے۔

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 بنیادی طور پر Google کے Gemini 3.1 Flash Image ماڈل کی صارفین کے لیے برانڈنگ ہے، جو پچھلے Nano Banana ورژنز کی جدید صلاحیتوں کو Flash ماڈلز کی رفتار کے ساتھ یکجا کرتی ہے۔

What improvements does Nano Banana 2 add over earlier Nano Banana models?

Nano Banana 2 تیز تر جنریشن اسپیڈ، زیادہ واضح تفصیل، ہدایات کی بہتر درستی، متن کی بہتر رینڈرنگ/مقامی ترجمہ، اور وسیع تر تخلیقی کنٹرول لاتا ہے، جبکہ بہت سی پیشہ ورانہ درجے کی خصوصیات کو بنیادی درجے پر دستیاب بناتا ہے۔

What kinds of images and resolutions can Nano Banana 2 generate?

یہ ماڈل مختلف اسپیکٹ ریشوز اور 4K تک ریزولوشنز کے ساتھ لچکدار آؤٹ پٹ کو سپورٹ کرتا ہے، جو سوشل میڈیا، اشتہارات، ڈسپلے اور پیشہ ورانہ مواد کے لیے موزوں ہے۔

Can Nano Banana 2 maintain consistency in complex compositions?

ہاں — یہ متعدد موضوعات اور اشیا میں مطابقت برقرار رکھتا ہے (مثلاً ایک ہی پرامپٹ ورک فلو میں پانچ کرداروں اور 14 اشیا تک)، جس سے داستانی مناظر اور اسٹوری بورڈ طرز کے کاموں میں مدد ملتی ہے۔

What image generation use cases is Gemini 3.1 Flash Image best suited for?

یہ پیشہ ورانہ معیار کی تصویری تخلیق اور تدوین، انفوگرافکس، متعدد تصاویر میں مطابقت، متن کی رینڈرنگ، اور مقامی نوعیت کے کثیر لسانی نتائج کے لیے نہایت موزوں ہے، خصوصاً جب ورک فلو کو عین کنٹرول اور بارہا دہرائی کی ضرورت ہو۔

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 حقیقی دنیا کا علم اور تصویری تلاش کا انضمام شامل کرتا ہے تاکہ مزید درست موضوعات، انفوگرافکس، اور مقام سے آگاہ بصری مواد تیار کرنے میں مدد ملے۔

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

ہاں — یہ تصاویر کے اندر واضح متن تیار اور رینڈر کر سکتا ہے، لیکن بہت چھوٹا یا بہت گنجان، متعدد پیراگراف پر مشتمل متن بعض اوقات چیلنج رہتا ہے۔

سستی Nano Banana 2 API | text-to-image

Gemini 3.1 Flash Image Preview کی تکنیکی وضاحتیں

آئٹم	Gemini 3.1 Flash Image Preview
فراہم کنندہ	Google
ماڈل فیملی	Gemini 3.1 (Flash tier)
بنیادی توجہ	تصویری پری ویو کے ساتھ تیز رفتار ملٹیموڈل جنریشن
ان پٹ اقسام	Text, Image
آؤٹ پٹ اقسام	Text, Image (preview generation)
کانٹیکسٹ ونڈو	1M ٹوکن تک (Gemini 3.x Flash tier کا معیار)
لیٹنسی درجہ	کم لیٹنسی، اعلیٰ تھرو پٹ
اسٹریمنگ سپورٹ	ہاں
ٹول کالنگ	ہاں (Gemini API tools framework)
ورژن	3.1

Nano Banana 2 کیا ہے

Nano Banana 2 وہ مقبول عرفی نام ہے جو پریس اور ڈویلپر کمیونٹی نے نئی جاری کردہ Gemini-3.1-Flash-Image ماڈل کے لیے استعمال کیا ہے۔ Google اسے “Flash” درجے کے امیج انجن کے طور پر پیش کرتا ہے جو بہت کم لیٹنسی اور لاگت کے درجے میں تقریباً Pro درجے کی بصری وفاداری فراہم کرتا ہے—جو بڑے پیمانے پر جنریشن، تیز رفتار تکراری ایڈیٹنگ، اور Google سروسز میں مربوط پروڈکٹ ورک فلو کے لیے موزوں ہے۔ یہ Gemini 3.1 کی ملٹیموڈل ریزننگ کو اپناتا ہے اور امیج مرکوز صلاحیتیں شامل کرتا ہے (تصاویر میں قابلِ مطالعہ متن، متعدد تصاویر کی کمپوزیشن، وسیع اسپییکٹ ریشو کی سپورٹ، نیٹو 4K)۔

اہم خصوصیات

ہائی اسپیڈ، ملٹی ریزولوشن جنریشن: Flash درجے کی رفتار کے ساتھ 0.5K / 1K / 2K / 4K آؤٹ پٹس اور نئے انتہائی اسپییکٹ ریشوز (1:4, 4:1, 1:8, 8:1) کے اختیارات۔
ریئل ٹائم ویب گراؤنڈنگ: جب “Thinking” یا سرچ گراؤنڈنگ فعال ہو تو تیار کردہ مواد کو موجودہ ویب معلومات میں گراؤنڈ کرنے کے لیے متن اور تصویر دونوں کی سرچ کے نتائج کو یکجا کرتی ہے۔ تازہ ترین حوالہ جات اور حقائق پر مبنی انفوگرافکس کے لیے مفید۔
بہتر ٹیکسٹ رینڈرنگ: سابقہ Flash ماڈلز کے مقابلے میں مختصر متن اور گرافک متن (فونٹس، سائز) کی رینڈرنگ بہتر؛ طویل پیراگراف/بہت چھوٹے متن پر اب بھی کامل نہیں۔
ملٹی ان پٹ ایڈیٹنگ اور ملٹی ٹرن ورک فلو: متعدد تصاویر کو بطور ان پٹ یکجا کرنے اور ٹرنز میں تکراری ایڈیٹس کے لیے مضبوط سپورٹ۔

📊 بینچ مارک کارکردگی — امیج جنریشن اور ایڈیٹنگ (Elo اسکورز)

صلاحیت	Gemini 3.1 Flash Image (Nano Banana 2)	Gemini 2.5 Flash Image (Nano Banana)	Gemini 3 Pro Image (Nano Banana Pro)	GPT-Image 1.5	Seedream 5.0 Lite	Grok Imagine Image Pro
ٹیکسٹ ٹو امیج — مجموعی ترجیح	1079.0 ± 7.0	1073.0 ± 5.0	942.0 ± 6.0	1021.0 ± 5.0	1047.0 ± 5.0	928.0 ± 8.0
ٹیکسٹ ٹو امیج — بصری معیار	1140.0 ± 6.0	1129.0 ± 6.0	929.0 ± 6.0	1043.0 ± 5.0	975.0 ± 5.0	759.0 ± 10.0
ٹیکسٹ ٹو امیج — انفوگرافکس (درستگی)	1114.0 ± 14.0	1074.0 ± 12.0	881.0 ± 13.0	1102.0 ± 13.0	985.0 ± 12.0	890.0 ± 22.0
ایڈیٹنگ — عمومی	1065.0 ± 9.0	1047.0 ± 9.0	913.0 ± 9.0	1051.0 ± 10.0	995.0 ± 8.0	937.0 ± 9.0
ایڈیٹنگ — کردار	1056.0 ± 7.0	1049.0 ± 7.0	952.0 ± 7.0	1050.0 ± 8.0	1025.0 ± 7.0	894.0 ± 8.0
ایڈیٹنگ — تخلیقی	1023.0 ± 7.0	1031.0 ± 7.0	976.0 ± 7.0	1004.0 ± 7.0	1017.0 ± 7.0	938.0 ± 7.0
ایڈیٹنگ — آبجیکٹ/ماحول	1029.0 ± 8.0	1018.0 ± 8.0	945.0 ± 8.0	1042.0 ± 10.0	976.0 ± 8.0	946.0 ± 9.0
ایڈیٹنگ — ملٹی ان پٹ	1037.0 ± 8.0	1016.0 ± 8.0	919.0 ± 9.0	1056.0 ± 12.0	1014.0 ± 9.0	N/A
ایڈیٹنگ — اسٹائلائزیشن	1045.0 ± 7.0	1031.0 ± 7.0	862.0 ± 8.0	1045.0 ± 9.0	996.0 ± 7.0	984.0 ± 7.0

اس بینچ مارک ٹیبل سے اہم نکات:

ٹیکسٹ ٹو امیج جنریشن اور امیج ایڈیٹنگ زمروں میں، Gemini 3.1 Flash Image مسلسل طور پر بلند ترین اسکورز کی قیادت کرتا ہے یا ان کے برابر رہتا ہے، خاص طور پر Flash درجے اور بہت سے مسابقتی امیج ماڈلز میں۔
ماڈل نے بصری معیار اور انفوگرافک (درستگی) بینچ مارکس میں خاصی مضبوط کارکردگی دکھائی—جس سے ظاہر ہوتا ہے کہ یہ صرف جمالیاتی معیار ہی نہیں بلکہ ساختی طور پر درست مواد کی رینڈرنگ میں بھی ممتاز ہے۔
ملٹی ان پٹ ایڈیٹنگ پر، Nano Banana 2 بھی مضبوط جنرلائزیشن دکھاتا ہے، اور اپنی پچھلی Flash جنریشن کے مقابلے میں زیادہ اسکورز حاصل کرتا ہے۔

یہ جائزے متنوع بینچ مارک سویٹ پر انسانی سائیڈ بائی سائیڈ Elo موازنوں کے ذریعے کیے گئے ہیں، جو عام طور پر استعمال ہونے والے امیج جنریشن/ایڈیٹنگ ٹاسکس میں ترجیح اور وفاداری دونوں کی عکاسی کرتے ہیں۔

Nano Banana 2 بمقابلہ Nano Banana بمقابلہ Nano Banana Pro

ماڈل	پوزیشننگ	نمایاں بینچ مارک/نوٹس
Gemini 3.1 Flash Image (Nano Banana 2)	Flash درجہ: رفتار + اعلیٰ بصری معیار (2K–4K)	مجموعی ترجیح 1079.0 ± 7.0؛ بصری معیار 1140 ± 6.0 (اندرونی GenAI-Bench).
Gemini 2.5 Flash Image (Nano Banana)	پہلے کا Flash ریلیز (کم فیڈیلیٹی)	3.1 کے مقابلے میں ترجیح/بصری اسکورز قدرے کم۔
Gemini 3 Pro Image (Nano Banana Pro)	Pro درجہ: پیچیدہ کاموں کے لیے بلند محسوس شدہ فیڈیلیٹی، زیادہ لاگت/لیٹنسی	مختلف ٹریڈ آفز؛ کچھ میٹرکس مخصوص ٹاسکس میں مختلف نسبتی درجہ بندی دکھاتے ہیں۔
GPT-Image 1.5 / دیگر کمرشل ماڈلز	حریف (اوپن/کلوزڈ)	Google کے داخلی بینچ مارکس میں رپورٹڈ ایوال میں بصری معیار اور مجموعی ترجیح پر GPT-Image اور دیگر کے اسکور Gemini 3.1 سے کم رہے۔ آزاد فریق ثالث موازنات مختلف ہو سکتے ہیں۔

Flash Image Preview کب منتخب کریں:

ایپس میں حقیقی وقت کا امیج پری ویو
لاگت حساس بڑے پیمانے پر امیج جنریشن
انٹرایکٹو ڈیزائن اسسٹنٹس

Nano Banana 2 تک رسائی اور انضمام کیسے کریں

مرحلہ 1: API Key کے لیے سائن اپ کریں

cometapi.com پر لاگ ان کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن ان کریں۔ انٹرفیس کی ایکسیس کریڈینشل API key حاصل کریں۔ ذاتی سینٹر میں API token پر “Add Token” پر کلک کریں، ٹوکن کی: sk-xxxxx حاصل کریں اور سبمٹ کریں۔

مرحلہ 2: `Nano Banana 2` API کو ریکویسٹ بھیجیں

API ریکویسٹ بھیجنے کے لیے “gemini-3.1-flash-image-preview8” اینڈ پوائنٹ منتخب کریں اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کی API ڈاک سے حاصل کیے جا سکتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ کی اصل CometAPI key کے ساتھ <YOUR_API_KEY> کو ریپلیس کریں۔ کہاں کال کریں:Gemini generates image

Nano Banana 2 امیج ایڈیٹنگ، امیج جنریشن، اور ملٹی امیج ورک فلو کی سپورٹ کرتا ہے۔ امیج ایڈیٹنگ کے لیے، آپ کو امیج URL اپ لوڈ کرنا ہوگا۔ مزید پیرامیٹرز کے لیے براہ کرم ڈاکیومنٹیشن دیکھیں۔

مرحلہ 3: نتائج حاصل کریں اور توثیق کریں

API ریسپانس کو پروسیس کر کے تیار کردہ جواب حاصل کریں۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔ آپ پلے گراؤنڈ میں امیج کو براہِ راست اپنی لوکل مشین پر ڈاؤن لوڈ کر سکتے ہیں (عموماً PNG فارمیٹ میں)۔ API عمل میں ایک امیج URL جنریٹ ہوتا ہے؛ براہِ کرم اسے بروقت ڈاؤن لوڈ کر لیں۔

Nano Banana 2 کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔

nano-banana-2（image）

variant / alias	Price
gemini-3.1-flash-image (0.5K)	≈ $0.03600
gemini-3.1-flash-image (1K)	≈ $0.05360
gemini-3.1-flash-image (2K)	≈ $0.08080
gemini-3.1-flash-image (4K)	≈ $0.12080
gemini-3.1-flash-image-preview (0.5K)	≈ $0.03600
gemini-3.1-flash-image-preview (1K)	≈ $0.05360
gemini-3.1-flash-image-preview (2K)	≈ $0.08080
gemini-3.1-flash-image-preview (4K)	≈ $0.12080

Nano Banana 2 کے لیے نمونہ کوڈ اور API

Nano Banana 2 کے لیے جامع نمونہ کوڈ اور API وسائل تک رسائی حاصل کریں تاکہ آپ کے انضمام کے عمل کو آسان بنایا جا سکے۔ ہماری تفصیلی دستاویزات قدم بہ قدم رہنمائی فراہم کرتی ہیں، جو آپ کو اپنے پروجیکٹس میں Nano Banana 2 کی مکمل صلاحیت سے فائدہ اٹھانے میں مدد کرتی ہیں۔

Python
JavaScript
Curl

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Python Code Example

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

JavaScript Code Example

import fs from "fs";
import path from "path";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3.1-flash-image-preview";

const prompt =
  "A woman leaning on a wooden railing of a traditional Chinese building. " +
  "She is wearing a blue cheongsam with pink and red floral motifs and a headdress " +
  "made of colorful flowers, including roses and lilacs. Realistic painting style, " +
  "focusing on the textural details of the clothing patterns and wooden buildings.";

const response = await fetch(`${base_url}/models/${model}:generateContent`, {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    Authorization: api_key,
  },
  body: JSON.stringify({
    contents: [
      {
        role: "user",
        parts: [{ text: prompt }],
      },
    ],
    generationConfig: {
      responseModalities: ["IMAGE"],
      imageConfig: {
        aspectRatio: "9:16",
      },
    },
  }),
});

const data = await response.json();

const outputDir = "./output";
if (!fs.existsSync(outputDir)) {
  fs.mkdirSync(outputDir, { recursive: true });
}

for (const candidate of data.candidates) {
  for (const part of candidate.content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageBuffer = Buffer.from(part.inlineData.data, "base64");
      const outputPath = path.join(outputDir, "gemini-3.1-flash-image-preview.png");
      fs.writeFileSync(outputPath, imageBuffer);
      console.log(`Image saved to ${outputPath}`);
    }
  }
}

Curl Code Example

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

Nano Banana 2 کے ورژن

Nano Banana 2 کے متعدد سنیپ شاٹس کی وجوہات میں ممکنہ عوامل شامل ہوسکتے ہیں جیسے اپ ڈیٹس کے بعد آؤٹ پٹ میں تبدیلیاں جس کی وجہ سے مستقل مزاجی کے لیے پرانے سنیپ شاٹس کی ضرورت ہوتی ہے، ڈویلپرز کو ایڈاپٹیشن اور مائیگریشن کے لیے منتقلی کا وقت فراہم کرنا، اور عالمی یا علاقائی اینڈ پوائنٹس کے مطابق مختلف سنیپ شاٹس کا ہونا تاکہ صارف کے تجربے کو بہتر بنایا جاسکے۔ ورژنز کے درمیان تفصیلی فرق کے لیے براہ کرم سرکاری دستاویزات کا حوالہ دیں۔

ماڈل ID	تفصیل	دستیابی	درخواست
gemini-3.1-flash-image	سفارش کردہ، تازہ ترین ماڈل کی طرف اشارہ کرتا ہے	✅	Gemini تصویر تیار کرتا ہے
gemini-3.1-flash-image-preview	سرکاری پیش نظارہ	✅	Gemini تصویر تیار کرتا ہے