Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

ان پٹ:$1.5616/M
آؤٹ پٹ:$9.3696/M
Nano Banana Pro ایک AI ماڈل ہے جو متن مرکوز ورک فلو میں عمومی نوعیت کی معاونت کے لیے بنایا گیا ہے۔ یہ ہدایتی طرز کی پرامپٹنگ کے ذریعے قابلِ کنٹرول ساخت کے ساتھ مواد کی تخلیق، تبدیلی اور تجزیہ کے لیے موزوں ہے۔ عمومی استعمالات میں چیٹ اسسٹنٹس، دستاویزات کا خلاصہ، علمی سوال و جواب (QA)، اور ورک فلو آٹومیشن شامل ہیں۔ عوامی تکنیکی تفصیلات محدود ہیں؛ انضمام عام AI اسسٹنٹ پیٹرنز کے مطابق ہے، جیسے ساختہ آؤٹ پٹس، بازیافت سے تقویت یافتہ پرامپٹس، اور ٹول یا فنکشن کالنگ۔
نیا
تجارتی استعمال
Playground
خلاصہ
خصوصیات
قیمت
API
ورژن

بنیادی خصوصیات

  • Text → Image: مکمل پرامپٹ پر مبنی جنریشن، جس میں پرامپٹ کی ہدایات کی مضبوط پابندی ہو۔
  • Image → Image (edits): باریک اور ہدف شدہ ایڈیٹس، متعدد تبدیلیوں میں موضوع/کردار کی مستقل مزاجی برقرار رکھتے ہوئے۔
  • زیادہ سے زیادہ آؤٹ پٹ ریزولوشن: 4K تک (مثالیں اور سپورٹ شدہ درست پکسل سائز اسپیکٹ ریشیو پر منحصر ہیں؛ API 1K/2K/4K پری سیٹس فراہم کرتا ہے)
  • Iterative planning & self-correction: ایک اندرونی “thinking” پر مبنی “multi-stage” پائپ لائن جو عمومی بصری غلطیوں (پرِسپیکٹو، متن، باریک جیومیٹری) کی نشاندہی اور درستی کرتی ہے۔
  • Advanced in-image text rendering: واضح، قابلِ مطالعہ کثیر لسانی متن (مختصر کیپشن سے طویل پیراگراف تک) جو پوسٹرز، ماک اپس اور اِنفوگرافکس کے لیے موزوں ہے۔
  • 5 کردار اور ایک واحد ورک فلو میں زیادہ سے زیادہ 14 آبجیکٹس/حوالہ جاتی تصاویر کے لیے فیڈیلیٹی۔
  • واٹرمارکنگ / ماخذ: تمام تیار کردہ تصاویر میں SynthID واٹرمارک شامل ہوتا ہے؛ ماڈل بعض پروڈکٹ انٹیگریشنز میں ماخذ کے لیے C2PA میٹا ڈیٹا ایمبیڈ کرتا ہے۔

Gemini 3 Pro Image کی ورژنز اور نام

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

تکنیکی تفصیلات

آرکیٹیکچر

  • Lineage / backbone: Nano Banana Pro، Google کے ترقی پاتے Gemini امیج اسٹیک پر مبنی ہے — بالخصوص نئی Gemini 3 Pro Image / GEMPIX 2 آرکیٹیکچر (زیادہ گنجائش والا ملٹی موڈل امیج+ٹیکسٹ فریم ورک)۔ یہ Gemini 2.5 Flash Image (اصل “nano-banana”) سے ارتقا پا کر ایک نیٹو ملٹی موڈل امیج ماڈل بنا ہے جس میں وژن-لینگویج ریزننگ کی توسیع شدہ صلاحیتیں ہیں۔
  • Model behavior: نیٹو ملٹی موڈیلٹی (امیج + متن + عالمی علم)، ملٹی-امیج فیوژن کے لیے واضح پائپ لائنز، اور ایک داخلی مرحلہ وار پلانر جو واحد جامد نمونے کے بجائے متعدد پاسز کے ذریعے آؤٹ پٹس کو بہتر بناتا ہے۔ ابتدائی رپورٹس کے مطابق سابقہ ورژنز کے مقابلے میں جیومیٹرک/آپٹیکل ریزننگ (شیشہ، انعکاس/انکسار) زیادہ مضبوط ہے۔
  • Thinking / internal refinement: ماڈل اندرونی طور پر قابلِ مشاہدہ “thinking” عمل استعمال کرتا ہے تاکہ کمپوزیشن کو بہتر بنائے (API اس برتاؤ کو دستاویزی شکل دیتا ہے اور نوٹ کرتا ہے کہ یہ داخلی مراحل حتمی امیج ٹوکنز کے طور پر چارج نہیں ہوتے)۔
  • Grounding & tools: Search grounding کی سپورٹ (ڈایاگرام/اِنفوگرافک جنریشن میں ویب حقائق شامل کر سکتا ہے)۔ سسٹم انسٹرکشنز کی سپورٹ بھی موجود ہے تاکہ زیادہ متعین/ڈیٹرمنِسٹک کنٹرول ممکن ہو۔

اہم API پیرا میٹرز:

  • thinking_level (کم / زیادہ): تاخیر بمقابلہ استدلال کی گہرائی کے درمیان توازن کے لیے
  • media_resolution (کم/درمیانہ/زیادہ): امیج OCR/تفصیل پڑھنے والے ٹوکنز کو کنٹرول کرنے کے لیے
  • generationConfig.imageConfig: امیج آؤٹ پٹس میں اسپیکٹ ریشیو/ریزولوشن کو کنٹرول کرنے کے لیے

امیج حدود:

  • ان پٹ موڈیلٹیز کی سپورٹ: متن اور تصاویر (ماڈل امیج جنریشن ان پٹ کے طور پر آڈیو یا ویڈیو قبول نہیں کرتا)
  • ہر پرامپٹ پر زیادہ سے زیادہ تصاویر: 14 (Gemini 3 Pro Image preview کے لیے)
  • زیادہ سے زیادہ امیج سائز (اپ لوڈ): فی ان پٹ امیج 7 MB
  • سپورٹڈ اسپیکٹ ریشیوز: 1:1, 3:2, 16:9, 9:16, 21:9, وغیرہ
  • آؤٹ پٹ امیجز / ٹوکنز: بلند حدود، 4K/4096px کی سپورٹ کے ساتھ

بینچ مارک کارکردگی

مختصر خلاصہ: عوامی/ابتدائی بینچ مارکس فی الحال زیادہ تر کیفیاتی/کمیونٹی بنیاد پر ہیں، مگر مسلسل طور پر ریزولوشن، آرٹیفیکٹ میں کمی، اور جسمانی وفاداری میں اصل nano-banana (Gemini 2.5 Flash Image) کے مقابلے واضح بہتری رپورٹ کرتے ہیں۔ مخصوص نامی “چیلنجز” میں واضح بصری بہتری نظر آئی ہے، البتہ Google کی طرف سے v1 → v2 کے موازنہ پر معیاری عددی ٹیبلز (public) ابھی دستیاب نہیں۔

  • کیفیاتی کمیونٹی ٹیسٹس: صاف کنارے، زیادہ تیکھی باریک تفصیلات، زیادہ درست رنگ، اور پرامپٹ کی زیادہ وفادار پابندی (کم خیالی/غیر ضروری اشیا، زیادہ مستقل کردار)۔ مقبول غیر رسمی ٹیسٹس میں “Wine Glass Test” اور “Glass Burger Challenge” شامل ہیں، جہاں GEMPIX2 (Nano Banana Pro) شفافیت اور انکسار کو پہلے کے بلڈز کے مقابلے نمایاں طور پر بہتر سنبھالتا ہے۔
  • متنی ہینڈلنگ: Nano Banana Pro امیجز کے اندر ٹائپوگرافی اور متن کی جگہ بندی میں واضح بہتری دکھاتا ہے (جو کئی امیج ماڈلز کی مستقل کمزوری رہی ہے)۔ کمیونٹی تقابلات کم بگڑے ہوئے رینڈرڈ حروف/حرفی اشکال کی نشاندہی کرتے ہیں۔
  • تھرو پٹ / UX: تیز تر تکراری رفتار اور ایسا UX جو بیک اینڈ پر ملٹی-اسٹیج ریفائنمنٹ انجام دیتا ہے، اس طرح صارفین کو پہلے پاس میں زیادہ قابلِ اعتماد نتائج نظر آتے ہیں (دوبارہ رَنز کی ضرورت کم ہوتی ہے)۔

حدود اور خطرات

  • کانٹینٹ فلٹرز اور ڈیٹیکشن: ماڈل کو ضم کرنے والے پلیٹ فارمز (مثلاً Whisk/تیسری پارٹی ایپس) سخت سیلیبریٹی یا شباہت ڈیٹیکشن فعال کر سکتے ہیں اور کچھ آؤٹ پٹس بلاک کر سکتے ہیں، جس سے وہ تخلیقی ورک فلو متاثر ہو سکتے ہیں جو حقیقت پسندانہ سیلیبریٹی شباہتوں پر انحصار کرتے ہیں۔
  • خیالی پن / استدلالی سرحدی کیسز: بہتری کے باوجود، ماڈل اب بھی جسمانی طور پر غیر حقیقت پسندانہ آرٹیفیکٹس پیدا کر سکتا ہے، خاص طور پر گھنے علامتی متن والی تصاویر یا انتہائی تکنیکی ڈایاگرامز میں — اگرچہ NB2 پہلے کی نسبت ان غلطیوں میں کمی دکھاتا ہے۔
  • سیفٹی اور غلط استعمال: جنریٹو امیج ماڈلز مسئلہ انگیز یا نقصان دہ مواد بنانے کے لیے استعمال ہو سکتے ہیں۔ Google پابندیاں، کانٹینٹ فلٹرز، اور SynthID واٹرمارک کے ذریعے ماخذ کی سند میں مدد دیتا ہے؛ اس کے باوجود غلط استعمال ہوا ہے (سیاسی طور پر حساس صورتحال میں Nano Banana سے تیار کردہ امیج پر ہائی پروفائل تنازع)۔

دوسرے ماڈلز کے مقابلے Nano Banana Pro کی حیثیت

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — مضبوط موبائل انٹیگریشن، ملٹی-امیج فیوژن، تکراری خود درستی، 2K نیٹو/4K اپ اسکیلنگ، Google ایپس (Search, Photos, Workspace/Gemini) میں مضبوط انضمام۔ ایسے ورک فلو کے لیے بہترین جو قابلِ اعتماد ایڈیٹس، تسلسل، اور Google سروسز کے ساتھ گہرا انٹیگریشن چاہتے ہیں۔
  • Midjourney — اسٹائلائزڈ آرٹسٹک آؤٹ پٹس اور کمیونٹی پر مبنی پرامپٹ انجینئرنگ میں ممتاز؛ فوٹو-درست ملٹی-امیج فیوژن یا گہرے ملٹی موڈل ایڈیٹنگ پائپ لائنز پر عمومی فوکس نہیں۔
  • Stable Diffusion / open weights — مکمل اوپن، حد درجہ حسبِ ضرورت، اور لوکل ہوسٹنگ قابل؛ چیک پوائنٹس اور فائن ٹیوننگ کا ایکو سسٹم تحقیق اور آف لائن استعمال کے لیے فیصلہ کن برتری ہے۔ Nano Banana Pro کے مقابلے آؤٹ آف دی باکس “ون-کلک” موبائل انٹیگریشن کم اور ملٹی-امیج ایڈیٹنگ کی مستقل مزاجی کم مسلسل۔
  • Seedream 4.0 (ByteDance) — حال ہی میں واضح طور پر Nano Banana کا مقابل قرار دیا گیا، انتہائی تیز رینڈرنگ، 2K آؤٹ پٹ، اور متعدد ریفرنس امیجز (چھ تک) کی سپورٹ پر زور۔ پیشہ ور/کریئیٹر متبادل کے طور پر پوزیشنڈ۔

(یہ تقابلات بلند سطح کے ہیں؛ اپنے ورک فلو سے میچ کر کے ٹول منتخب کریں: اوپن نیس/حسبِ ضرورت → Stable Diffusion؛ اسٹائلائزڈ آرٹ → Midjourney؛ مربوط، مسلسل موبائل ایڈیٹنگ اور جارحانہ تکرار → Nano Banana Pro/Gemini 3 Pro image فیملی۔)

حقیقی دنیا کے استعمالات

  • موبائل فوٹو ایڈیٹنگ اور کریئیٹو فلٹرز (Google Photos انٹیگریشنز — ری اسٹائلنگ، بیک گراؤنڈ فیوژن، پورٹریٹ ریکمپوزیشن)
  • مارکیٹنگ اور اشتہاری اثاثے — تیز کانسیپٹ جنریشن، متعدد فریمز/زاویوں میں مستقل برانڈ کردار
  • کانسیپٹ آرٹ اور اسٹوری بورڈنگ — ملٹی-امیج فیوژن پینلز میں کردار کے تسلسل کو برقرار رکھنے میں مدد دیتا ہے
  • ای-کامرس / پروڈکٹ ماک اپس — مختلف سیاق/روشنی میں مستقل پروڈکٹ شاٹس تیار کریں
  • AR/VR اثاثوں کی تیز پروٹو ٹائپنگ — اعلیٰ معیار کے 2K/4K آؤٹ پٹس جو امیرسیو استعمال کے لیے اپ اسکیل کیے جا سکتے ہیں
  • How to accessl gemini-3-pro-image(Nano Banana Pro) API

Required Steps

  • cometapi.com پر لاگ ان کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔
  • انٹرفیس کا ایکسس کریڈینشل API key حاصل کریں۔ Personal Center میں API ٹوکن پر “Add Token” پر کلک کریں، ٹوکن کی چابی حاصل کریں: sk-xxxxx اور جمع کریں۔
  • اس سائٹ کا url حاصل کریں: https://api.cometapi.com/

Use Method

  1. “gemini-3-pro-image” اینڈ پوائنٹ منتخب کریں، API ریکویسٹ بھیجیں اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کے API ڈاک سے حاصل کیے جائیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔
  2. <YOUR_API_KEY> کو اپنے اکاؤنٹ کے اصل CometAPI key سے تبدیل کریں۔
  3. اپنی سوال یا درخواست کو content فیلڈ میں درج کریں — ماڈل اسی پر جواب دے گا۔
  4. . تیار کردہ جواب حاصل کرنے کے لیے API ریسپانس پروسیس کریں۔

CometAPI مکمل مطابقت رکھنے والا REST API فراہم کرتا ہے — ہموار ہجرت کے لیے۔ Key details :

  • Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Model Names: gemini-3-pro-image
  • Authentication: Bearer YOUR_CometAPI_API_KEY ہیڈر
  • Content-Type: application/json .

اکثر پوچھے جانے والے سوالات

Can Gemini 3 Pro Image generate 4K resolution images?

Yes, Nano Banana Pro (Gemini 3 Pro Image) supports native output up to 4K resolution with aspect ratios including 1:1, 3:2, 16:9, 9:16, and 21:9. It also supports 1K and 2K presets via the imageConfig parameter.

How does Nano Banana Pro handle text rendering inside images?

Nano Banana Pro features advanced in-image text rendering with clear, legible multi-language text support—from short captions to long paragraphs. This makes it ideal for posters, infographics, UI mockups, and marketing assets.

Can I edit images conversationally with Gemini 3 Pro Image?

Yes, Nano Banana Pro supports multi-turn conversational editing. Simply ask for changes like 'Make the background a sunset' and the model maintains visual context through Thought Signatures between turns.

What makes Nano Banana Pro different from FLUX 2 Pro or Midjourney?

Nano Banana Pro excels at iterative self-correction, consistent character preservation across multiple edits, and tight Google ecosystem integration. It handles up to 14 reference images for complex multi-image fusion workflows.

Does Nano Banana Pro use Google Search for grounded image generation?

Yes, Nano Banana Pro can use Search grounding to verify facts before generating images. For example, it can fetch current weather data to create an accurate Tokyo weather infographic.

How many reference images can Nano Banana Pro process in one request?

Nano Banana Pro supports up to 14 input images per prompt with a maximum of 7MB per image. It maintains subject and character consistency across up to 5 characters in complex multi-image fusion scenarios.

Nano Banana Pro کے لیے خصوصیات

[ماڈل کا نام] کی اہم خصوصیات دریافت کریں، جو کارکردگی اور قابل استعمال کو بہتر بنانے کے لیے ڈیزائن کی گئی ہیں۔ جانیں کہ یہ صلاحیتیں آپ کے منصوبوں کو کیسے فائدہ پہنچا سکتی ہیں اور صارف کے تجربے کو بہتر بنا سکتی ہیں۔

Nano Banana Pro کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Nano Banana Pro کے لیے نمونہ کوڈ اور API

Nano Banana Pro کے لیے جامع نمونہ کوڈ اور API وسائل تک رسائی حاصل کریں تاکہ آپ کے انضمام کے عمل کو آسان بنایا جا سکے۔ ہماری تفصیلی دستاویزات قدم بہ قدم رہنمائی فراہم کرتی ہیں، جو آپ کو اپنے پروجیکٹس میں Nano Banana Pro کی مکمل صلاحیت سے فائدہ اٹھانے میں مدد کرتی ہیں۔
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Nano Banana Pro کے ورژن

Nano Banana Pro کے متعدد سنیپ شاٹس کی وجوہات میں ممکنہ عوامل شامل ہوسکتے ہیں جیسے اپ ڈیٹس کے بعد آؤٹ پٹ میں تبدیلیاں جس کی وجہ سے مستقل مزاجی کے لیے پرانے سنیپ شاٹس کی ضرورت ہوتی ہے، ڈویلپرز کو ایڈاپٹیشن اور مائیگریشن کے لیے منتقلی کا وقت فراہم کرنا، اور عالمی یا علاقائی اینڈ پوائنٹس کے مطابق مختلف سنیپ شاٹس کا ہونا تاکہ صارف کے تجربے کو بہتر بنایا جاسکے۔ ورژنز کے درمیان تفصیلی فرق کے لیے براہ کرم سرکاری دستاویزات کا حوالہ دیں۔
ماڈل IDتفصیلدستیابیدرخواست
nano-banana-pro-allاستعمال کی گئی ٹیکنالوجی غیر سرکاری ہے اور جنریشن غیر مستحکم ہے وغیرہ، Chat فارمیٹ✅Chat فارمیٹ
gemini-3-pro-imageسفارش کردہ، تازہ ترین ماڈل کی طرف اشارہ کرتا ہے✅Gemini تصویر تیار کرتا ہے
gemini-3-pro-image-previewسرکاری پیش نظارہ✅Gemini تصویر تیار کرتا ہے

مزید ماڈلز