Nano Banana Pro(Gemini 3 Pro Image) API کا استعمال کیسے کریں؟

CometAPI
AnnaDec 10, 2025
Nano Banana Pro(Gemini 3 Pro Image) API کا استعمال کیسے کریں؟

نینو کیلے پرو - سرکاری طور پر جیمنی 3 پرو امیج — گوگل/ڈیپ مائنڈ کا نیا اسٹوڈیو گریڈ امیج جنریشن اور ایڈیٹنگ ماڈل ہے جو جدید ملٹی موڈل ریجننگ، ہائی فیڈیلیٹی ٹیکسٹ رینڈرنگ، ملٹی امیج کمپوزیشن، اور اسٹوڈیو لیول کے تخلیقی کنٹرولز کو یکجا کرتا ہے۔

نینو کیلے پرو کیا ہے اور آپ کو اس کی پرواہ کیوں کرنی چاہئے؟

Nano Banana Pro گوگل کا تازہ ترین امیج جنریشن اور امیج ایڈیٹنگ ماڈل ہے — "جیمنی 3 پرو امیج" ریلیز — جسے 4K تک اسٹوڈیو کوالٹی کے ساتھ اعلیٰ مخلص، سیاق و سباق سے آگاہ تصاویر اور آن امیج ٹیکسٹ تیار کرنے کے لیے ڈیزائن کیا گیا ہے۔ یہ پہلے کے نانو کیلے ماڈلز (جیمنی 2.5 فلیش امیج / "نانو کیلے") کا جانشین ہے جس میں بہتر استدلال، سرچ گراؤنڈنگ (حقیقی دنیا کے حقائق)، مضبوط ٹیکسٹ رینڈرنگ، اور زیادہ طاقتور مقامی ترمیمی کنٹرولز ہیں۔ یہ ماڈل متعامل صارفین کے لیے Gemini ایپ کے اندر دستیاب ہے اور معیاری Gemini API کے ذریعے Nano Banana Pro تک رسائی حاصل کرتا ہے، لیکن آپ مخصوص ماڈل شناخت کنندہ (gemini-3-pro-image-preview یا اس کا مستحکم جانشین)۔ پروگرامی رسائی کے لیے۔

یہ کیوں اہمیت رکھتا ہے: نینو کیلے پرو نہ صرف خوبصورت تصاویر بنانے کے لیے بنایا گیا ہے بلکہ اس کے لیے بنایا گیا ہے۔ معلومات کا تصور کریں — انفوگرافکس، ڈیٹا سے چلنے والے اسنیپ شاٹس (موسم، کھیل)، ٹیکسٹ ہیوی پوسٹرز، پروڈکٹ موک اپس اور ملٹی امیج فیوژن (14 ان پٹ امیجز تک اور 5 لوگوں تک کردار کی مستقل مزاجی کو برقرار رکھنا)۔ ڈیزائنرز، پروڈکٹ ٹیموں اور ڈویلپرز کے لیے، درستگی، آن امیج ٹیکسٹ اور پروگرامیٹک رسائی کا مجموعہ پروڈکشن ورک فلو کو کھولتا ہے جو پہلے خود کار کرنا مشکل تھا۔

API کے ذریعے کون سے افعال سامنے آتے ہیں؟

ڈویلپرز کے سامنے عام API کی صلاحیتوں میں شامل ہیں:

  • متن → امیج جنریشن (سنگل سٹیپ یا ملٹی سٹیپ "سوچ" کمپوزیشن بہتی ہے)۔
  • تصویری ترمیم (مقامی ماسک، پینٹنگ، اسٹائل ایڈجسٹمنٹ)۔
  • ملٹی امیج فیوژن (حوالہ کی تصاویر کو یکجا کریں)۔
  • اعلی درجے کی درخواست کے کنٹرول: ریزولوشن، اسپیکٹ ریشو، پوسٹ پروسیسنگ کے مراحل، اور پیش نظارہ موڈز میں ڈیبگ/انسپیکٹیبلٹی کے لیے "کمپوزیشن سوچ" کے نشانات۔

نینو کیلے پرو کی بنیادی اختراعات اور افعال

ذہین مواد کی استدلال

پیچیدہ، کثیر قدمی بصری ہدایات کی تشریح کے لیے Gemini 3 Pro کے استدلال کے اسٹیک کا استعمال کرتا ہے (مثال کے طور پر، "اس ڈیٹاسیٹ سے 5 قدمی انفوگرافک بنائیں اور ایک دو لسانی کیپشن شامل کریں")۔ API ایک "سوچنے" کے طریقہ کار کو بے نقاب کرتا ہے جو حتمی آؤٹ پٹ کو بہتر بنانے کے لیے عبوری کمپوزیشن ٹیسٹ تیار کر سکتا ہے۔

یہ معاملہ کیوں ہے: ایک واحد پاس کے بجائے جو نقشہ پرامپٹ → پکسل کرتا ہے، ماڈل ایک اندرونی "سوچ" کا عمل انجام دیتا ہے جو ساخت کو بہتر بناتا ہے اور حقائق پر مبنی بنیادوں کے لیے بیرونی ٹولز (مثلاً، گوگل سرچ) کو کال کر سکتا ہے (مثلاً درست ڈایاگرام لیبلز یا لوکل درست اشارے)۔ اس سے ایسی تصاویر حاصل ہوتی ہیں جو نہ صرف خوبصورت ہیں بلکہ انفوگرافکس، ڈائیگرامس، یا پروڈکٹ موک اپس جیسے کاموں کے لیے زیادہ درست ہیں۔

حاصل کرنے کا طریقہ: نینو کیلے پرو کا "تھنکنگ" ایک کنٹرول شدہ اندرونی استدلال/کمپوزیشن پاس ہے جہاں ماڈل حتمی تصویر تیار کرنے سے پہلے انٹرمیڈیٹ ویژول اور استدلال کے نشانات تیار کرتا ہے۔ API یہ ظاہر کرتا ہے کہ ماڈل دو عبوری فریم بنا سکتا ہے اور حتمی تصویر اس سلسلہ کا آخری مرحلہ ہے۔ پیداوار میں یہ ساخت، متن کی جگہ کا تعین، اور ترتیب کے فیصلوں میں مدد کرتا ہے۔

زیادہ درست ٹیکسٹ رینڈرنگ

تصاویر کے اندر واضح، مقامی متن کو نمایاں طور پر بہتر کیا گیا ہے (مینوز، پوسٹرز، ڈایاگرام)۔ نانو کیلے پرو تصویری متن کی رینڈرنگ میں نئی ​​بلندیوں تک پہنچتا ہے:

  • تصاویر میں متن واضح، قابل فہم اور درست ہجے ہے؛
  • کثیر لسانی نسل کی حمایت کرتا ہے (بشمول چینی، جاپانی، کورین، عربی وغیرہ)؛
  • صارفین کو طویل پیراگراف یا کثیر لائن وضاحتی متن براہ راست تصاویر میں لکھنے کی اجازت دیتا ہے۔
  • خودکار ترجمہ اور لوکلائزیشن دستیاب ہے۔

یہ معاملہ کیوں ہے: روایتی طور پر تصویری ماڈل پڑھنے کے قابل، اچھی طرح سے منسلک متن پیش کرنے کے لیے جدوجہد کرتے ہیں۔ Nano Banana Pro کو واضح طور پر قابل اعتماد ٹیکسٹ رینڈرنگ اور لوکلائزیشن کے لیے بہتر بنایا گیا ہے (مثلاً، ترجمہ اور ترتیب کو محفوظ کرنا)، جو پوسٹرز، پیکیجنگ، یا کثیر زبانی اشتہارات جیسے حقیقی تخلیقی استعمال کے معاملات کو کھولتا ہے۔

حاصل کرنے کا طریقہ: ٹیکسٹ رینڈرنگ میں بہتری بنیادی ملٹی موڈل آرکیٹیکچر اور ڈیٹا سیٹس کی تربیت سے آتی ہے جس میں ٹیکسٹ ان امیج مثالوں پر زور دیا جاتا ہے، ہدف شدہ تشخیصی سیٹوں (انسانی تشخیص اور رجعت کے سیٹ) کے ساتھ مل کر۔ ماڈل تصاویر کے اندر واضح، مقامی متن تیار کرنے کے لیے گلیف کی شکلوں، فونٹس اور ترتیب کی رکاوٹوں کو سیدھ میں لانا سیکھتا ہے — حالانکہ چھوٹا متن اور انتہائی گھنے پیراگراف اب بھی غلطی کا شکار ہو سکتے ہیں۔

مضبوط بصری مستقل مزاجی اور وفاداری۔

اسٹوڈیو کنٹرولز (لائٹنگ، فوکس، کیمرہ اینگل، کلر گریڈنگ) اور ملٹی امیج کمپوزیشن (14 ریفرنس امیجز تک، متعدد انسانی مضامین کے لیے خصوصی الاؤنسز کے ساتھ) کردار کی مستقل مزاجی (ترمیم میں ایک ہی شخص/کردار کو برقرار رکھنے) اور تیار کردہ اثاثوں میں برانڈ کی شناخت کو برقرار رکھنے میں مدد کرتے ہیں۔ ماڈل مقامی 1K/2K/4K آؤٹ پٹ کو سپورٹ کرتا ہے۔

یہ معاملہ کیوں ہے: مارکیٹنگ اور تفریحی کام کے بہاؤ کو شاٹس اور ترمیمات میں مستقل کرداروں کی ضرورت ہوتی ہے۔ ماڈل تک کے لیے مشابہت برقرار رکھ سکتا ہے۔ پانچ لوگوں اور تک گھل مل جاتے ہیں۔ 14 Sketch → 3D Render تیار کرتے ہوئے تصاویر کو ایک ہی کمپوزیشن میں حوالہ دیں۔ یہ اشتہار تخلیقی، پیکیجنگ، یا ملٹی شاٹ کہانی سنانے کے لیے مفید ہے۔

حاصل کرنے کا طریقہ: ماڈل ان پٹ واضح رول اسائنمنٹس کے ساتھ متعدد تصاویر کو قبول کرتے ہیں (مثال کے طور پر، "تصویر A: پوز"، "تصویر B: چہرے کا حوالہ"، "تصویر C: پس منظر کی ساخت")۔ تبدیلیوں (روشنی، کیمرہ) کو لاگو کرتے ہوئے شناخت/پوز/اسٹائل کو برقرار رکھنے کے لیے ان تصاویر پر فن تعمیر کے حالات پیدا ہوتے ہیں۔

نینو کیلے پرو کے کارکردگی کے معیارات

نینو کیلے پرو (جیمنی 3 پرو امیج) "ٹیکسٹ → امیج AI بینچ مارکس پر سبقت رکھتا ہے" اور یہ کہ یہ نینو کیلے کے پہلے ماڈلز کے مقابلے بہتر استدلال اور سیاق و سباق کی بنیاد کو ظاہر کرتا ہے۔ یہ پچھلی ریلیز کے مقابلے میں اعلی مخلص اور بہتر ٹیکسٹ رینڈرنگ پر زور دیتا ہے۔

Nano Banana Pro(Gemini 3 Pro Image) API کا استعمال کیسے کریں؟

عملی کارکردگی کی رہنمائی

امید ہے زیادہ تاخیر اور رفتار کے لیے 1K یا "فلیش" ماڈلز کے مقابلے میں 2K/4K ہائی فیڈیلیٹی رینڈرز کی قیمت۔ اگر تھرو پٹ/لیٹنسی اہم ہے، تو ہائی والیوم کے لیے فلیش ویرینٹ (مثال کے طور پر جیمنی 2.5 فلیش/نینو کیلا) استعمال کریں۔ کوالٹی اور پیچیدہ استدلال کے کاموں کے لیے Nano Banana Pro/gemini-3-pro-image کا استعمال کریں۔

ڈویلپرز نینو کیلے پرو تک کیسے رسائی حاصل کر سکتے ہیں؟

کون سے اینڈ پوائنٹس اور ماڈلز کو چننا ہے۔

ماڈل شناخت کنندہ (پیش نظارہ / پرو): gemini-3-pro-image-preview (پیش نظارہ) - جب آپ نینو کیلے پرو کی صلاحیتیں چاہتے ہیں تو اسے استعمال کریں۔ تیز، کم لاگت والے کام کے لیے، gemini-2.5-flash-image (نینو کیلا) دستیاب رہتا ہے۔

استعمال کرنے کے لیے سطحیں۔

  • Gemini API (جنریٹیو لینگویج اینڈ پوائنٹ): آپ xx تک رسائی کے لیے CometAPI کلید استعمال کر سکتے ہیں۔ CometAPI وہی API آفیشل ویب سائٹ کے مقابلے زیادہ سازگار قیمت پر پیش کرتا ہے۔ براہ راست HTTP / SDK کو کال کرتا ہے۔ generateContent تصویر بنانے کے لیے (ذیل میں مثالیں)۔
  • گوگل اے آئی اسٹوڈیو: تیزی سے تجربہ کرنے اور ڈیمو ایپس کو ریمکس کرنے کے لیے ویب سطح۔
  • Vertex AI (انٹرپرائز): بڑے پیمانے پر پیداوار کے لیے فراہم کردہ تھرو پٹ، بلنگ کے انتخاب (ادائیگی کے طور پر / انٹرپرائز درجے)، اور حفاظتی فلٹرز۔ بڑی پائپ لائنوں یا بیچ رینڈرنگ جابز میں ضم کرتے وقت ورٹیکس کا استعمال کریں۔

مفت درجے میں استعمال کی ایک محدود حد ہے۔ حد سے تجاوز کرنا نینو کیلے میں واپس آجائے گا۔ پلس/پرو/الٹرا ٹائرز زیادہ حدیں اور واٹر مارک سے پاک آؤٹ پٹ پیش کرتے ہیں، لیکن الٹرا کو فلو ویڈیو ٹولز اور 4K موڈ میں Antigravity IDE میں استعمال کیا جا سکتا ہے۔

میں Nano Banana Pro (مرحلہ بہ قدم) کے ساتھ تصویر کیسے بنا سکتا ہوں؟

1) فوری انٹرایکٹو نسخہ آپ جیمنی ایپ استعمال کریں۔

  1. جیمنی → ٹولز → کھولیں۔ تصاویر بنائیں.
  2. منتخب کریں سوچنا (نینو کیلے پرو) ماڈل کے طور پر.
  3. ایک پرامپٹ درج کریں: موضوع، ایکشن، موڈ، لائٹنگ، کیمرہ، پہلو تناسب، اور تصویر پر ظاہر ہونے والے کسی بھی متن کی وضاحت کریں۔ مثال:
    "روبوٹکس ورکشاپ کا 4K پوسٹر بنائیں: ایک میز کے ارد گرد ایک متنوع ٹیم، بلیو پرنٹ اوورلے، بولڈ ہیڈ لائن 'روبوٹس ان ایکشن' سانز سیرف میں، گرم ٹنگسٹن لائٹ، فیلڈ کی اتلی گہرائی، سنیما 16:9۔"
  4. (اختیاری) فیوز کرنے یا حوالہ جات کے طور پر استعمال کرنے کے لیے 14 تصاویر تک اپ لوڈ کریں۔ لوکل ایڈیٹ ایریاز کے لیے سلیکشن/ماسک ٹول کا استعمال کریں۔
  5. تخلیق کریں، فطری زبان کے ساتھ اعادہ کریں (مثال کے طور پر، "ہیڈ لائن کو نیلا بنائیں اور سب سے اوپر مرکز میں منسلک کریں؛ بلیو پرنٹ پر کنٹراسٹ بڑھائیں")، پھر برآمد کریں

2) جیمنی امیج اینڈ پوائنٹ پر بھیجنے کے لیے HTTP استعمال کریں۔

کلید حاصل کرنے کے لیے آپ کو CometAPI میں لاگ ان کرنے کی ضرورت ہے۔

# save your API key to $CometAPI_API_KEY securely before running

curl -s -X POST \
  "https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "role": "user",
      "parts": [{
        "text": "Photorealistic 4K image of a yellow banana floating over Earth, studio lighting, cinematic composition. Add bold text overlay: \"Nano Banana Pro\" in top right corner."
      }]
    }],
    "generationConfig": {
      "imageConfig": {
        "resolution": "4096x4096",
        "aspectRatio": "1:1"
      }
    }
  }' \
  | jq -r '.candidates.content.parts[] | select(.inlineData) | .inlineData.data' \
  | base64 --decode > nano_banana_pro_4k.png

یہ نمونہ بیس 64 امیج پے لوڈ کو PNG فائل میں لکھتا ہے۔ دی generationConfig.imageConfig.resolution پیرامیٹر 4K آؤٹ پٹ کی درخواست کرتا ہے (3 پرو امیج ماڈل کے لیے دستیاب ہے)

3) براہ راست SDK کالز generateContent تصویر بنانے کے لیے

Google SDK کو انسٹال کرنے اور Google کی توثیق حاصل کرنے کی ضرورت ہے۔ ازگر کی مثال (ٹیکسٹ + ریفرنس امیجز + گراؤنڈنگ):

# pip install google-genai pillow

from google import genai
from PIL import Image
import base64

client = genai.Client()  # reads credentials from env / config per SDK docs

# Read a reference image and set inline_data

with open("ref1.png", "rb") as f:
    ref1_b64 = base64.b64encode(f.read()).decode("utf-8")

prompt_parts = [
    {"text": "Create a styled product ad for a yellow banana-based energy bar. Use studio lighting, shallow DOF. Include a product label with the brand name 'Nano Bar'."},
    {"inline_data": {"mime_type": "image/png", "data": ref1_b64}}
]

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,
    generation_config={
        "imageConfig": {"resolution":"4096x4096", "aspectRatio":"4:3"},
        # tools can be provided to ground facts, e.g. "google_search"

        "tools": 
    }
)

for part in response.candidates.content.parts:
    if part.inline_data:
        image = part.as_image()
        image.save("product_ad.png")

یہ مثال ایک ان لائن ریفرنس امیج کو اپ لوڈ کرنا اور فعال کرتے وقت 4K کمپوزیشن کی درخواست کرتی ہے۔ google_search ایک آلے کے طور پر. Python SDK کم درجے کی REST تفصیلات کو سنبھالے گا۔

ملٹی امیج فیوژن اور کردار کی مستقل مزاجی

ایک ایسا مرکب تیار کرنے کے لیے جو ایک ہی شخص کو تمام مناظر میں محفوظ رکھتا ہو، پاس کریں۔ ایک سے زیادہ inline_data حصے (آپ کے فوٹو سیٹ سے منتخب کردہ)، اور تخلیقی ہدایات کی وضاحت کریں کہ ماڈل کو "آؤٹ پٹس میں شناخت کو محفوظ رکھنا چاہیے۔"

مختصر عملی مثال — ایک حقیقی فوری اور متوقع بہاؤ

فوری طور پر:
"Generate a 2K infographic: 'Q4 Sales by Region 2025' — stacked bar chart with North America 35%, EMEA 28%, APAC 25%, LATAM 12%. Include title top-center, caption with source bottom-right, clean sans-serif labels, neutral palette, vector look, 16:9."

متوقع پائپ لائن: ایپ → پرامپٹ ٹیمپلیٹ + CSV ڈیٹا → پلیس ہولڈرز کو پرامپٹ میں تبدیل کریں → API کال کے ساتھ image_size=2048x1152 → بیس64 پی این جی وصول کریں → اثاثہ محفوظ کریں + پرووینس میٹا ڈیٹا → اگر ضرورت ہو تو کمپوزیٹر کے ذریعے اختیاری طور پر عین مطابق فونٹ کو اوورلے کریں۔

مجھے پروڈکشن پائپ لائن کس طرح ڈیزائن کرنی چاہیے اور حفاظت/پیداوار کو کیسے سنبھالنا چاہیے؟

تجویز کردہ پروڈکشن فن تعمیر

  1. پرامپٹ + ڈرافٹ پاس (تیز ماڈل): استعمال gemini-2.5-flash-image (نینو کیلا) سستے میں بہت سے چھوٹے ریزولوشن مختلف حالتوں کو تیار کرنے کے لئے۔
  2. انتخاب اور تطہیر: بہترین امیدواروں کا انتخاب کریں، اشارے کو بہتر کریں، درستگی کے لیے پینٹنگ/ماسک ایڈیٹس کا اطلاق کریں۔
  3. اعلی مخلص حتمی رینڈر: فون gemini-3-pro-image-preview (Nano Banana Pro) فائنل 2K/4K رینڈرز اور پوسٹ پروسیسنگ (اپ سیمپلنگ، کلر گریڈ) کے لیے۔
  4. پرووننس اور میٹا ڈیٹا: اپنے اثاثہ میٹا ڈیٹا اسٹور میں پرامپٹ، ماڈل ورژن، ٹائم اسٹیمپ، اور SynthID معلومات کو اسٹور کریں — ماڈل ایک SynthID واٹر مارک منسلک کرتا ہے اور تعمیل اور مواد کے آڈٹ کے لیے آؤٹ پٹس کا پتہ لگایا جا سکتا ہے۔

حفاظت، حقوق، اور اعتدال

  • کاپی رائٹ اور حقوق کی منظوری: حقوق کی خلاف ورزی کرنے والا مواد اپ لوڈ یا تخلیق نہ کریں۔ صارف کی فراہم کردہ تصاویر یا اشارے کے لیے واضح صارف کی تصدیقات کا استعمال کریں جو قابل شناخت مشابہت پیدا کر سکیں۔ گوگل کی ممنوعہ استعمال کی پالیسی اور ماڈل سیفٹی فلٹرز کا احترام کیا جانا چاہیے۔
  • فلٹرنگ اور خودکار جانچ: ڈاون اسٹریم استعمال یا عوامی ڈسپلے سے پہلے ایک اندرونی مواد کی اعتدال پسندی پائپ لائن (NSFW، نفرت کی علامتیں، سیاسی/ پابند مواد کا پتہ لگانے) کے ذریعے تیار کردہ تصاویر کو چلائیں۔

میں امیج ایڈیٹنگ (ان پینٹنگ)، ملٹی امیج کمپوزیشن اور ٹیکسٹ رینڈرنگ کیسے کروں؟

Nano Banana Pro ملٹی موڈل ایڈیٹنگ ورک فلو کو سپورٹ کرتا ہے: ایک یا زیادہ ان پٹ امیجز فراہم کریں اور ترمیمات کو بیان کرنے والی ایک متنی ہدایات فراہم کریں (کسی چیز کو ہٹائیں، آسمان کو تبدیل کریں، متن شامل کریں)۔ API اسی درخواست میں تصویر + متن کو قبول کرتا ہے۔ ماڈل ردعمل کے طور پر انٹرلیوڈ ٹیکسٹ اور تصاویر تیار کر سکتا ہے۔ مثال کے نمونوں میں نقاب پوش ایڈیٹس اور ملٹی امیج بلینڈز (اسٹائل ٹرانسفر / کمپوزیشن) شامل ہیں۔ کے لیے دستاویزات دیکھیں contents ٹیکسٹ بلابز اور بائنری امیجز کو ملانے والی صفیں۔

مثال: ترمیم کریں (Python pseudo-flow)

from google import genai
from PIL import Image

client = genai.Client()

prompt = "Remove the person on the left and add a small red 'Nano Banana Pro' sticker on the top-right of the speaker"

# contents can include Image objects or binary data per SDK; see doc for exact call

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,  # order matters: image + instruction

)
# Save result as before

یہ مکالماتی ترمیم آپ کو بار بار نتائج کو ایڈجسٹ کرنے دیتی ہے جب تک کہ آپ پیداوار کے لیے تیار اثاثہ تک پہنچ جائیں۔

Node.js مثال — ماسک اور متعدد حوالوں کے ساتھ تصویری ترمیم

// npm install google-auth-library node-fetch
const { GoogleAuth } = require('google-auth-library');
const fetch = require('node-fetch');

const auth = new GoogleAuth({ scopes:  });
async function runEdit() {
  const client = await auth.getClient();
  const token = await client.getAccessToken();
  const API_URL = "https://api.generativemodels.googleapis.com/v1alpha/gemini:editImage";
  const MODEL = "gemini-3-pro-image";

  // Attach binary image content or URLs depending on API.
  const payload = {
    model: MODEL,
    prompt: { text: "Replace background with an indoor studio set, keep subject, add rim light." },
    inputs: {
      referenceImages: [
        { uri: "gs://my-bucket/photo_subject.jpg" },
        { uri: "gs://my-bucket/target_studio.jpg" }
      ],
      mask: { uri: "gs://my-bucket/mask.png" },
      imageConfig: { resolution: "2048x2048", format: "png" }
    },
    options: { preserveIdentity: true }
  };

  const res = await fetch(API_URL, {
    method: 'POST',
    headers: {
      'Authorization': `Bearer ${token.token}`,
      'Content-Type': 'application/json'
    },
    body: JSON.stringify(payload)
  });
  const out = await res.json();
  console.log(JSON.stringify(out, null, 2));
}
runEdit();

(APIs کبھی کبھی Cloud Storage URIs یا base64 امیج پے لوڈز کو قبول کرتے ہیں؛ عین مطابق ان پٹ فارمیٹس کے لیے Gemini API دستاویزات کو چیک کریں۔)

CometAPI کا استعمال کرتے ہوئے تصاویر بنانے اور ان میں ترمیم کرنے کے بارے میں معلومات کے لیے، براہ کرم ملاحظہ کریں۔ جیمنی 3 پرو امیج کو کال کرنے کے لیے گائیڈ .

نتیجہ

Nano Banana Pro (جیمنی 3 پرو امیج) امیج جنریشن میں پروڈکشن گریڈ جمپ ہے: ڈیٹا کو دیکھنے، لوکلائزڈ ایڈیٹس تیار کرنے، اور ڈویلپر کے ورک فلو کو طاقتور بنانے کا ایک ٹول۔ تیز پروٹو ٹائپنگ کے لیے Gemini ایپ کا استعمال کریں، پروڈکشن انضمام کے لیے API، اور لاگت کو کنٹرول کرنے، حفاظت کو یقینی بنانے اور برانڈ کے معیار کو برقرار رکھنے کے لیے اوپر دی گئی سفارشات پر عمل کریں۔ شفافیت اور آڈٹ کی ضروریات کو پورا کرنے کے لیے ہمیشہ حقیقی صارف کے ورک فلو کی جانچ کریں اور پرووینس میٹا ڈیٹا کو اسٹور کریں۔

جب آپ کو ضرورت ہو نینو کیلے پرو کا استعمال کریں۔ سٹوڈیو معیار اثاثے، ساخت پر درست کنٹرول، تصاویر کے اندر متن کی بہتر رینڈرنگ، اور متعدد حوالوں کو ایک مربوط آؤٹ پٹ میں فیوز کرنے کی صلاحیت۔

ڈویلپرز رسائی حاصل کر سکتے ہیں۔ جیمنی 3 پرو امیج (نینو کیلے پرو) API CometAPI کے ذریعے۔ شروع کرنے کے لیے، کے ماڈل کی صلاحیتوں کو دریافت کریں۔CometAPI میں کھیل کے میدان اور تفصیلی ہدایات کے لیے API گائیڈ سے رجوع کریں۔ رسائی کرنے سے پہلے، براہ کرم یقینی بنائیں کہ آپ نے CometAPI میں لاگ ان کیا ہے اور API کلید حاصل کر لی ہے۔ ٹی ٹی کامeٹی اے پی آئی آپ کو انضمام میں مدد کے لیے سرکاری قیمت سے کہیں کم قیمت پیش کریں۔

جانے کے لیے تیار ہیں؟→ CometAPI کے لیے آج ہی سائن اپ کریں۔ !

اگر آپ AI پر مزید ٹپس، گائیڈز اور خبریں جاننا چاہتے ہیں تو ہمیں فالو کریں۔ VKX اور Discord!

SHARE THIS BLOG

مزید پڑھیں

500+ ماڈلز ایک API میں

20% تک چھوٹ