Nano Banana گوگل کے لیے کمیونٹی عرفیت (اور اندرونی شارٹ ہینڈ) ہے۔ جیمنی 2.5 فلیش امیج — ایک اعلیٰ معیار، کم لیٹنسی ملٹی موڈل امیج جنریشن + ایڈیٹنگ ماڈل۔ یہ طویل فارم والی گائیڈ (کوڈ، پیٹرن، تعیناتی کے مراحل، اور CometAPI مثالوں کے ساتھ) کال کے تین عملی طریقے دکھاتا ہے جو آپ پیداوار میں استعمال کر سکتے ہیں: (1) ایک OpenAI- ہم آہنگ چیٹ انٹرفیس (متن → تصویر)، (2) گوگل کا آفیشل generateContent متن → امیج انٹرفیس، اور (3) گوگل کا آفیشل generateContent امیج → بیس 64 ان پٹ/آؤٹ پٹ کا استعمال کرتے ہوئے امیج انٹرفیس۔ راستے میں آپ کو مرحلہ وار تقسیم/تعینات کا مشورہ، ماحول کا سیٹ اپ، CometAPI سے API آپریشنز کیسے حاصل کیے جائیں، قیمتوں کا تعین اور واٹر مارک نوٹ، اور قابل اعتماد، کم لاگت کے نتائج کے لیے بہترین تجاویز ملیں گی۔
نینو کیلا کیا ہے (جیمنی 2.5 فلیش امیج)؟
نینو کیلے جیمنی 2.5 فلیش امیج کو دیا جانے والا غیر رسمی نام ہے، جو جیمنی فیملی میں گوگل کا تازہ ترین تصویری ماڈل ہے۔ یہ فوٹو ریئلسٹک امیج جنریشن اور درست امیج ایڈیٹنگ دونوں کے لیے ڈیزائن کیا گیا ہے (مقامی ایڈیٹس، ملٹی امیج فیوژن، تمام ترامیم میں مستقل کردار کی حفاظت) اور یہ گوگل کے جیمنی API، گوگل اے آئی اسٹوڈیو، اور ورٹیکس اے آئی کے ذریعے دستیاب ہے۔ ماڈل بحری جہاز ایک پوشیدہ SynthID واٹر مارک کے ساتھ پرووننس کے لیے بھیجتا ہے۔
ڈویلپرز کے لیے یہ کیوں اہمیت رکھتا ہے: نینو کیلا آپ کو ایک واحد، اعلیٰ معیار کا ملٹی موڈل ماڈل فراہم کرتا ہے جو سنبھال سکتا ہے:
- متن → تصویر (ٹیکسٹ پرامپٹس سے نئی تصاویر بنائیں)
- تصویر → تصویر (ایک فراہم کردہ تصویر میں ترمیم/تبدیل)
- ملٹی امیج ملاوٹ (متعدد تصویروں کو ایک مرکب میں یکجا کریں)
یہ سب یا تو گوگل کے آفیشل کے ذریعے قابل رسائی ہے۔generateContentاینڈ پوائنٹس (Vertex AI / Gemini API) یا OpenAI-مطابقت پذیر اختتامی پوائنٹس کے ذریعے جو تیسرے فریق API گیٹ ویز جیسے CometAPI اور OpenRouter کے ذریعے پیش کیے جاتے ہیں۔ اس کا مطلب ہے کہ آپ جیمنی 2.5 فلیش امیج کو موجودہ OpenAI سے ہم آہنگ کوڈ بیس میں ضم کر سکتے ہیں یا گوگل کے آفیشل SDKs کو براہ راست کال کر سکتے ہیں۔
یہ کس چیز سے بالاتر ہے۔
- ھدف شدہ، مقامی ترمیمات (قمیض کا رنگ تبدیل کریں، اشیاء کو ہٹا دیں، پوز کو موافقت کریں)۔
- دوبارہ ترمیم میں موضوع/کردار کی مستقل مزاجی کو برقرار رکھنا۔
- متعدد امیجز کو ایک مربوط کمپوزٹ میں ملانا/ ضم کرنا۔
- بھاری تحقیقی ماڈلز کے مقابلے میں کم تاخیر اور لاگت کا موثر اندازہ (گوگل "فلیش" ماڈلز کو ہائی تھرو پٹ آپشنز کے طور پر رکھتا ہے)۔
API کے ذریعے Nano Banana کو کال کرنے کے لیے مجھے اپنا ترقیاتی ماحول کیسے ترتیب دینا چاہیے؟
ذیل میں ایک مرحلہ وار چیک لسٹ ہے جسے آپ بعد میں بیان کیے گئے تین کال طریقوں میں سے کسی کے لیے ایک بیس لائن کے طور پر دیکھ سکتے ہیں۔
پیشگی شرائط (اکاؤنٹس، کیز، کوٹہ)
- گوگل اکاؤنٹ + کلاؤڈ پروجیکٹ — اگر آپ جیمنی کو براہ راست گوگل (جیمنی API / Vertex AI) کے ذریعے کال کرنے کا ارادہ رکھتے ہیں، تو ایک Google Cloud پروجیکٹ بنائیں اور Vertex AI / Gemini APIs کو فعال کریں۔ آپ کو بلنگ اور مناسب کردار کی ضرورت ہوگی (مثال کے طور پر،
Vertex AI AdminorService Accountاستدلال کے حقوق کے ساتھ)۔ - Gemini API تک رسائی - کچھ جیمنی امیج ماڈلز پیش نظارہ/محدود دستیابی ہیں۔ آپ کو اپنے اکاؤنٹ کے لحاظ سے Google AI Studio یا Vertex AI کے ذریعے رسائی کی درخواست کرنے یا ماڈل استعمال کرنے کی ضرورت پڑ سکتی ہے۔
- CometAPI (اختیاری گیٹ وے) — اگر آپ ایک واحد وینڈر-ایگنوسٹک API کو ترجیح دیتے ہیں جو مختلف ماڈلز (بشمول جیمنی) کو پراکسی کر سکتا ہے، تو ایک API کلید حاصل کرنے کے لیے CometAPI پر سائن اپ کریں اور ان کے ماڈل کی فہرست کا جائزہ لیں (وہ Gemini 2.5 فلیش ویریئنٹس اور ایک OpenAI کے موافق اینڈ پوائنٹ کو ظاہر کرتے ہیں)۔ CometAPI ترقی کو آسان بنا سکتا ہے اور آپ کو اپنے ایپ کوڈ کو تبدیل کیے بغیر فراہم کنندگان کو تبدیل کرنے دیتا ہے۔
مقامی ٹولنگ
- زبان کے رن ٹائمز: Node.js 18+، Python 3.10+ تجویز کردہ۔
- HTTP کلائنٹ:
fetch/axiosجے ایس کے لیے؛requests/httpxازگر (یا سرکاری SDKs) کے لیے۔ - تصویری مددگار:
Pillow(Python) یاsharp(نوڈ) سائز تبدیل کرنے، فارمیٹ کی تبدیلی، اور Base64 انکوڈنگ/ڈی کوڈنگ کے لیے۔ - سلامتی: کیز کو ماحولیاتی متغیرات یا سیکرٹ والٹ میں اسٹور کریں (HashiCorp والٹ، AWS سیکرٹس مینیجر، گوگل سیکریٹ مینیجر)۔ کبھی بھی API کیز کا ارتکاب نہ کریں۔
گوگل/مطابقت پذیر SDK انسٹال کریں (اختیاری)
Google SDKs فراہم کرتا ہے اور openai لائبریری کمپیٹیبلٹی shims — آپ OpenAI کلائنٹ لائبریریوں کو Gemini کے خلاف استعمال کر سکتے ہیں چند لائنیں (بیس URL + API کلید) تبدیل کر کے، لیکن مکمل ملٹی موڈل خصوصیات کے لیے مقامی Gemini/Google کلائنٹ کی سفارش کی جاتی ہے۔ اگر CometAPI یا OpenAI سے ہم آہنگ گیٹ وے استعمال کر رہے ہیں، OpenAI کلائنٹ کا استعمال ترقی کو تیز کر سکتا ہے، مثالیں:
آفیشل گوگل روٹ (Python):
python -m venv venv && source venv/bin/activate
pip install --upgrade pip
pip install google-genai # official Google GenAI SDK
pip install Pillow requests jq # for local image handling in examples
CometAPI / OpenAI کے موافق کلائنٹ (Python):
pip install openai requests
میں نینو کیلے کے لیے کال کرنے کے تین طریقوں میں سے کیسے انتخاب کروں؟
کال کا طریقہ منتخب کرنا آپ کے فن تعمیر، تاخیر/لاگت کے تقاضوں پر منحصر ہے، اور آیا آپ Google کے آفیشل اینڈ پوائنٹ یا کسی تیسرے فریق OpenAI- موافق گیٹ وے پر انحصار کرنا چاہتے ہیں۔ تین عام نمونے ہیں:
1) OpenAI سے ہم آہنگ چیٹ انٹرفیس (متن سے تصویر)
اسے اس وقت استعمال کریں جب آپ کے پاس پہلے سے ہی OpenAI طرز کا کوڈ یا SDKs موجود ہو اور آپ کم سے کم تبدیلیوں کے ساتھ ماڈلز کو تبدیل کرنا چاہتے ہوں۔ بہت سے گیٹ ویز (CometAPI، OpenRouter) جیمنی ماڈلز کو OpenAI سے مطابقت رکھنے والی REST سطح کے نیچے ظاہر کرتے ہیں تاکہ آپ کا موجودہ chat or completions کالیں صرف ایک مختلف کے ساتھ کام کرتی ہیں۔ base_url اور ماڈل کا نام۔ اگر آپ Google Cloud auth کا نظم نہیں کرنا چاہتے ہیں تو یہ اکثر پیداوار کا تیز ترین راستہ ہوتا ہے۔
2) جیمنی اہلکار generateContent - متن سے تصویر
گوگل کا آفیشل استعمال کریں۔ generateContent کے ذریعے genai (Google) کلائنٹ یا Vertex AI اگر آپ آفیشل، مکمل طور پر تعاون یافتہ SDK اور تازہ ترین خصوصیات تک رسائی چاہتے ہیں (فائن گرینڈ جنریشن پیرامیٹرز، اسٹریمنگ، بڑے اثاثوں کے لیے فائل API)، نیز گوگل کلاؤڈ بلنگ/مانیٹرنگ۔ اس کی سفارش اس وقت کی جاتی ہے جب آپ کو پروڈکشن سپورٹ اور انٹرپرائز-گریڈ کنٹرولز کی ضرورت ہو۔
3) جیمنی اہلکار generateContent — تصویر سے تصویر (بیس 64 ان پٹ/آؤٹ پٹ)
اس کا استعمال اس وقت کریں جب آپ بائنری امیجز ان لائن (بیس 64) جمع کرائیں یا امیج ایڈیٹنگ / امیج ٹو امیج پائپ لائنز چاہتے ہوں۔ گوگل کا generateContent ان لائن (بیس 64) امیجز اور بڑے یا دوبارہ قابل استعمال اثاثوں کے لیے فائل API کو سپورٹ کرتا ہے۔ تیار کردہ/ ترمیم شدہ امیجز کے جوابات عام طور پر Base64 سٹرنگز کے طور پر واپس کیے جاتے ہیں جنہیں آپ ڈی کوڈ اور محفوظ کرتے ہیں۔ یہ سب سے زیادہ واضح ملٹی موڈل کنٹرول دیتا ہے۔
میں اوپن اے آئی سے مطابقت رکھنے والے چیٹ انٹرفیس (ٹیکسٹ ٹو امیج) کے ذریعے نینو کیلے کو کیسے کال کرسکتا ہوں؟
ایک OpenAI سے ہم آہنگ چیٹ اینڈ پوائنٹ کی ترتیب کو قبول کرتا ہے۔ {role, content} پیغامات آپ بیان کرتے ہیں کہ آپ صارف کے پیغام میں کون سی تصویر چاہتے ہیں اور گیٹ وے (CometAPI یا OpenAI-compatibility shim) اس کا ترجمہ بنیادی Gemini ماڈل کی کال میں کرتا ہے۔ اگر آپ کی ایپ پہلے سے ہی چیٹ فلو استعمال کرتی ہے یا آپ ٹیکسٹ جنریشن + امیج جنریشن کو ایک ہی تبادلے میں یکجا کرنا چاہتے ہیں تو یہ آسان ہے۔
مراحل
1.CometAPI کے لیے سائن اپ کریں اور ایک API کلید حاصل کریں۔: CometAPI پر رجسٹر ہوں، ایک پروجیکٹ بنائیں، اپنی API کلید کاپی کریں۔ CometAPI ایک سنگل کے پیچھے بہت سے ماڈلز کو بے نقاب کرتا ہے۔ base_url. ()
-
OpenAI سے مطابقت رکھنے والا کلائنٹ انسٹال کریں۔: ازگر:
pip install openaiیا نیا استعمال کریں۔openai/OpenAIبہت سے گیٹ ویز کے ذریعے استعمال ہونے والا SDK ریپر۔ -
SDK کو CometAPI کی طرف اشارہ کریں اور چیٹ کی تکمیل کے اختتامی پوائنٹ کو کال کریں۔:
curl https://api.cometapi.com/v1/chat/completions \
-H "Authorization: Bearer $COMET_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-2-5-flash-image-preview",
"stream": true,
"messages": [{"role": "user",
"content": "Generate a cute kitten sitting on a cloud, in a cartoon style"}]
}'
تبصرہ:
-
سلسلہ صحیح ہونا چاہیے؛ جواب ایک ندی کے طور پر واپس کیا جائے گا؛
-
ردعمل کا ڈھانچہ OpenAI مطابقت کے لیے CometAPI کے ذریعے لپیٹ دیا گیا ہے۔
-
جواب میں ایک Base64 امیج شامل ہے۔ ڈی کوڈ کریں اور ضرورت کے مطابق اسے کلائنٹ پر محفوظ کریں:
میں جیمنی آفیشل کا استعمال کرتے ہوئے نینو کیلے کو کیسے کال کرسکتا ہوں۔ generateContent متن سے تصویر انٹرفیس؟
گوگل فراہم کرتا ہے a Gemini Developer API (The Gemini API) اور اس کے ذریعے Gemini ماڈلز کو بھی بے نقاب کرتا ہے۔ ورٹیکس AI. جیمنی 2.5 فلیش امیج (نینو کیلے) تک پروگرامی رسائی کے لیے، آفیشل generateContent طریقہ صرف ٹیکسٹ یا ملٹی موڈل جنریشن کے لیے کیننیکل انٹری پوائنٹ ہے۔ گوگل کا استعمال کریں۔ GenAI SDK (ازگر: google-genai) یا REST اینڈ پوائنٹ کو براہ راست کال کریں۔ یہ ماڈل کے پیرامیٹرز اور طریقہ کار تک براہ راست رسائی فراہم کرتا ہے، اور گوگل کے اینڈ پوائنٹس کو کال کرتے وقت جدید خصوصیات (پرائس ایڈیٹنگ، ملٹی امیج فیوژن) استعمال کرنے کا تجویز کردہ طریقہ ہے۔
- گوگل کا استعمال کریں۔ GenAI SDK (ازگر:
google-genai)
تقسیم / کال کے مراحل (جائزہ):
- ایک API کلید حاصل کریں۔ Google AI اسٹوڈیو سے یا ایک Vertex AI سروس اکاؤنٹ (پلیٹ فارم پر منحصر) قائم کریں۔
- SDK انسٹال کریں (
pip install --upgrade google-genai) اور تصدیق کریں (API کلید یا گوگل ایپلیکیشن ڈیفالٹ اسناد)۔ - میں سے انتخاب کریں ماڈل:
gemini-2.5-flash-imageیا دستاویزات میں دکھایا گیا پیش نظارہ سلگ (بالکل سلگ GA/پیش نظارہ حالت پر منحصر ہے)۔ - کال
client.models.generate_content(...)ایک سادہ ٹیکسٹ پرامپٹ کے ساتھ (ٹیکسٹ ٹو امیج)۔ - ضابطہ ربائی کریں واپس کی گئی تصاویر (اگر Base64 واپس کی گئی ہیں) اور محفوظ کریں/اسٹور کریں۔
ازگر (آفیشل کلائنٹ) مثال — متن → تصویر:
from google import genai
from base64 import b64decode, b64encode
client = genai.Client(api_key="YOUR_GEMINI_KEY")
prompt = {
"content": "A hyperrealistic photo of a vintage motorcycle parked under neon lights at midnight",
"mime_type": "text/plain"
}
# request generateContent for image output
result = client.generate_content(
model="gemini-2-5-flash-image-preview",
prompt=prompt,
response_modalities=,
image_format="PNG",
)
# handle binary or base64 in response (depends on API mode)
(نوٹ: درست پیرامیٹر کے ناموں کے لیے آفیشل کلائنٹ API چیک کریں — اوپر کی مثالیں گوگل دستاویزات میں پیٹرن کی پیروی کریں۔)
2 کال کریں نینو بنان REST اختتامی نقطہ کے ذریعے
EST اختتامی نقطہ (متن سے تصویر کی مثال): https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent.
توثیق کے اختیارات: سپلائی ہیڈر x-goog-api-key: $CometAPI_API_KEY. (CometAPI میں ایک کلید بنائیں۔)
یہ ٹیکسٹ پرامپٹ پوسٹ کرتا ہے اور واپس آنے والی بیس 64 امیج کو محفوظ کرتا ہے۔
curl -s -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{ "text": "A photorealistic nano banana dish plated in a stylish restaurant, cinematic lighting, 3:2 aspect ratio" }
]
}]
}' \
| jq -r '.candidates.content.parts[] | select(.inline_data) | .inline_data.data' \
| base64 --decode > gemini-image.png
نوٹ: تصویر بائنری کو بیس 64 انچ کے طور پر واپس کیا گیا ہے۔
candidates.content.parts.inline_data.data. اوپر کی مثال استعمال کرتی ہے۔jqان لائن ڈیٹا لینے اور اسے ڈی کوڈ کرنے کے لیے۔ سرکاری دستاویزات اسی بہاؤ کو ظاہر کرتی ہیں۔
میں جیمنی آفیشل کا استعمال کرتے ہوئے نینو کیلے کو کیسے کال کرسکتا ہوں۔ generateContent امیج ٹو امیج انٹرفیس (بیس 64 ان/آؤٹ)؟
آپ کو امیج ٹو امیج (بیس 64 ان/آؤٹ) کب استعمال کرنا چاہیے؟
جب آپ کو ضرورت ہو تو تصویر سے تصویر کا استعمال کریں:
- موجودہ تصویر میں ترمیم کریں (پینٹنگ، اسٹائل ٹرانسفر، آبجیکٹ کی تبدیلی)۔
- متعدد سورس امیجز کو ایک کمپوزیشن میں یکجا کریں۔
- تمام ترامیم میں موضوع کی شناخت کو محفوظ رکھیں (نینو کیلے کی طاقت میں سے ایک)۔
جیمنی کا generateContent Base64 (یا فائل URIs کے طور پر) کے ذریعے ان لائن امیج ڈیٹا کو سپورٹ کرتا ہے اور Base64 سٹرنگز کے طور پر تیار کردہ یا ترمیم شدہ تصاویر واپس کرتا ہے۔ دستاویزات فراہم کرنے کے لیے واضح مثالیں دیتے ہیں۔ inline_data ساتھ mime_type اور data.
تقسیم / کال کے مراحل (تصویر سے تصویر)
- تیار ان پٹ امیجز: فائل بائٹس پڑھیں، بیس 64 انکوڈ کریں، یا SDK مددگار کے ذریعے خام بائٹس پاس کریں۔
- تعمیر a
contentsصف جہاں ایک حصہ ان لائن امیج ہے (کے ساتھmimeTypeاورdata) اور اس کے بعد کے حصوں میں متنی ترمیم کی ہدایات شامل ہیں۔ - POST کرنے کے لئے
generateContent(آفیشل SDK یا REST)۔ - وصول جواب: API بیس 64 سٹرنگز کے بطور انکوڈ شدہ تیار کردہ/ ترمیم شدہ تصاویر واپس کرتا ہے۔ ڈی کوڈ کریں اور انہیں مقامی طور پر محفوظ کریں۔
مثال — Python (GenAI SDK کے ذریعے ان لائن بائٹس کا استعمال کرتے ہوئے تصویر سے تصویر)
# pip install google-genai
from google import genai
from google.genai import types
import base64
client = genai.Client(api_key="YOUR_GOOGLE_API_KEY")
# Read local image
with open("input_photo.jpg", "rb") as f:
img_bytes = f.read()
# Using SDK helper to attach bytes as a part
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[
types.Part.from_bytes(
data=img_bytes,
mime_type="image/jpeg"
),
"Make a high-quality edit: change the subject's jacket color to teal, keep natural lighting and preserve the person's facial features."
],
)
# The returned image will typically be in response.candidates[].content.parts with base64-encoded data
# Decode and save (pseudo-access shown; check SDK response structure)
b64_out = response.candidates.content.parts.data # example path
with open("edited.jpg","wb") as out:
out.write(base64.b64decode(b64_out))
ازگر کی مثال: تصویر → ریسٹ پوائنٹ کے ذریعے بیس 64 کا استعمال کرتے ہوئے تصویر
import base64, json, requests
API_URL = "https://api.gemini.googleapis.com/v1/generateContent"
API_KEY = "YOUR_GEMINI_KEY"
# read and base64-encode image
with open("input.jpg","rb") as f:
b64 = base64.b64encode(f.read()).decode("utf-8")
payload = {
"model": "gemini-2-5-flash-image-preview",
"input": [
{"mime_type": "image/jpeg", "bytes_base64": b64},
{"mime_type": "text/plain", "text": "Remove the lamppost and make the sky golden at sunset."}
],
"response_modalities":
}
resp = requests.post(API_URL, headers={"Authorization":f"Bearer {API_KEY}", "Content-Type":"application/json"}, json=payload)
resp.raise_for_status()
data = resp.json()
# data.candidates... may contain image base64 — decode and save
out_b64 = data
with open("edited.png","wb") as out:
out.write(base64.b64decode(out_b64))
اگر آپ CometAPI ریسٹ پورٹ کا استعمال کرتے ہوئے اس تک رسائی حاصل کرنا چاہتے ہیں:
curl
--location
--request POST "https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" ^
--header "Authorization: sk-" ^
--header "User-Agent: Apifox/1.0.0 (https://apifox.com)" ^
--header "Content-Type: application/json" ^
--header "Accept: */*" ^
--header "Host: api.CometAPI.com" ^
--header "Connection: keep-alive" ^
--data-raw "{ \"contents\": } ], \"generationConfig\": { \"responseModalities\": }}"
ان لائن کے لیے: تصویر کو پڑھیں اور اسے بیس 64 انکوڈ کریں۔ بار بار استعمال کرنے یا>20MB کے لیے، فائل API کے ذریعے اپ لوڈ کریں اور فائل ہینڈل کا حوالہ دیں۔
generateContentدرست ترامیم اور ورک فلو کے لیے بہترین جس میں ان پٹ امیجز کے علاوہ متنی ترمیم کی ہدایات کی ضرورت ہوتی ہے۔
نینو کیلے کے ساتھ کام کرنے کے بہترین نکات کیا ہیں؟
فوری انجینئرنگ اور کنٹرول
- واضح ہو۔: مطلوبہ پہلو تناسب، طرز کے حوالہ جات (فنکار کے نام صرف اس صورت میں جب اجازت ہو)، کیمرہ لینس، لائٹنگ، اور کمپوزیشن شامل کریں۔ مثلاً "فوٹوریئلسٹک، 3:2، فیلڈ کی اتلی گہرائی، گولڈن آور، نیکون 50 ملی میٹر لینس۔"
- یکے بعد دیگرے ترمیم کا استعمال کریں۔: بڑے سنگل شاٹ پرامپٹس پر متعدد پاسز میں چھوٹی، مقامی ترامیم کو ترجیح دیں - یہ موضوع کی مستقل مزاجی کو محفوظ رکھتا ہے۔ نینو کیلے کی طاقت تکراری ترمیم ہے۔
تصویری حفظان صحت
- پری پروسیس ان پٹس: رنگ کی جگہ کو معمول پر لائیں، اگر پرائیویسی کی ضرورت ہو تو ایمبیڈڈ EXIF کو ہٹا دیں، ٹوکنز کو محفوظ کرنے کے لیے سمجھدار ریزولوشنز پر اسکیل کریں۔
- پوسٹ پروسیس آؤٹ پٹس: چہرے کا پتہ لگانے کو چلائیں، صارفین کو واپس آنے سے پہلے ہلکے وزن والے فلٹرز (تکیہ / تیز) کے ذریعے معمولی نمونے صاف کریں۔
حفاظت، تعمیل اور مواد کی پالیسیاں
- تصاویر کو ذخیرہ کرنے/سروس کرنے سے پہلے مواد کی خودکار حفاظتی جانچ (وژن اعتدال پسندی کے ماڈل یا بلیک لسٹ چیک) کو لاگو کریں۔
- اگر لوگوں کی تصاویر اپ لوڈ کریں، تو قابل اطلاق رازداری کے قوانین (GDPR/CCPA) پر عمل کریں اور ضروری رضامندی حاصل کریں۔
- کاپی رائٹ والے کرداروں یا موجودہ آرٹ ورکس کے لیے اشارہ کرتے وقت ماڈل کے استعمال کی پالیسیوں اور کاپی رائٹ کے قوانین کا احترام کریں۔
اختتامی نوٹ
نینو کیلا (جیمنی 2.5 فلیش امیج) ملٹی موڈل امیج جنریشن اور ایڈیٹنگ کے لیے ایک عملی، اعلی فیڈیلیٹی قدم کی نمائندگی کرتا ہے: یہ تمام ترامیم میں مستقل مزاجی اور زیادہ ملٹی موڈل استدلال کے لیے ڈیزائن کیا گیا ہے۔ نانو کیلا (جیمنی 2.5 فلیش امیج) امیج جنریشن/ایڈیٹنگ میں ایک اہم قدم ہے۔ (اوپن اے آئی سے مطابقت رکھنے والے گیٹ ویز جیسے کامیٹ اے پی آئی اور گوگل generateContent APIs)۔ اپنانے کی رفتار کے لیے، CometAPI جیسے گیٹ ویز آپ کو OpenAI طرز کا کوڈ دوبارہ استعمال کرنے دیتے ہیں۔ ہمیشہ سنجیدگی کی جانچ پڑتال کے جوابات، مواد کی پالیسی اور پرووینس فیچرز (SynthID) کا احترام کریں، اور تکرار کے دوران اخراجات کی نگرانی کریں۔
شروع
CometAPI ایک متحد API پلیٹ فارم ہے جو سرکردہ فراہم کنندگان سے 500 سے زیادہ AI ماڈلز کو اکٹھا کرتا ہے — جیسے OpenAI کی GPT سیریز، Google کی Gemini، Anthropic's Claude، Midjourney، Suno، اور مزید — ایک واحد، ڈویلپر کے موافق انٹرفیس میں۔ مسلسل تصدیق، درخواست کی فارمیٹنگ، اور رسپانس ہینڈلنگ کی پیشکش کرکے، CometAPI ڈرامائی طور پر آپ کی ایپلی کیشنز میں AI صلاحیتوں کے انضمام کو آسان بناتا ہے۔ چاہے آپ چیٹ بوٹس، امیج جنریٹرز، میوزک کمپوزر، یا ڈیٹا سے چلنے والی اینالیٹکس پائپ لائنز بنا رہے ہوں، CometAPI آپ کو تیزی سے اعادہ کرنے، لاگت کو کنٹرول کرنے، اور وینڈر-ایگنوسٹک رہنے دیتا ہے—یہ سب کچھ AI ماحولیاتی نظام میں تازہ ترین کامیابیوں کو حاصل کرنے کے دوران۔
ڈویلپرز رسائی حاصل کر سکتے ہیں۔ جیمنی 2.5 فلیش امیج(نانو کیلے کامیٹ اے پی آئی کی فہرست gemini-2.5-flash-image-preview/gemini-2.5-flash-image ان کے کیٹلاگ میں طرز کے اندراجات۔ شروع کرنے کے لیے، میں ماڈل کی صلاحیتوں کو دریافت کریں۔ کھیل کے میدان اور مشورہ کریں API گائیڈ تفصیلی ہدایات کے لیے۔ رسائی کرنے سے پہلے، براہ کرم یقینی بنائیں کہ آپ نے CometAPI میں لاگ ان کیا ہے اور API کلید حاصل کر لی ہے۔ CometAPI آپ کو انضمام میں مدد کے لیے سرکاری قیمت سے کہیں کم قیمت پیش کریں۔



