جیمنی 2.5 فلیش امیج (عرف "نانو کیلا") جیمنی 2.5 فیملی میں گوگل کا جدید ترین مقامی امیج جنریشن + ایڈیٹنگ ماڈل ہے۔ یہ ملٹی امیج فیوژن، عین مطابق قدرتی زبان کی ترامیم، اور تیز ملٹی موڈل ورک فلو پر فوکس کرتا ہے۔
ماڈل کا تعارف
یہ کیا ہے - جیمنی 2.5 فلیش امیج جیمنی 2.5 فیملی پر بنایا گیا ایک ملٹی موڈل امیج جنریشن اور ایڈیٹنگ ماڈل ہے۔ یہ پیدا کرنے کے لیے ڈیزائن کیا گیا ہے۔ تصویری حقیقت پسندانہ تصاویرانجام دیں ھدف شدہ ترمیم (پینٹنگ، اسٹائل ٹرانسفر، آبجیکٹ کی تبدیلی)، اور متعدد ماخذ کی تصاویر کو ملا دیں۔ ایک ہی مربوط آؤٹ پٹ میں — جیمنی کی بہتر زبان کے استدلال کو کمپوزیشن اور سیمنٹکس کو کنٹرول کرنے کے لیے استعمال کرتے ہوئے۔
کلیدی خصوصیات
- مقامی امیج جنریشن اور ایڈیٹنگ - قدرتی زبان کے اشارے کے ذریعے تصاویر بنائیں یا موجودہ تصاویر میں ترمیم کریں۔ (پیدا / ترمیم).
- ملٹی امیج فیوژن - متعدد ان پٹ امیجز کو ایک فوٹوریئلسٹک منظر میں جوڑیں۔
- کردار کی مستقل مزاجی - ترمیمات اور اشارے پر ایک ہی موضوع یا کردار کی ظاہری شکل کو برقرار رکھیں۔ (مستقل مزاجی).
- SynthID واٹر مارکنگ - تمام آؤٹ پٹ میں ایک شامل ہے۔ غیر مرئی SynthID AI سے تیار کردہ مواد کی شناخت کے لیے۔ (واٹر مارک).
تکنیکی تفصیلات
- فن تعمیر اور پوزیشننگ: جیمنی 2.5 فلیش فیملی پر بنایا گیا — بطور ڈیزائن کیا گیا۔ کم تاخیر "فلیش" ویرینٹ جو پہلے کے فلیش ٹائرز کے مقابلے میں مضبوط استدلال کو برقرار رکھتے ہوئے بہت تیز فی کال رسپانس اور لاگت کی کارکردگی کے لیے تھوڑا سا ماڈل سائز/تھرو پٹ ٹریڈ کرتا ہے۔
- ان پٹ فارمیٹس اور حدود: قبول کرتا ہے ان لائن بیس 64 تصاویر چھوٹے آدانوں کے لیے اور فائل اپ لوڈز بڑی تصاویر کے لیے فائل API کے ذریعے (>20 MB کے لیے تجویز کردہ)۔ عام MIME اقسام (JPEG، PNG) کو سپورٹ کرتا ہے۔
- آپریشن کے طریقے: ٹیکسٹ ٹو امیج، امیج ایڈیٹنگ (انپینٹنگ / سیمنٹک ماسکنگ)، اسٹائل ٹرانسفر، ملٹی امیج کمپوزیشن، اور انٹرلیویڈ متن + تصویر کے جوابات (تصویر شدہ ہدایات، ترکیبیں، یا مخلوط مواد کے لیے مفید)۔
- پرووننس اور حفاظتی طریقہ کار: واضح نامنظور مواد کو محدود کرنے کے لیے AI آؤٹ پٹس پر نظر آنے والے واٹر مارکس کے علاوہ پوشیدہ SynthID مارکر اور پالیسی انفورسمنٹ لیئرز۔
بینچ مارک کارکردگی

حدود اور معلوم خطرات
- مواد کی پالیسی کی پابندیاں: ماڈل مواد کی پالیسیوں کو نافذ کرتے ہیں (مثلاً، واضح جنسی مواد اور کچھ غیر قانونی مواد کی اجازت نہ دینا)، لیکن نفاذ کامل نہیں ہے — عوامی شخصیات یا متنازعہ شبیہیں کی تصاویر بنانا کچھ منظرناموں میں اب بھی ممکن ہو سکتا ہے، لہذا پالیسی چیک ضروری ہے. )
- ناکامی کے طریقے: ممکن شناخت کا بہاؤ انتہائی ترامیم میں، کبھی کبھار سیمنٹک غلط ترتیب (جب اشارے کم بیان کیے جاتے ہیں)، اور انتہائی پیچیدہ مناظر میں نمونے یا انتہائی نقطہ نظر میں تبدیلی۔
- اصل اور غلط استعمال: جبکہ واٹر مارکس اور SynthID موجود ہیں، یہ غلط استعمال کو نہیں روکتے - یہ پتہ لگانے اور انتساب میں مدد کرتے ہیں لیکن حساس ورک فلو میں انسانی جائزے کا متبادل نہیں ہیں۔
عام استعمال کے معاملات
- پروڈکٹ اور ای کامرس: لائف اسٹائل شاٹس میں مصنوعات کی جگہ/کیٹلاگ ملٹی امیج فیوژن کے ذریعے۔
- تخلیقی ٹولنگ / ڈیزائن: تیز تکرار ڈیزائن ایپس میں (ایڈوب فائر فلائی انضمام کا حوالہ دیا گیا)۔
- فوٹو ایڈیٹنگ اور ری ٹچنگ: قدرتی زبان سے مقامی ترامیم (اشیاء کو ہٹا دیں، رنگ/لائٹنگ تبدیل کریں، ری اسٹائل)۔
- کہانی سنانے / کردار کے اثاثے: حروف کو مسلسل رکھیں پینلز اور مناظر کے پار۔
کال کیسے کریں؟ جیمنی 2.5 فلیش امیج CometAPI سے API
Gemini 2.5 Flash Image CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ:
| قیمت | $0.3120 |
مطلوبہ اقدامات
- داخل ہوجاو cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔
- انٹرفیس کی رسائی کی سند API کلید حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔
- اس سائٹ کا یو آر ایل حاصل کریں: https://api.cometapi.com/
طریقہ استعمال کریں
- منتخب کریں “
Gemini-2.5 Flash-ImageAPI کی درخواست بھیجنے اور درخواست کا باڈی سیٹ کرنے کے لیے اینڈ پوائنٹ۔ درخواست کا طریقہ اور درخواست کا باڈی ہماری ویب سائٹ API دستاویز سے حاصل کیا جاتا ہے۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ - بدل دیں۔ آپ کے اکاؤنٹ سے اپنی اصل CometAPI کلید کے ساتھ۔
- مواد کے خانے میں اپنا سوال یا درخواست داخل کریں—یہ وہی ہے جس کا ماڈل جواب دے گا۔
- . تیار کردہ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔
CometAPI مکمل طور پر ہم آہنگ REST API فراہم کرتا ہے — بغیر کسی رکاوٹ کے منتقلی کے لیے۔ کی اہم تفصیلات API دستاویز:
- اختتامی نقطہ:
https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent - ماڈل پیرامیٹر: gemini-2.5-flash-image-preview / gemini-2.5-flash-image
- توثیق:
Bearer YOUR_CometAPI_API_KEY - مواد کی قسم:
application/json.
نوٹ: API کی درخواست کرتے وقت، پیرامیٹر "سٹریم" سیٹ کریں: true۔
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
یہ بھی دیکھتے ہیں GPT-image-1 API



