جيميني 2.5 فلاش إيمج (المعروف أيضًا باسم "نانو بانانا") هو أحدث نموذج أصلي من جوجل لإنشاء وتحرير الصور ضمن سلسلة جيميني 2.5. يركز على دمج الصور المتعددة، وتحريرها بدقة باستخدام اللغات الطبيعية، وسير عمل سريع متعدد الوسائط.
مقدمة عن النموذج
ما هو - صورة فلاشية لـ Gemini 2.5 هو نموذج متعدد الوسائط لتوليد وتحرير الصور، مبني على عائلة Gemini 2.5. وهو مصمم لإنتاج صور واقعية، نفذ التعديلات المستهدفة (الرسم أثناء العمل، ونقل الأسلوب، ومبادلات الكائنات)، و دمج صور متعددة المصدر في إخراج واحد متماسك - مع تطبيق المنطق اللغوي المحسن في الجوزاء للتحكم في التركيب والدلالات.
الملامح الرئيسية
- إنشاء الصور الأصلية وتحريرها - إنشاء صور أو تحرير الصور الموجودة عبر مطالبات اللغة الطبيعية. (إنشاء / تحرير).
- دمج الصور المتعددة - دمج صور الإدخال المتعددة في مشهد واقعي واحد.
- اتساق الشخصية - الحفاظ على نفس مظهر الموضوع أو الشخصية عبر التعديلات والمطالبات. (تناسق).
- العلامة المائية لـ SynthID - جميع المخرجات تشمل معرف SynthID غير المرئي لتحديد المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي. (العلامة المائية).
تفاصيل تقنية
- الهندسة المعمارية والموقع: تم بناؤه على عائلة Gemini 2.5 Flash — تم تصميمه كـ قليل من الكمون "متغير "Flash" الذي يتاجر بحجم نموذج/إنتاجية صغير من أجل استجابة أسرع بكثير لكل مكالمة وكفاءة من حيث التكلفة مع الاحتفاظ بمنطق أقوى من مستويات Flash السابقة.
- تنسيقات الإدخال والحدود: يقبل صور base64 مضمنة للمدخلات الصغيرة و تحميل الملفات عبر واجهة برمجة التطبيقات للملفات للصور الأكبر حجمًا (يُنصح بها لحجم أكبر من ٢٠ ميجابايت). يدعم أنواع MIME الشائعة (JPEG وPNG).
- أساليب عملها: تحويل النص إلى صورة، وتحرير الصور (الرسم الداخلي / إخفاء الدلالة)، ونقل الأنماط، وتكوين الصور المتعددة، و مدخل استجابات نصية + صورية (مفيدة للتعليمات المصورة أو الوصفات أو المحتوى المختلط).
- المنشأ وآليات السلامة: علامات مائية مرئية على مخرجات الذكاء الاصطناعي بالإضافة إلى علامات SynthID المخفية وطبقات فرض السياسة للحد من المحتوى غير المسموح به بشكل صريح.
أداء المعيار

القيود والمخاطر المعروفة
- قيود سياسة المحتوى: تطبق النماذج سياسات المحتوى (على سبيل المثال، منع المحتوى الجنسي الصريح وبعض المحتوى غير المشروع)، لكن التنفيذ ليس مثاليًا - قد يظل إنشاء صور لشخصيات عامة أو أيقونات مثيرة للجدل ممكنًا في بعض السيناريوهات، لذا التحقق من السياسات أمر ضروري. )
- أوضاع الفشل: ممكن انحراف الهوية في التحرير المتطرف، وعدم التوافق الدلالي العرضي (عندما تكون المطالبات غير محددة بشكل كافٍ)، والتحف في المشاهد المعقدة للغاية أو تغييرات وجهة النظر المتطرفة.
- المنشأ وسوء الاستخدام: على الرغم من وجود العلامات المائية وSynthID، إلا أن هذه العلامات لا تمنع سوء الاستخدام - فهي تساعد في الكشف والإسناد ولكنها لا تحل محل المراجعة البشرية في سير العمل الحساسة.
حالات الاستخدام النموذجية
- المنتج والتجارة الإلكترونية: وضع/فهرسة المنتجات في لقطات نمط الحياة من خلال دمج الصور المتعددة.
- الأدوات الإبداعية / التصميم: التكرارات السريعة في تطبيقات التصميم (تم الاستشهاد بتكامل Adobe Firefly).
- تحرير الصور وتنقيحها: التعديلات المترجمة من اللغة الطبيعية (إزالة الكائنات، تغيير اللون/الإضاءة، إعادة التصميم).
- أصول القصص / الشخصيات: الحفاظ على اتساق الشخصيات عبر الألواح والمشاهد.
كيف تتصل صورة فلاشية لـ Gemini 2.5 واجهة برمجة التطبيقات من CometAPI
Gemini 2.5 Flash Image أسعار API في CometAPI، خصم 20% من السعر الرسمي:
| السعر الأساسي | $0.3120 |
الخطوات المطلوبة
- تسجيل الدخول إلى كوميتابي.كوم. إذا لم تكن مستخدمًا لدينا بعد، فيرجى التسجيل أولاً
- احصل على مفتاح API لبيانات اعتماد الوصول للواجهة. انقر على "إضافة رمز" في رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx، ثم أرسله.
- احصل على عنوان URL لهذا الموقع: https://api.cometapi.com/
استخدام الطريقة
- حدد "
Gemini-2.5 Flash-Imageنقطة نهاية لإرسال طلب واجهة برمجة التطبيقات (API) وتعيين نص الطلب. يمكن الحصول على طريقة الطلب ونصه من وثيقة واجهة برمجة التطبيقات على موقعنا الإلكتروني. كما يوفر موقعنا اختبار Apifox لتسهيل الأمر عليك. - يستبدل باستخدام مفتاح CometAPI الفعلي الخاص بك من حسابك.
- أدخل سؤالك أو طلبك في حقل المحتوى - وهذا ما سيستجيب له النموذج.
- . قم بمعالجة استجابة API للحصول على الإجابة الناتجة.
يوفر CometAPI واجهة برمجة تطبيقات REST متوافقة تمامًا - لترحيل سلس. تفاصيل رئيسية لـ وثيقة API:
- نقطة النهاية:
https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent - نموذج معلمة: معاينة صورة فلاش جيميني 2.5 / صورة فلاش جيميني 2.5
- المصادقة:
Bearer YOUR_CometAPI_API_KEY - نوع المحتوى:
application/json.
ملاحظة: عند استدعاء واجهة برمجة التطبيقات، اضبط المعلمة "stream": true.
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
انظر أيضا واجهة برمجة تطبيقات GPT-image-1



