المواصفات التقنية لـ Gemini 3.1 Flash Image Preview
| البند | Gemini 3.1 Flash Image Preview |
|---|---|
| المزوّد | |
| عائلة النموذج | Gemini 3.1 (فئة Flash) |
| التركيز الأساسي | توليد متعدد الوسائط سريع مع معاينة الصور |
| أنواع الإدخال | نص، صورة |
| أنواع الإخراج | نص، صورة (توليد معاينة) |
| نافذة السياق | حتى 1M رموز (المعيار لفئة Flash ضمن Gemini 3.x) |
| فئة زمن الاستجابة | زمن استجابة منخفض، إنتاجية عالية |
| دعم البث | نعم |
| استدعاء الأدوات | نعم (إطار أدوات Gemini API) |
| الإصدار | 3.1 |
ما هو Nano Banana 2
Nano Banana 2 هو اللقب الشائع الذي تستخدمه الصحافة ومجتمع المطورين للنموذج الجديد Gemini-3.1-Flash-Image. تضعه Google كنظام صور ضمن فئة “Flash” يقدّم جودة بصرية شبه احترافية مع زمن استجابة وتكلفة أقل — مناسب للتوليد واسع الحجم، والتحرير التكراري السريع، وتدفقات العمل المدمجة عبر خدمات Google. يرث قدرات الاستدلال متعدد الوسائط في Gemini 3.1 ويضيف إمكانات تتمحور حول الصورة (نص مقروء داخل الصور، تركيب متعدد الصور، دعم نسب عرض عريضة، 4K أصلي).
الميزات الرئيسية
- سرعة عالية، توليد متعدد الدقة: سرعة فئة Flash مع خيارات لمخرجات 0.5K / 1K / 2K / 4K ونسب أبعاد قصوى جديدة (1:4، 4:1، 1:8، 8:1).
- الاستناد إلى الويب في الوقت الفعلي: يدمج نتائج بحث النص والصورة لربط المحتوى المُولّد بمعلومات الويب الحالية عند تفعيل “Thinking” أو الاستناد إلى البحث. مفيد للمراجع المحدّثة والرسوم المعلوماتية الواقعية.
- تحسين عرض النص: عرض أفضل للنصوص القصيرة والنصوص الرسومية (الخطوط، الأحجام) مقارنة بنماذج Flash السابقة؛ لا يزال غير مثالي في الفقرات الطويلة/النص الصغير.
- تحرير متعدد المدخلات وتدفّقات عمل متعددة الجولات: دعم قوي لدمج عدة صور كمدخلات ولتحرير تكراري عبر عدة جولات.
📊 الأداء على المقاييس — توليد الصور وتحريرها (درجات Elo)
| القدرة | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| تحويل النص إلى صورة — التفضيل العام | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| تحويل النص إلى صورة — الجودة البصرية | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| تحويل النص إلى صورة — الرسوم المعلوماتية (الواقعية) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| التحرير — عام | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| التحرير — الشخصيات | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| التحرير — الإبداع | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| التحرير — الكائن/البيئة | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| التحرير — متعدد المدخلات | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| التحرير — التأنّق في الأسلوب | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
أبرز الاستنتاجات من جدول المقاييس:
- عبر فئات تحويل النص إلى صورة وتحرير الصور، يتفوّق Gemini 3.1 Flash Image باستمرار أو يضاهي أعلى الدرجات بين نماذج فئة Flash والعديد من نماذج الصور المنافسة.
- يُظهر النموذج نتائج قوية بشكل خاص في معايير الجودة البصرية والرسوم المعلوماتية (الواقعية) — مما يشير إلى تميّزه ليس فقط في الجودة الجمالية بل أيضًا في عرض محتوى دقيق بنيويًا.
- في تحرير متعدد المدخلات، يُظهر Nano Banana 2 أيضًا تعميمًا قويًا، مع درجات أعلى من إصدار Flash السابق.
تُجرى هذه التقييمات عبر مقارنات Elo بشرية جنبًا إلى جنب على مجموعة معايير متنوعة، مما يعكس كلًا من التفضيل والدقة عبر مهام توليد/تحرير الصور الشائعة الاستخدام.
Nano Banana 2 مقابل Nano Banana مقابل Nano Banana Pro
| النموذج | التوجّه | المعايير/ملاحظات تمثيلية |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | فئة Flash: سرعة + جودة بصرية عالية (2K–4K) | التفضيل الإجمالي 1079.0 ± 7.0؛ الجودة البصرية 1140 ± 6.0 (GenAI-Bench داخلي). |
| Gemini 2.5 Flash Image (Nano Banana) | إصدار Flash أقدم (جودة أقل) | درجات تفضيل/جودة بصرية أقل قليلًا مقارنة بـ 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | فئة Pro: جودة مدركة أعلى في المهام المعقدة، تكلفة/زمن استجابة أعلى | مفاضلات مختلفة؛ تُظهر بعض المقاييس ترتيبات نسبية مختلفة في المهام المتخصصة. |
| GPT-Image 1.5 / نماذج تجارية أخرى | منافسون (مفتوح/مغلق) | في مقاييس Google الداخلية، سجّل GPT-Image وغيره أقل من Gemini 3.1 في الجودة البصرية والتفضيل الإجمالي ضمن التقييم المذكور. تختلف المقارنات المستقلة من جهات خارجية. |
متى تختار Flash Image Preview:
- معاينة الصور في الوقت الفعلي داخل التطبيقات
- توليد صور واسع النطاق بحساسية للتكلفة
- مساعدات تصميم تفاعلية
كيفية الوصول إلى ودمج Nano Banana 2
الخطوة 1: التسجيل للحصول على مفتاح API
سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يُرجى التسجيل أولًا. سجّل الدخول إلى لوحة تحكم CometAPI. احصل على مفتاح واجهة API للوصول. انقر على “Add Token” في قسم رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسِل.
الخطوة 2: إرسال الطلبات إلى واجهة Nano Banana 2 API
حدّد نقطة النهاية “gemini-3.1-flash-image-preview8” لإرسال طلب API واضبط جسم الطلب. يتم الحصول على طريقة الطلب وجسم الطلب من وثائق API على موقعنا. يوفّر موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي من حسابك. مكان الاستدعاء: توليد الصور باستخدام Gemini
يدعم Nano Banana 2 تحرير الصور وتوليد الصور وتدفّقات العمل متعددة الصور. لتحرير الصور، تحتاج إلى رفع عنوان URL للصورة. لمزيد من المعلمات، يُرجى الرجوع إلى الوثائق.
الخطوة 3: استرجاع النتائج والتحقق منها
قم بمعالجة استجابة API للحصول على النتيجة المُولّدة. بعد المعالجة، تستجيب واجهة API بحالة المهمة وبيانات الإخراج. يمكنك تنزيل الصورة مباشرةً إلى جهازك المحلي من الـ playground (عادةً بصيغة PNG). يتم إنشاء رابط صورة خلال عملية API؛ يُرجى تنزيله بسرعة.