جوجل نانو بانانا برو (معرف النموذج الرسمي gemini-3-pro-image-preview) هو إصدار Gemini 3 Pro لإنشاء الصور وتحريرها. إنه نموذج صور احترافي في مرحلة المعاينة، يضيف إخراجًا بدقة 2K/4K، وتركيبًا متعدد الصور عالي الدقة (حتى 14 صور مرجعية، اتساق الأحرف ل تصل إلى شنومكس الناس)، وتقديم نص أقوى في الصورة، وأساس بحث للواقع الحقيقي.
الميزات الأساسية
- النص → الصورة: جيل مدفوع بالكامل بالتوجيه الفوري مع الالتزام القوي بالتوجيه الفوري.
- الصورة → الصورة (التعديلات):تعديلات جيدة ومستهدفة مع الحفاظ على الاتساق بين الموضوع والشخصية عبر عمليات التحرير المتعددة.
- أقصى دقة إخراج: حتى 4K (تعتمد الأمثلة وأحجام البكسل الدقيقة المدعومة على نسبة العرض إلى الارتفاع؛ تعرض واجهة برمجة التطبيقات إعدادات مسبقة بدقة 1K/2K/4K)
- التخطيط التكراري والتصحيح الذاتي: خط أنابيب داخلي "متعدد المراحل" يكتشف الأخطاء البصرية الشائعة ويصححها (المنظور، النص، الهندسة الدقيقة).
- تقديم نص متقدم داخل الصورة: نص واضح وقابل للقراءة ومتعدد اللغات (تسميات توضيحية قصيرة للفقرات الطويلة) مناسب للملصقات والنماذج والرسوم البيانية التوضيحية.
- الأحرف 5 والإخلاص لمدة تصل إلى 14 كائنًا/صورة مرجعية في سير عمل واحد.
- العلامة المائية / المصدر: تتضمن جميع الصور المولدة علامة مائية SynthID؛ ويقوم النموذج بتضمين بيانات تعريف C2PA للتعرف على المنشأ في بعض تكاملات المنتجات.
إصدارات الصور والتسمية لجهاز Gemini 3 Pro
gemini-3-pro-image-previewgemini-3-pro-image
تفاصيل تقنية
معمار
- السلالة / العمود الفقري:سيتم بناء Nano Banana Pro على مجموعة صور Gemini المتطورة من Google — وبشكل خاص الجديدة صورة Gemini 3 Pro / GEMPIX 2 هندسة معمارية (إطار عمل متعدد الوسائط للصور والنصوص ذو سعة أعلى). هذا تطور من صورة فلاشية لـ Gemini 2.5 (الموزة النانوية الأصلية) إلى نموذج صورة متعدد الوسائط أصليًا مع قدرات تفكير لغوية وبصرية موسعة.
- سلوك النموذج: تعدد الوسائط الأصلي (صورة + نص + معرفة عالمية)، وخطوط أنابيب واضحة لدمج الصور المتعددة، ومُخطط داخلي مُتدرج يُحسّن المخرجات على عدة مراحل بدلاً من إنتاج عينة ثابتة واحدة. تشير التقارير الأولية إلى استدلال هندسي/بصري أقوى (زجاج، انكسار) مقارنةً بالإصدارات السابقة.
- التفكير / التحسين الداخلي:يستخدم النموذج عملية "تفكير" مرئية داخليًا لتحسين التركيب (توثق واجهة برمجة التطبيقات هذا السلوك وتلاحظ أن هذه الخطوات الداخلية لا يتم فرض رسوم عليها كرموز للصورة النهائية).
- التأريض والأدوات: يدعم البحث عن التأريض (يمكن دمج بيانات الويب في إنشاء المخططات/الرسومات التوضيحية). كما يدعم تعليمات النظام للتحكم الدقيق.
معلمات واجهة برمجة التطبيقات الرئيسية:
thinking_level(منخفض / مرتفع) لتداول زمن الوصول مقابل عمق المنطق؛media_resolution(منخفض/متوسط/عالي) للتحكم في رموز التعرف الضوئي على الحروف/قراءة التفاصيل للصورة؛generationConfig.imageConfigللتحكم في نسبة العرض إلى الارتفاع/الدقة في مخرجات الصورة.
حدود الصورة:
- طرق الإدخال المدعومة: النصوص والصور (لا يقبل النموذج الصوت أو الفيديو كمدخلات لإنشاء الصور).
- الحد الأقصى للصور لكل مطالبة: 14 (لمعاينة صورة Gemini 3 Pro).
- الحد الأقصى لحجم الصورة (التحميل): 7 ميجا بايت لكل صورة إدخال.
- نسب العرض إلى الارتفاع المدعومة: 1:1، 3:2، 16:9، 9:16، 21:9، إلخ.
صور الإخراج / الرموز: حدود عالية، مع دعم 4K/4096 بكسل.
أداء المعيار
ملخص قصير: حتى الآن، كانت معظم معايير التقييم العامة/المبكرة نوعية/مُعتمدة على المجتمع، لكنها تُشير باستمرار إلى تحسينات كبيرة في الدقة، وتقليل العيوب، والدقة المادية مقارنةً بالموزة النانوية الأصلية (صورة فلاش جيميني 2.5). أظهرت "التحديات" المُسماة تحسينات بصرية واضحة، ولكن لا توجد حتى الآن جداول معايير تقييم رقمية (عامة) موحدة من جوجل تُقارن الإصدار 1 → الإصدار 2 عبر مقاييس توليد الصور القياسية.
- اختبارات المجتمع النوعيةحواف أدق، وتفاصيل دقيقة أكثر وضوحًا، وألوان أكثر دقة، ودقة في الالتصاق (عدد أقل من الدعائم المتخيلة، وشخصيات أكثر اتساقًا). تشمل الاختبارات غير الرسمية الشائعة ما يُسمى "اختبار كأس النبيذ" و"تحدي برجر الزجاج"، حيث يتعامل GEMPIX2 (Nano Banana Pro) مع الشفافية والانكسار بشكل أفضل بكثير من الإصدارات السابقة.
- معالجة النصوصيُظهر Nano Banana Pro تحسنًا واضحًا في الطباعة ووضع النصوص داخل الصور (وهذا ضعفٌ دائمٌ في العديد من نماذج الصور). تشير مقارنات المستخدمين إلى انخفاضٍ في عدد الحروف الرسومية المشوهة.
- الإنتاجية / تجربة المستخدم:سرعة تكرار أسرع وتجربة مستخدم تقوم بإجراء تحسين متعدد المراحل في الواجهة الخلفية حتى يتمكن المستخدمون من رؤية نتائج المرور الأولى الأكثر موثوقية (تقليل عمليات إعادة اللف اليدوية).
القيود والمخاطر
- مرشحات المحتوى والكشف عنه:قد تعمل المنصات التي تدمج النموذج (على سبيل المثال، تطبيقات Whisk/الجهات الخارجية) على تمكين الكشف الصارم عن المشاهير أو التشابه وحظر مخرجات معينة، مما يؤثر على سير العمل الإبداعي الذي يعتمد على التشابه الواقعي للمشاهير.
- الهلوسة / حالات حافة الاستدلال:على الرغم من التحسين الذي تم إجراؤه، لا يزال النموذج قادرًا على إنتاج قطع أثرية غير واقعية ماديًا، وخاصةً مع النص الرمزي الكثيف داخل الصور أو المخططات الفنية للغاية - على الرغم من أن NB2 يبدو أنه يقلل من هذه الأخطاء مقارنة بالإصدارات السابقة.
- السلامة وسوء الاستخدام: يمكن استخدام نماذج الصور التوليدية لإنشاء محتوى مُشكِل أو ضار. تُطبّق جوجل قيودًا وفلاتر محتوى وعلامة SynthID المائية للمساعدة في تحديد المصدر؛ ومع ذلك، فقد حدث سوء استخدام (جدلٌ كبيرٌ مرتبطٌ بصورةٍ مُولّدةٍ من Nano Banana في سياقٍ سياسيٍّ حساس).
كيف يتفوق Nano Banana Pro على الموديلات الأخرى
- Nano Banana Pro (صورة GEMPIX 2 / Gemini 3 Pro) — تكامل قوي مع الأجهزة المحمولة، ودمج متعدد الصور، وتصحيح ذاتي متكرر، ودقة 2K أصلية/ترقية 4K، ومتكامل بشكل وثيق مع تطبيقات جوجل (البحث، والصور، وWorkspace/Gemini). مثالي لسير العمل التي تتطلب تعديلات موثوقة، واستمرارية، وتكاملاً مع خدمات جوجل.
- ميدجورني - يتميز بالتفوق في المخرجات الفنية المنمقة والهندسة السريعة التي يقودها المجتمع؛ ولا يستهدف عادةً اندماج الصور المتعددة الدقيقة أو خطوط أنابيب التحرير المتعددة الوسائط العميقة.
- انتشار مستقر / أوزان مفتوحة مفتوح بالكامل، وقابل للتخصيص بدرجة عالية، وقابل للاستضافة محليًا؛ تُعدّ منظومة نقاط التفتيش والضبط الدقيق ميزةً حاسمةً للبحث والاستخدام دون اتصال بالإنترنت. تكامل أقل "بنقرة واحدة" مع الأجهزة المحمولة، واتساق أقل في تحرير الصور المتعددة عند التشغيل، مقارنةً بـ Nano Banana Pro.
- سيدريم 4.0 (بايت دانس) — صُنِّف مؤخرًا كمنافس صريح لبرنامج Nano Banana، مُركِّزًا على سرعة العرض الفائقة، وإخراج 2K، ودعم العديد من صور المرجع (حتى ست صور). يُصنَّف كبديل للمحترفين والمبدعين.
(هذه المقارنات عالية المستوى؛ اختر الفائز من خلال مطابقة الأداة مع سير عملك: الانفتاح/إمكانية التخصيص → الانتشار المستقر؛ الفن المنمق → منتصف الرحلة؛ التحرير المتكامل والمتسق عبر الهاتف المحمول مع التكرار العدواني → عائلة صور Nano Banana Pro/ Gemini 3 Pro.)
حالات الاستخدام في العالم الحقيقي
- تحرير الصور على الهاتف المحمول والمرشحات الإبداعية (عمليات تكامل صور Google - إعادة التصميم، ودمج الخلفية، وإعادة تكوين الصورة).
- أصول التسويق والإعلان - توليد مفهوم سريع، وشخصيات علامة تجارية متسقة عبر إطارات/زوايا متعددة.
- فن المفاهيم ورسم القصة المصورة — يساعد دمج الصور المتعددة على الحفاظ على استمرارية الشخصية عبر الألواح.
- نماذج التجارة الإلكترونية / المنتجات - إنشاء لقطات متسقة للمنتج في سياقات/ظروف إضاءة مختلفة.
- النمذجة السريعة لأصول الواقع المعزز والافتراضي - مخرجات 2K/4K عالية الجودة يمكن ترقيتها للاستخدامات الغامرة.
كيفية الاتصال بـgemini-3-pro-image(نانو بانانا برو API
أسعار Nano Banana API في CometAPI، خصم 20% من السعر الرسمي:
| السعر الأساسي | $0.19200 |
الخطوات المطلوبة
- تسجيل الدخول إلى كوميتابي.كوم. إذا لم تكن مستخدمًا لدينا بعد، فيرجى التسجيل أولاً
- احصل على مفتاح API لبيانات اعتماد الوصول للواجهة. انقر على "إضافة رمز" في رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx، ثم أرسله.
- احصل على عنوان URL لهذا الموقع: https://api.cometapi.com/
استخدام الطريقة
- حدد "
gemini-3-pro-imageنقطة نهاية لإرسال طلب واجهة برمجة التطبيقات (API) وتعيين نص الطلب. يمكن الحصول على طريقة الطلب ونصه من وثيقة واجهة برمجة التطبيقات على موقعنا الإلكتروني. كما يوفر موقعنا اختبار Apifox لتسهيل الأمر عليك. - يستبدل باستخدام مفتاح CometAPI الفعلي الخاص بك من حسابك.
- أدخل سؤالك أو طلبك في حقل المحتوى - وهذا ما سيستجيب له النموذج.
- . قم بمعالجة استجابة API للحصول على الإجابة الناتجة.
توفر CometAPI واجهة برمجة تطبيقات REST متوافقة تمامًا، مما يُسهّل عملية الانتقال. التفاصيل الرئيسية:
- عنوان URL الأساسي: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
- أسماء النماذج:
gemini-3-pro-image - المصادقة:
Bearer YOUR_CometAPI_API_KEYرأس - نوع المحتوى:
application/json.
انظر أيضا واجهة برمجة تطبيقات الصور الفلاشية Gemini 2.5 (Nano-Banana)



