Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

مدخل:$1.5616/M
الإخراج:$9.3696/M
Nano Banana Pro هو نموذج ذكاء اصطناعي لتقديم مساعدة عامة في سير عمل تتمحور حول النص. وهو مناسب لاستخدام مطالبات بأسلوب التعليمات لإنشاء المحتوى وتحويله وتحليله مع إمكانية التحكم في البنية. تشمل الاستخدامات الشائعة مساعدي الدردشة، وتلخيص المستندات، والأسئلة والأجوبة المعرفية، وأتمتة سير العمل. تفاصيله التقنية المتاحة للعامة محدودة؛ ويتماشى التكامل معه مع الأنماط الشائعة لمساعدي الذكاء الاصطناعي مثل المخرجات المهيكلة، والمطالبات المدعّمة بالاسترجاع، واستدعاء الأدوات أو الدوال.
جديد
الاستخدام التجاري
Playground
نظرة عامة
الميزات
التسعير
API
الإصدارات

الميزات الأساسية

  • النص → صورة: توليد كامل قائم على الموجّه مع التزام قوي بالموجّه.
  • صورة → صورة (تحريرات): تعديلات دقيقة وموجّهة مع الحفاظ على اتساق الموضوع/الشخصية عبر تعديلات متعددة.
  • أقصى دقة إخراج: حتى 4K (تعتمد الأمثلة وأحجام البكسل الدقيقة المدعومة على نسبة العرض إلى الارتفاع؛ وتعرض واجهة البرمجة إعدادات مسبقة 1K/2K/4K)
  • التخطيط التكراري والتصحيح الذاتي: خط أنابيب داخلي “متعدد المراحل” يكتشف ويصحح الأخطاء البصرية الشائعة (المنظور، النص، الهندسة الدقيقة).
  • عرض نص متقدم داخل الصور: نص متعدد اللغات واضح وقابل للقراءة (من التسميات القصيرة إلى الفقرات الطويلة) مناسب للملصقات والنماذج الأولية والرسوم المعلوماتية.
  • 5 شخصيات ودقة حفظ حتى 14 عنصرًا/صورة مرجعية في سير عمل واحد.
  • العلامة المائية/الإثبات: تتضمن جميع الصور المُنشأة علامة مائية SynthID؛ وي嵌ن النموذج بيانات تعريف C2PA لإثبات المصدر في بعض تكاملات المنتجات.

إصدارات Gemini 3 Pro Image والتسمية

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

تفاصيل تقنية

الهيكلية

  • الأصل/العمود الفقري: تم بناء Nano Banana Pro على حزمة صور Gemini المتطورة من Google — تحديدًا هيكل Gemini 3 Pro Image / GEMPIX 2 الجديد (إطار متعدد الوسائط عالي السعة للصورة+النص). وهو تطوّر عن Gemini 2.5 Flash Image (الـ“nano-banana” الأصلي) إلى نموذج صور متعدد الوسائط أصيل مع قدرات موسّعة للاستدلال بين الرؤية واللغة.
  • سلوك النموذج: تعددية وسائط أصلية (صورة + نص + معرفة بالعالم)، مسارات صريحة لدمج صور متعددة، ومخطِّط داخلي مرحلي يصقل المخرجات عبر عدة تمريرات بدلًا من إنتاج عينة ثابتة واحدة. تشير التقارير المبكرة إلى استدلال هندسي/بصري أقوى (الزجاج، الانكسار) مقارنة بالإصدارات السابقة.
  • التفكير/التنقيح الداخلي: يستخدم النموذج عملية “تفكير” مرئية داخليًا لصقل التكوين (يوثق الـAPI هذا السلوك ويشير إلى أن هذه الخطوات الداخلية لا تُحتسب كرموز صور نهائية).
  • الاستناد والأدوات: يدعم Search grounding (يمكنه دمج حقائق من الويب في إنشاء المخططات/الرسوم المعلوماتية). كما يدعم تعليمات النظام لمزيد من التحكم الحتمي.

معلمات الـAPI الرئيسية:

  • thinking_level (منخفض / مرتفع) للموازنة بين وقت الاستجابة وعمق الاستدلال؛
  • media_resolution (منخفض/متوسط/مرتفع) للتحكم في رموز قراءة تفاصيل/OCR الصورة؛
  • generationConfig.imageConfig للتحكم في نسبة العرض إلى الارتفاع/الدقة في مخرجات الصور.

حدود الصور:

  • الوسائط المدخلة المدعومة: النص والصور (لا يقبل النموذج الصوت أو الفيديو كمدخلات لتوليد الصور).
  • الحد الأقصى للصور لكل موجّه: 14 (لـ Gemini 3 Pro Image preview).
  • الحد الأقصى لحجم الصورة (رفع): 7 MB لكل صورة مدخلة.
  • نِسَب العرض إلى الارتفاع المدعومة: 1:1، 3:2، 16:9، 9:16، 21:9، وغيرها.

الصور/الرموز المخرجة: حدود مرتفعة، مع دعم 4K/4096px.

أداء المعايير

ملخص قصير: المعايير العامة/المبكرة حتى الآن ذات طابع نوعي/مجتمعي في الغالب، لكنها تُظهر باستمرار تحسينات كبيرة في الدقة وتقليل الشوائب والالتزام الفيزيائي مقارنة بـ“nano-banana” الأصلي (Gemini 2.5 Flash Image). أظهرت “التحديات” المسماة تحديدًا مكاسب بصرية واضحة، لكن لا توجد حتى الآن جداول معيارية رقمية (علنية) من Google تقارن الإصدار v1 → v2 عبر مقاييس توليد الصور القياسية.

  • اختبارات المجتمع النوعية: حواف أنظف، تفاصيل دقيقة أكثر حدّة، ألوان أكثر صدقًا، والتزام أفضل بالموجّه (إبداعات أقل غير مطلوبة، وشخصيات أكثر اتساقًا). تشمل الاختبارات الشائعة غير الرسمية ما يسمى “Wine Glass Test” و“Glass Burger Challenge”، حيث يتعامل GEMPIX2 (Nano Banana Pro) مع الشفافية والانكسار بشكل أفضل بكثير من الإصدارات الأقدم.
  • التعامل مع النص: يُظهر Nano Banana Pro تحسنًا مرئيًا في الطباعة ووضع النص داخل الصور (وهو ضعف مستمر لدى العديد من نماذج الصور). تشير مقارنات المجتمع إلى حروف أقل تشويهًا.
  • الإنتاجية/تجربة المستخدم: سرعة تكرار أعلى وتجربة خلفية تقوم بالتنقيح متعدد المراحل بحيث يرى المستخدمون نتائج أولية أكثر موثوقية (تقليل إعادة التوليد اليدوي).

القيود والمخاطر

  • عوامل التصفية والكشف عن المحتوى: قد تفعّل المنصات المدمج فيها النموذج (مثل Whisk/تطبيقات طرف ثالث) كشفًا صارمًا للمشاهير أو الشبه وتمنع مخرجات معينة، ما يؤثر على سير العمل الإبداعي الذي يعتمد على محاكاة واقعية لوجوه المشاهير.
  • الهلوسة/حالات الاستدلال الحدّية: رغم التحسن، قد ينتج عن النموذج شوائب غير واقعية فيزيائيًا، خاصة مع النص الرمزي الكثيف داخل الصور أو الرسومات التقنية عالية التعقيد — مع أن NB2 يبدو أنه يقلل هذه الأخطاء مقارنة بالإصدارات السابقة.
  • السلامة وسوء الاستخدام: يمكن استخدام نماذج توليد الصور لإنتاج محتوى إشكالي أو ضار. تطبّق Google قيودًا وعوامل تصفية وعلامة SynthID المائية للمساعدة في إثبات المصدر؛ ومع ذلك، حدثت إساءات استخدام (جدل بارز مرتبط بصورة وُلدت عبر Nano Banana في سياق سياسي حساس).

مكانة Nano Banana Pro مقارنة بالنماذج الأخرى

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — تكامل قوي مع الأجهزة المحمولة، دمج متعدد الصور، تصحيح ذاتي تكراري، دقة أصلية 2K/وترقية إلى 4K، وتكامل وثيق مع تطبيقات Google (Search وPhotos وWorkspace/Gemini). الأفضل لسير عمل يتطلب تعديلات موثوقة واستمرارية وتكاملًا مع خدمات Google.
  • Midjourney — يتفوق في المخرجات الفنية المُؤسلَبة والهندسة المجتمعية للموجّهات؛ لا يستهدف عادة دمج صور متعددة بدقة فوتوغرافية أو خطوط تحرير متعددة الوسائط عميقة خارج الصندوق.
  • Stable Diffusion / أوزان مفتوحة — مفتوح بالكامل، قابل للتخصيص بدرجة عالية، ويمكن استضافته محليًا؛ نظام بيئي غني بنقاط التحقق والتدريب الدقيق ميزة حاسمة للبحث والاستخدام دون اتصال. أقل “بنقرة واحدة” للتكامل مع الهاتف المحمول وأقل اتساقًا في ترابط التحرير متعدد الصور جاهزًا مقارنة بـ Nano Banana Pro.
  • Seedream 4.0 (ByteDance) — وُضِع مؤخرًا كمنافس مباشر لـ Nano Banana، مع التركيز على التصيير فائق السرعة، ومخرجات 2K، ودعم العديد من الصور المرجعية (حتى ستة). موجه كمثال احترافي/للمبدعين.

(هذه المقارنات عامة؛ اختر الأنسب بمطابقة الأداة مع سير عملك: الانفتاح/قابلية التخصيص → Stable Diffusion؛ الفن المُؤسلَب → Midjourney؛ تحرير محمول متكامل ومتسق مع تكرار عدواني → عائلة Nano Banana Pro/Gemini 3 Pro Image.)

حالات استخدام واقعية

  • تحرير الصور على الهاتف المحمول والفلاتر الإبداعية (تكامل Google Photos — إعادة التصميم، دمج الخلفية، إعادة تركيب الصور الشخصية).
  • أصول التسويق والإعلانات — توليد سريع للأفكار، وشخصيات علامة تجارية متسقة عبر إطارات/زوايا متعددة.
  • فن المفاهيم ولوحات القصة — يساعد الدمج متعدد الصور على الحفاظ على استمرارية الشخصيات عبر اللوحات.
  • التجارة الإلكترونية/نماذج المنتجات — توليد صور منتجات متناسقة في سياقات/ظروف إضاءة مختلفة.
  • النماذج الأولية السريعة لأصول AR/VR — مخرجات 2K/4K عالية الجودة يمكن ترقيتها لاستخدامات غامرة.

كيفية الوصول إلى gemini-3-pro-image(Nano Banana Pro) API

الخطوات المطلوبة

  • سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يرجى التسجيل أولًا
  • احصل على بيانات اعتماد مفتاح API للواجهة. انقر على “Add Token” عند “API token” في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم قدّمه.
  • احصل على عنوان الرابط لهذا الموقع: https://api.cometapi.com/

طريقة الاستخدام

  1. اختر نقطة النهاية “gemini-3-pro-image” لإرسال طلب الـAPI واضبط جسم الطلب. يتم الحصول على طريقة الطلب وجسم الطلب من وثائق الـAPI على موقعنا. يوفر موقعنا أيضًا اختبار Apifox لراحتك.
  2. استبدل <YOUR_API_KEY> بمفتاح CometAPI الحقيقي من حسابك.
  3. أدخل سؤالك أو طلبك في حقل content — هذا ما سيستجيب له النموذج.
  4. قم بمعالجة استجابة الـAPI للحصول على الإجابة المُولَّدة.

يوفر CometAPI واجهة REST API متوافقة بالكامل — لهجرة سلسة. التفاصيل الرئيسية :

  • Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Model Names: gemini-3-pro-image
  • Authentication: Bearer YOUR_CometAPI_API_KEY header
  • Content-Type: application/json .

الأسئلة الشائعة

هل يمكن لـ Gemini 3 Pro Image إنشاء صور بدقة 4K؟

نعم، يدعم Nano Banana Pro (Gemini 3 Pro Image) إخراجًا أصليًا يصل إلى دقة 4K مع نسب أبعاد تشمل 1:1 و3:2 و16:9 و9:16 و21:9. كما يدعم الإعدادات المسبقة 1K و2K عبر المعلمة imageConfig.

كيف يتعامل Nano Banana Pro مع عرض النص داخل الصور؟

يتميز Nano Banana Pro بقدرات متقدمة لعرض النص داخل الصور مع دعم واضح وسهل القراءة للنصوص متعددة اللغات، من التعليقات القصيرة إلى الفقرات الطويلة. وهذا يجعله مثاليًا للملصقات والرسوم المعلوماتية ونماذج واجهة المستخدم والمواد التسويقية.

هل يمكنني تعديل الصور بأسلوب حواري باستخدام Gemini 3 Pro Image؟

نعم، يدعم Nano Banana Pro التحرير الحواري متعدد الجولات. ما عليك سوى طلب تغييرات مثل 'اجعل الخلفية وقت الغروب'، وسيحافظ النموذج على السياق البصري عبر Thought Signatures بين الجولات.

ما الذي يميز Nano Banana Pro عن FLUX 2 Pro أو Midjourney؟

يتفوق Nano Banana Pro في التصحيح الذاتي التكراري، والحفاظ المتسق على الشخصيات عبر تعديلات متعددة، والتكامل الوثيق مع منظومة Google. كما يمكنه التعامل مع ما يصل إلى 14 صورة مرجعية لسير عمل دمج الصور المتعددة المعقدة.

هل يستخدم Nano Banana Pro بحث Google لإنشاء صور قائمة على معلومات موثقة؟

نعم، يمكن لـ Nano Banana Pro استخدام الإسناد إلى البحث للتحقق من الحقائق قبل إنشاء الصور. على سبيل المثال، يمكنه جلب بيانات الطقس الحالية لإنشاء رسم معلوماتي دقيق عن طقس طوكيو.

كم عدد الصور المرجعية التي يمكن لـ Nano Banana Pro معالجتها في طلب واحد؟

يدعم Nano Banana Pro ما يصل إلى 14 صورة إدخال لكل مطالبة، بحد أقصى 7MB لكل صورة. كما يحافظ على اتساق الموضوع والشخصيات عبر ما يصل إلى 5 شخصيات في سيناريوهات دمج الصور المتعددة المعقدة.

الميزات لـ Nano Banana Pro

استكشف الميزات الرئيسية لـ Nano Banana Pro، المصممة لتعزيز الأداء وسهولة الاستخدام. اكتشف كيف يمكن لهذه القدرات أن تفيد مشاريعك وتحسن تجربة المستخدم.

التسعير لـ Nano Banana Pro

استكشف الأسعار التنافسية لـ Nano Banana Pro، المصمم ليناسب الميزانيات المختلفة واحتياجات الاستخدام المتنوعة. تضمن خططنا المرنة أن تدفع فقط مقابل ما تستخدمه، مما يجعل من السهل التوسع مع نمو متطلباتك. اكتشف كيف يمكن لـ Nano Banana Pro تحسين مشاريعك مع الحفاظ على التكاليف قابلة للإدارة.

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

نموذج الكود وواجهة برمجة التطبيقات لـ Nano Banana Pro

احصل على أكواد نماذجية شاملة وموارد API لـ Nano Banana Pro لتبسيط عملية التكامل الخاصة بك. توفر وثائقنا التفصيلية إرشادات خطوة بخطوة، مما يساعدك على الاستفادة من الإمكانات الكاملة لـ Nano Banana Pro في مشاريعك.
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

إصدارات Nano Banana Pro

قد تشمل الأسباب وراء احتواء Nano Banana Pro على لقطات متعددة عوامل محتملة مثل اختلاف المخرجات بعد التحديثات التي تتطلب اللقطات القديمة لضمان الاتساق، وتوفير فترة انتقالية للمطورين للتكيف والهجرة، وارتباط اللقطات المختلفة بنقاط النهاية العالمية أو الإقليمية لتحسين تجربة المستخدم. للاطلاع على الاختلافات التفصيلية بين الإصدارات، يرجى الرجوع إلى الوثائق الرسمية.
Model idالوصفالتوفرالطلب
nano-banana-pro-allالتقنية المستخدمة غير رسمية، كما أن التوليد غير مستقر وما إلى ذلك، Chat format✅تنسيق Chat
gemini-3-pro-imageموصى به، ويشير إلى أحدث نموذج✅Gemini generates image
gemini-3-pro-image-previewمعاينة رسمية✅Gemini generates image

المزيد من النماذج