الإصدار الأخير من Google لـ صورة فلاش لـ Gemini 2.5 — تُلقب بـ "Nano-Banana" سرعان ما أصبح الخيار الأمثل لتحرير الصور التفاعلية: فهو يحافظ على تناسق التشابهات بين جميع التعديلات، ويدمج صورًا متعددة بسلاسة، ويدعم عمليات تحرير محلية طبيعية للغاية قائمة على الأوامر. سأشرح أدناه ماهية Nano Banana وكيفية استخدامه عبر جوجل الجوزاء وعبر **الوصول من طرف ثالث (على سبيل المثال، CometAPI)**أعطِ أمثلةً عمليةً ورموزًا يمكنك إضافتها إلى مشروعك، وشارك نصائح للمطورين حول التحرير متعدد الأدوار، والتحسين، والإرشادات المتقدمة. أكتب هذا بصفتي مطورًا يستخدم نماذج الصور يوميًا - اعتبر هذا دليلًا عمليًا، مع بعض الآراء.
ما هو نانو الموز؟
ماذا يعني "Gemini 2.5 Flash Image / Nano-Banana" في الواقع؟
الموز النانوي هو لقب المجتمع / الاسم الرمزي لـ صورة فلاشية لـ Gemini 2.5أحدث نموذج لتوليد الصور وتحريرها من Google DeepMind. صُمم لـ المطالبة أولاً التحرير (تقدم له تعليمات باللغة الطبيعية) مع التركيز بشكل خاص على اتساق الشخصية (مع الحفاظ على نفس الشخص/الحيوان الأليف/الكائن في جميع التعديلات)، دمج الصور المتعددة (دمج الكائنات عبر صور المصدر)، والاستخدام التفاعلي منخفض الكمون في تطبيقات مثل Gemini وGoogle AI Studio. يتوفر النموذج من خلال واجهة برمجة تطبيقات Gemini من Google وAI Studio، ويظهر بالفعل في CometAPI.
باعتبارك مطورًا، فكر في Nano-Banana ليس كمولد صور "من الصفر" في المقام الأول، ولكن كمولد عالي الكفاءة مساعد تحرير الصور وتكوينها: يستوعب محتوى صورتك، ويتذكر الموضوع بعد تعديله، ويستجيب لتعليمات اللغة الطبيعية بطريقة تتناسب مع دورة تصميم سريعة ومتكررة. هذا يجعله مفيدًا بشكل خاص لنماذج المنتجات، ولقطات الشخصيات المتسقة، وتكرارات المفاهيم السريعة، والتفاعل الإبداعي الاجتماعي.
ملخص موجه للمطورين
- اسم الموديل: معاينة صورة فلاش gemini-2.5 / صورة فلاش gemini-2.5.
- الاتساق والاستمرارية: يحتفظ Nano-Banana بتفاصيل الشخصية عبر التعديلات بشكل أكثر موثوقية من العديد من المنافسين، مما يجعله مفضلًا للتعديلات المتسلسلة ورواية القصص.
- سرعة: يبلغ المستخدمون عن إنشاء سريع - غالبًا أقل من 10 ثوانٍ للعديد من التعديلات - وهو أمر مفيد لسير العمل التكراري.
- التحرير-التصميم أولاً: في حين تم تحسين العديد من النماذج لتوليد نص مدفوع بحت، فإن تجربة المستخدم وواجهات برمجة التطبيقات الخاصة بـ Nano-Banana تؤكد على التحرير (التحرير في لقطة واحدة، ودمج الصور المتعددة، ونقل الأسلوب).
كيف يمكنني التحرير باستخدام Nano-Banana على CometAPI؟
CometAPI هو سوق/غلاف واجهة برمجة التطبيقات الذي يجمع العديد من النماذج (بما في ذلك واجهة برمجة تطبيقات صور فلاش Gemini 2.5 (Nano Banana)) خلف نقطة نهاية واحدة متوافقة مع OpenAI. إذا كنت ترغب في إنشاء نموذج أولي بسرعة أو تجنب تجهيز حسابات Google Cloud/Vertex للاختبار الأول، فإن CometAPI هو حل عملي - ستحصل على مفتاح API، ثم اختر gemini-2.5-flash-image (أو gemini-2.5-flash-image-preview )، ثم أرسل طلبات تشبه إلى حد كبير تحرير الصور بأسلوب الدردشة. يوفر CometAPI أيضًا أمثلة و توجيه لتجربة النموذج.
لماذا تستخدم CometAPI؟
- مفتاح API واحد للتحكم في الجميع — يبسط اختبار العديد من مقدمي الخدمة.
- قم بتبديل مقدمي الخدمة في الإنتاج إذا تغيرت الأسعار أو اتفاقيات مستوى الخدمة.
- مفيد للفرق التي تريد التحكم في مستوى الخدمة (تحديد المعدل، والتسجيل المركزي).
كيفية الاتصال بـ Nano-Banana (CometAPI) - مثال عملي
فيما يلي مثال واضح. استبدل YOUR_COMET_KEY ومسارات الملفات الخاصة بك.
CURL — تحرير أساسي (صورة + موجه → صورة محررة)
على سبيل المثال:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
**الوصف:**أولاً، قم بتحويل ملف الصورة المصدر إلى سلسلة Base64 ووضعها في inline_data.dataثانيًا، لا تقم بتضمين البادئات مثل data:image/jpeg;base64, . يقع المخرج أيضًا في candidates.content.parts ويشمل:
- جزء نص اختياري (وصف أو مطالبة).
- جزء الصورة كما
inline_data(أينdata(هو Base64 للصورة الناتجة).
إذا كنت ترغب فقط في تجربة تحرير الصور على Nano-Banana، فإن CometAPI تقدم رصيدًا مجانيًا للمستخدمين الجدد. يمكنك تجربة Nano-Banana في ساحة اللعب أو استخدام واجهة برمجة تطبيقات Gemini 2.5 Flash Image. أما إذا كنت ترغب في استخدام غير محدود، فيمكنك دفع خصم 20% على سعر Gemini.
يتمتع Nano-Banana بالعديد من المزايا الأساسية: التشابه المتسق، والتحرير المحلي المستهدف عبر اللغة الطبيعية، ودمج الصور المتعددة.
بعد ذلك، سأعرض لكم مزايا Nano-Banana من خلال العديد من حالات الاستخدام، وستشاهدون سحره.
المثال 1: دمج صور متعددة في صورة مجمعة واحدة
تحميل صورة:

مثال على وصف الإدخال: عارضة أزياء تتخذ وضعية تصوير وتتكئ على سيارة بي إم دبليو وردية. ترتدي العناصر التالية، المشهد على خلفية رمادية فاتحة. الكائن الفضائي الأخضر عبارة عن سلسلة مفاتيح متصلة بحقيبة يد وردية. العارضة تحمل أيضًا ببغاء ورديًا على كتفها. يجلس بجانبها كلب صغير من نوع باج يرتدي طوقًا ورديًا وسماعات رأس ذهبية.
تم إرجاع Base64 المحولة مرة أخرى إلى صورة:

رمز:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "A model is posing and leaning against a pink bmw. She is wearing the following items, the scene is against a light grey background. The green alien is a keychain and it's attached to the pink handbag. The model also has a pink parrot on her shoulder. There is a pug sitting next to her wearing a pink collar and gold headphones"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
ملاحظات: قم بتحويل ملف الصورة المصدر إلى سلسلة Base64 وأدخله في inline_data.data (لا تتضمن البادئات مثل data:image/jpeg;base64,).
تحليل حالة الاستخدام: باستخدام دمج الصور المتعددة، يُمكن للمصممين أن يكونوا أكثر إبداعًا. على سبيل المثال، يُمكن لمصممي المنازل دمج الصور لإنشاء عرض تقريبي للتأثير. يُمكن للمستهلكين دمج صورهم الكاملة مع الأشياء التي يرغبون في شرائها لمساعدتهم في اتخاذ قرار الشراء. يُمكن أيضًا استخدام هذا كمرجع لإنتاج الرسوم المتحركة والقصص المصورة.
المثال 2: تحرير الصور للحفاظ على التشابه
سأقدم أدناه عدة جولات من التحرير لاختبار nano banana.
أولاً، قم بتحميل الصورة:

الثاني، موجه: أضف جروًا إلى الحديقة
الإخراج:

وفي الختام موجه: استخدم الصورة المرجعية المرفقة للشخصية. حافظ على الكلب. ضع الشخصية في مشهد شارع مدينة نيون ممطر ليلاً. حافظ على تطابق ملامح الوجه مع الصورة المرجعية.

تحليل حالة الاستخدام: يمكن ملاحظة أنه يتم الحفاظ على اتساق مرتفع إلى حد ما في جولات متعددة من تعديل الصورة.
المثال 3: نقل الأسلوب وتعديل تفاصيل الوجه
تحميل صورة:

موجه: شحذ الوجه قليلاً، أضف ٦٪ من حبيبات الفيلم، ثم قص الصورة إلى ١٦:٩. لا تغير ملامح الوجه، وأضف إضاءة حافة خفيفة على الجانب الأيمن.
انتاج:

حالات استخدام أخرى لـ Nano-Banana
1) صور شخصية للشركات وصور شخصية احترافية
الاستخدام: أنشئ صورًا شخصية موحدة للعلامة التجارية بسرعة (للتسويق، لينكدإن، السير الذاتية للشركة). يحافظ Nano-Banana على دقة الوجه عند تغيير الملابس أو الخلفية أو الإضاءة.
موجه - الزي + الإضاءة (تعديل)
Edit the uploaded photo into a professional corporate headshot:
- Replace outfit with a navy single-breasted blazer and white shirt.
- Preserve face shape, eyeglasses, and expression exactly.
- Apply softbox studio lighting (slightly warm), remove harsh shadows.
- Output ratio 4:5 portrait, photorealistic, high detail.
موجه - تبديل الخلفية + التعديل
Edit the uploaded image: replace background with a clean light-gray studio backdrop, remove small blemishes, slightly sharpen eyes, and keep all facial proportions. Preserve left ear earring and hairline.
2) التجارة الإلكترونية وتصور المنتج
الاستخدام: ضع المنتجات في مشاهد نمط الحياة، أو أنشئ لقطات متسقة للمنتج من زوايا مختلفة، أو أظهر متغيرات الألوان.
موجه - المنتج في المشهد (اندماج الصور المتعددة)
Using Image A (product photo on white) and Image B (cozy living room scene), place the product on the living room coffee table with natural shadows matching the scene. Keep product scale realistic and preserve product texture and labeling.
موجه - متغيرات الألوان (تعديل)
Edit the uploaded product image: generate three color variants (forest green, deep navy, and charcoal). Keep product dimensions, seams, and label legible; output as a 3-up grid, photorealistic.
3) المحتوى الاجتماعي والتسويق المؤثر
الاستخدام: تعديلات أسلوبية سريعة، وتبادل الملابس، والتراكبات الموسمية، أو المحاصيل متعددة التنسيقات للمنصات الاجتماعية.
موجه - تعديل موسمي للخلاصة والقصة
Edit the uploaded photo: swap casual tee for a chic leather jacket, add subtle golden-hour lighting from top-left, crop a square for feed and a 9:16 vertical for story. Preserve face and sunglasses.
موجه - متغير ترويجي منمق
Edit the uploaded portrait to create a high-contrast editorial style: increase contrast moderately, add film grain, and maintain natural skin texture; preserve facial proportions and jewelry.
4) اتساق أصول الشخصية/العلامة التجارية (التعويذات، الشخصيات المتكررة)
الاستخدام: حافظ على تطابق الشعارات أو التعويذات أو الشخصيات بصريًا عبر المشاهد أو الحملات أو الحلقات.
المطالبة - إنفاذ ورقة الشخصية
Reference: character_sheet.png (attached). Key identifiers to preserve exactly across edits: warm olive skin, split-dimple on right cheek, green scarf with gold pin. Create a portrait of the character on a busy café terrace; maintain identifiers and expression.
5) إصلاح الصور التاريخية وتلوينها
الاستخدام: استعادة الصور الأرشيفية أو تلوينها مع الحفاظ على التركيبة وتفاصيل الوجه الدقيقة.
موجه - تلوين + إصلاح
Edit uploaded black-and-white photo: colorize with natural skin tones based on European 1940s palette, remove scratches and dust, repair torn left border, preserve original composition and facial proportions. Output: high-resolution TIFF-quality.
ما هي تقنيات التحفيز المتقدمة التي تزيد من الموثوقية؟
استعمل مرساة مرجعية و القيود الدقيقة
مُرسيات المرجع هي معلومات موجزة وقابلة للتحقق تُضيفها لتقليل الغموض: أسماء الملابس الدقيقة (مثل "سترة كحلية، صدر واحد، طية صدر مُشقوقة")، أو مراجع الإضاءة (مثل "إضاءة رامبرانت")، أو مصطلحات الكاميرا (مثل "عدسة بورتريه 50 مم، f/2.8"). تُحدد القيود الدقيقة للعارضة ما يجب عليها عدم تغييره (مثل "لا تُغير الوشم على الساعد الأيمن"). تُقلل هذه القيود من حرية العارضة بشكل مُثمر، وعادةً ما تُحسّن دقة النتائج.
حلقة التكرار: اسأل، قيّم، حسّن
- المرور الأول: استخدم موجهًا دقيقًا ولكن موجزًا.
- تقييم النتائج: لاحظ ما أخطأ فيه النموذج (على سبيل المثال، تغيير شكل الوجه، فقدان أحد الملحقات).
- التصحيح المستهدف: أرسل متابعة قصيرة للنتيجة السابقة ("احتفظ بكل شيء من النتيجة السابقة، مع الاحتفاظ بحلق الأذن اليسرى الأصلي وجعل الحاجبين أكثر سمكًا"). تتيح لك نقاط قوة تحرير نانو-بانانا الحوارية التعافي بسرعة.
سلسلة التحرير للتحولات المعقدة
للتحريرات الكبيرة، قسّم العمل إلى سلسلة من التحريرات الصغيرة بدلًا من تعليمة واحدة ضخمة. مثال على السلسلة: (1) تبديل الخلفية ← (2) تحديث المظهر ← (3) تصحيح الألوان ← (4) التنقيح النهائي. هذا يُبقي كل مهمة محددة مُركزة ويُقلل من التأثيرات المتداخلة غير المتوقعة.
كيف أُنظّم أسئلة نانوبانانا؟ (تشريح الأسئلة)
تتميز الصور الجيدة ببنية متسقة. استخدم ما يلي: التشريح الفوري للحصول على نتائج دقيقة وقابلة للتكرار:
التشريح الفوري (الترتيب الموصى به)
- العمل / الهدف - ماذا تريد من النموذج أن يكون؟ do؟ (على سبيل المثال، "قم بتعديل هذه الصورة الشخصية لإنشاء صورة شخصية احترافية" أو "قم بإنشاء صورة نمط حياة المنتج من خلال الجمع بين هاتين الصورتين").
- المواضيع) من أو ماذا في الصورة؟ وضّح هويته، عمره، عدد الأشخاص، العناصر، إلخ.
- السمات - الخصائص البصرية: الملابس، تعبيرات الوجه، لون العين، الشعر، الدعائم.
- البيئة والإضاءة - الموقع، والوقت من اليوم، والإضاءة المزاجية، والبعد البؤري، وتلميحات العدسة ("صورة شخصية 35 مم").
- الأسلوب واللمسة النهائية - أسلوب التصوير الفوتوغرافي (السينمائي، الاستوديو، حبيبات الفيلم، الواقعية المفرطة)، أو أسلوب الفن (الرسم الزيتي، المتجهات، القصص المصورة).
- القيود / السلامة - أي شيء يجب تجنبه (لا شعارات، لا عُري، لا نص طبي).
- رمز الاتساق (اختياري) - عبارة قصيرة يمكنك إعادة استخدامها للحفاظ على التعرف على الأحرف عبر مطالبات متعددة (على سبيل المثال، "استخدم مرجع شخصية 'وشاح لونا'").
نصائح لتحقيق اتساق الشخصية (خطوات عملية)
- استخدم "عبارة مرجعية": أدرج عبارة قصيرة وفريدة مرتبطة بالموضوع (مثل: "رمز الشخصية: 'مايا-بلو-جاكيت'") في كل موجه. سيربط النموذج التعديلات بالشخصية نفسها بشكل أكثر موثوقية إذا أعدت استخدام هذه العبارة.
- تضمين التفاصيل المثبتة: تحديد السمات المميزة غير القابلة للتغيير (على سبيل المثال، "ندبة الحاجب الأيسر، علامة خضراء على الخد الأيمن") بحيث يكون للنموذج مرساة ثابتة للحفاظ عليها.
- الحفاظ على الوضعية والتأطير عندما يكون ذلك ممكنا:إذا كنت تريد استمرارية حقيقية، فاحرص على إبقاء وصف زاوية الكاميرا/وضعيتها مشابهًا عبر المطالبات.
- ابدأ من نفس الصورة الأصليةلتحرير سير العمل، يُرجى دائمًا استخدام نفس صورة المصدر كمرساة. عند الحاجة إلى تعديل الصور، يُرجى تضمين الصورة الأصلية كمدخل إضافي وشرح عملية التحويل.
ما هي أوضاع الفشل الشائعة وكيف يمكنني إصلاحها؟
الفشل: انحراف الهوية (الموضوع يبدو مختلفًا)
السبب: لقد قام النموذج بتعميم النمط المطلوب أو تفسير القيد بشكل خاطئ.
إصلاحات: أضف شرط "الحفاظ" الصريح، أو أرفق الصورة الأصلية كمرجع، أو قم بإجراء تعديلات على خطوات أصغر وتحقق من صحة المخرجات الوسيطة.
الفشل: الدعائم أو الأيدي غير المتناسقة
السبب: كانت الأيدي والإكسسوارات الصغيرة تاريخيًا صعبة بالنسبة للعديد من عارضات الأزياء.
إصلاحات: تتضمن هذه التوصيات قيودًا دقيقة ("احتفظ بالساعة على المعصم الأيمن")، أو قم بتوفير مرجع مفصل عن قرب للعناصر الصغيرة، أو قم بتنفيذ خطوة تصحيح نهائية مستهدفة تركز فقط على العنصر الذي يسبب المشكلة.
الفشل: الإضاءة أو الظلال تبدو غير طبيعية
السبب: يمكن أن تؤدي التعديلات الكبيرة (تبديل الخلفية أو إعادة الإضاءة بشكل كبير) إلى حدوث عدم تطابق.
إصلاحات: اطلب من النموذج مطابقة "الضوء الاتجاهي من أعلى اليسار والظلال الناعمة" أو تقديم صورة مرجعية للإضاءة المطلوبة.
الخاتمة
نانو-بانانا (صورة فلاش جيميني 2.5) تُعدّ خطوةً بارزةً في مجال تحرير الصور وإنتاجها للمستهلكين: سريعة، ومتسقة، ومتكاملة مع نظام جيميني من جوجل وأدوات الأمان. أفضل النتائج تأتي من مطالبات واضحة تركز على المهمةتعليمات حفظ واضحة عند الحاجة إلى اتساق الهوية، وسير عمل مرحلي يفصل المعاينات السريعة عن العروض النهائية. مع تطور النموذج والنظام البيئي، ينبغي على مهندسي التطوير مواصلة الاختبار، وتسجيل النتائج، وإنشاء عناصر تحكم سهلة الاستخدام تجعل التحرير شفافًا وقابلًا للعكس.


