Недавний релиз Google Флэш-изображение Gemini 2.5 — прозванное «Нано-бананом» быстро стал незаменимым инструментом для диалогового редактирования изображений: он обеспечивает единообразие сходств между редактированием, аккуратно объединяет несколько изображений и поддерживает очень естественное локальное редактирование с помощью подсказок. Ниже я расскажу, что такое Nano Banana, как использовать его через Близнецы от Google и с помощью сторонний доступ (например, CometAPI), приведите конкретные примеры подсказок и код, который можно использовать в проекте, а также поделитесь советами разработчика по многооборотному редактированию, масштабированию и расширенным подсказкам. Я пишу это как разработчик, ежедневно использующий модели изображений — считайте это практическим, слегка субъективным руководством.
Что такое Нано-Банан?
Что на самом деле означает «Gemini 2.5 Flash Image / Nano-Banana»?
Нано-Банан это прозвище сообщества / кодовое имя для Флэш-изображение Gemini 2.5, новейшая модель создания и редактирования изображений от Google DeepMind. Она разработана для подсказка-первый редактирование (вы даете ему инструкции на естественном языке) с особым акцентом на постоянство характера (сохранение одного и того же человека/питомца/объекта на всех этапах редактирования), слияние нескольких изображений (смешивание объектов на исходных фотографиях) и интерактивное использование с малой задержкой в таких приложениях, как Gemini и Google AI Studio. Модель доступна через API Gemini от Google, AI Studio и уже представлена в CometAPI.
Как разработчик, думайте о Nano-Banana не как о чистом генераторе изображений «с нуля», а как о высокоэффективном помощник по редактированию фотографий и композиции: он понимает содержание изображения, запоминает объект при редактировании и реагирует на инструкции на естественном языке, подстраиваясь под быстрый цикл итеративного дизайна. Это делает его особенно полезным для макетов продуктов, создания единообразных кадров персонажей, быстрых итераций концепций и социальных творческих игр.
резюме для разработчиков
- Название модели: gemini-2.5-flash-image-preview / gemini-2.5-flash-image.
- Последовательность и непрерывность: Nano-Banana сохраняет детали персонажей при каждом редактировании надежнее, чем многие конкуренты, что делает ее предпочтительной для последовательного редактирования и повествования.
- Скорость. Пользователи отмечают быструю генерацию — зачастую менее 10 секунд для большого количества правок — что полезно для итеративных рабочих процессов.
- Редактирование дизайна в первую очередь: В то время как многие модели оптимизированы для генерации исключительно на основе текста, UX и API Nano-Banana делают упор на редактирование (однократное редактирование, слияние нескольких изображений, перенос стилей).
Как можно редактировать с помощью Nano-Banana на CometAPI?
CometAPI — это рынок/оболочка API, объединяющая множество моделей (включая API изображений Flash Gemini 2.5 (Nano Banana)) за одной конечной точкой, совместимой с OpenAI. Если вы хотите быстро создать прототип или избежать подготовки учётных записей Google Cloud/Vertex для первого тестирования, CometAPI — это практичный мост: вы получаете ключ API, выбираете gemini-2.5-flash-image (или gemini-2.5-flash-image-preview ), а затем отправлять запросы, похожие на запросы на редактирование изображений в стиле чата. CometAPI также предлагает примеры и инструкция чтобы опробовать модель.
Зачем использовать CometAPI?
- Один ключ API для управления всеми — упрощает тестирование нескольких поставщиков.
- При изменении цен или соглашений об уровне обслуживания меняйте поставщиков в процессе производства.
- Полезно для команд, которым необходим контроль уровня обслуживания (ограничение скорости, централизованное ведение журнала).
Как вызвать Nano-Banana (CometAPI) — практический пример
Ниже представлен простой пример. Заменить YOUR_COMET_KEY и пути к файлам укажите свои собственные.
CURL — базовое редактирование (изображение + подсказка → отредактированное изображение)
Это критически важно для анализа и выбора наиболее эффективных ключевых слов для улучшения рейтинга вашего сайта.
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
**Описание:**Сначала преобразуйте исходный файл изображения в строку Base64 и поместите его в inline_data.dataВо-вторых, не используйте префиксы типа data:image/jpeg;base64, . Выход также находится в candidates.content.parts и включает в себя:
- Необязательная текстовая часть (описание или подсказка).
- Часть изображения как
inline_data(гдеdata(это Base64 выходного изображения).
Если вы просто хотите попробовать редактирование изображений на Nano-Banana, CometAPI предлагает бесплатные кредиты новым пользователям. Вы можете попробовать Nano-Banana в игровой зоне или использовать Gemini 2.5 Flash Image API. Однако, если вы хотите использовать неограниченное количество инструментов, вы можете получить скидку 20% на Gemini.
У Nano-Banana есть несколько основных преимуществ: постоянное сходство, целевые локальные правки с помощью естественного языка и слияние нескольких изображений.
Далее я покажу преимущества Nano-Banana на примере нескольких вариантов его использования, и вы увидите его волшебство.
Пример 1: объединение нескольких изображений в один коллаж
Загрузить изображение:

Пример описания ввода: Модель позирует, прислонившись к розовому BMW. На ней надеты следующие предметы одежды, сцена происходит на светло-сером фоне. Зелёный инопланетянин — это брелок, прикреплённый к розовой сумочке. На плече модели также сидит розовый попугай. Рядом с ней сидит мопс в розовом ошейнике и золотых наушниках.
Возвращенный Base64 преобразован обратно в изображение:

Код:
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "A model is posing and leaning against a pink bmw. She is wearing the following items, the scene is against a light grey background. The green alien is a keychain and it's attached to the pink handbag. The model also has a pink parrot on her shoulder. There is a pug sitting next to her wearing a pink collar and gold headphones"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
Примечания: преобразуйте исходный файл изображения в строку Base64 и вставьте его в inline_data.data (не включайте префиксы типа data:image/jpeg;base64,).
Анализ вариантов использования: Используя слияние нескольких изображений, дизайнеры могут раскрыть свой творческий потенциал. Например, дизайнеры интерьеров могут комбинировать изображения, чтобы создать черновой вариант эффекта. Потребители могут сопоставлять свои изображения в полный рост с теми вещами, которые они хотят купить, чтобы определиться с покупкой. Это также можно использовать в качестве ориентира для анимации и создания комиксов.
Пример 2: Редактирование изображений для сохранения сходства
Ниже я представлю несколько раундов редактирования для тестирования нано-банана.
Сначала загрузите изображение:

Второе подскажите: Добавьте щенка на лужайку
Выход:

Наконец, подскажите: Используйте приложенное изображение персонажа. Сохраните собаку. Поместите персонажа на улицу дождливого неонового города ночью. Сохраните черты лица, как на референсе.

Анализ вариантов использования: Видно, что при многократном изменении изображения сохраняется достаточно высокая согласованность.
Пример 3: Перенос стиля и изменение деталей лица
Загрузить изображение:

подскажите: Слегка увеличьте резкость лица, добавьте зернистость плёнки 6%, обрежьте до 16:9. Не изменяйте черты лица, добавьте лёгкий контурный свет с правой стороны.
вывод:

Другие варианты использования Nano-Banana
1) Корпоративные портреты и профессиональные портреты
Применение: быстрое создание единообразных фирменных портретов (маркетинг, LinkedIn, биографии компаний). Nano-Banana сохраняет точность изображения лица при смене одежды, фона или освещения.
Подсказка — наряд + освещение (редактировать)
Edit the uploaded photo into a professional corporate headshot:
- Replace outfit with a navy single-breasted blazer and white shirt.
- Preserve face shape, eyeglasses, and expression exactly.
- Apply softbox studio lighting (slightly warm), remove harsh shadows.
- Output ratio 4:5 portrait, photorealistic, high detail.
Подсказка — замена фона + ретушь
Edit the uploaded image: replace background with a clean light-gray studio backdrop, remove small blemishes, slightly sharpen eyes, and keep all facial proportions. Preserve left ear earring and hairline.
2) Электронная коммерция и визуализация продуктов
Использование: размещайте продукты в сценах повседневной жизни, создавайте последовательные снимки продуктов с разных ракурсов или показывайте варианты цветов.
Подсказка — продукт в кадре (объединение нескольких изображений)
Using Image A (product photo on white) and Image B (cozy living room scene), place the product on the living room coffee table with natural shadows matching the scene. Keep product scale realistic and preserve product texture and labeling.
Подсказка — варианты цвета (редактировать)
Edit the uploaded product image: generate three color variants (forest green, deep navy, and charcoal). Keep product dimensions, seams, and label legible; output as a 3-up grid, photorealistic.
3) Социальный контент и маркетинг влияния
Применение: быстрое стилистическое редактирование, смена нарядов, сезонные наложения или многоформатная обрезка для социальных платформ.
Подсказка — сезонное редактирование ленты и истории
Edit the uploaded photo: swap casual tee for a chic leather jacket, add subtle golden-hour lighting from top-left, crop a square for feed and a 9:16 vertical for story. Preserve face and sunglasses.
Prompt — стилизованный промо-вариант
Edit the uploaded portrait to create a high-contrast editorial style: increase contrast moderately, add film grain, and maintain natural skin texture; preserve facial proportions and jewelry.
4) Согласованность персонажей и активов бренда (талисманы, повторяющиеся персонажи)
Использование: сохраняйте визуальную идентичность логотипов, талисманов или персонажей во всех сценах, кампаниях или эпизодах.
Подсказка — соблюдение листа персонажа
Reference: character_sheet.png (attached). Key identifiers to preserve exactly across edits: warm olive skin, split-dimple on right cheek, green scarf with gold pin. Create a portrait of the character on a busy café terrace; maintain identifiers and expression.
5) Восстановление и раскрашивание исторических фотографий
Применение: восстановление или раскрашивание архивных изображений с сохранением композиции и мелких деталей лица.
Подскажите — раскрасить + починить
Edit uploaded black-and-white photo: colorize with natural skin tones based on European 1940s palette, remove scratches and dust, repair torn left border, preserve original composition and facial proportions. Output: high-resolution TIFF-quality.
Какие передовые методы подсказок повышают надежность?
Используйте справочные якоря и микроограничения
Референсные точки — это краткие, проверяемые фрагменты информации, которые вы добавляете для устранения двусмысленности: точные названия одежды («тёмно-синий блейзер, однобортный, с острыми лацканами»), ссылки на освещение («Рембрандтовское освещение») или термины, связанные с камерой («портретный объектив 50 мм, f/2.8»). Микроограничения сообщают модели, что она не должна менять (например, «не меняйте татуировки на правом предплечье»). Они ограничивают свободу модели в продуктивном смысле и, как правило, повышают точность результата.
Итерационный цикл: спросить, оценить, уточнить
- Первый проход: используйте точную, но лаконичную подсказку.
- Оцените результаты: отметьте, в чем модель ошиблась (например, изменила форму лица, потеряла аксессуар).
- Целенаправленная коррекция: Отправьте короткую подсказку, ссылающуюся на предыдущий результат («Сохранить всё из предыдущего результата, но оставить оригинальную серёжку в левом ухе и сделать брови гуще»). Возможности Nano-Banana в области разговорного редактирования позволят вам быстро восстановиться.
Цепочка правок для сложных преобразований
Для крупных правок разбейте работу на цепочку более мелких правок, а не на одну большую инструкцию. Пример цепочки: (1) замена фона → (2) обновление наряда → (3) цветокоррекция → (4) финальная ретушь. Это позволяет сохранить целостность каждого запроса и избежать непредвиденных перекрёстных эффектов.
Как следует структурировать подсказки для игры «Нано-Банан»? (Анатомия подсказок)
Хорошие изображения-подсказки имеют последовательную структуру. Используйте следующее: быстрая анатомия для получения точных, повторяемых результатов:
Быстрая анатомия (рекомендуемый порядок)
- Действие/Цель — что вы хотите, чтобы модель do? (например, «Отредактируйте это селфи, чтобы создать профессиональный портрет» или «Создайте фотографию образа жизни продукта, объединив эти два изображения»).
- Предметы) — кто или что изображено на изображении? Укажите точную личность, возраст, количество людей, предметов и т. д.
- Атрибуты — визуальные характеристики: одежда, мимика, цвет глаз, волосы, реквизит.
- Окружающая среда и освещение — местоположение, время суток, атмосферное освещение, фокусное расстояние, подсказки по объективу («35 мм портрет»).
- Стиль и отделка — фотографический стиль (кинематографический, студийный, зернистость пленки, гиперреальный) или художественный стиль (масляная живопись, векторный, комикс).
- Ограничения/Безопасность — все, чего следует избегать (никаких логотипов, никакой наготы, никакого медицинского текста).
- Токен согласованности (необязательно) — короткая фраза, которую вы используете повторно для поддержания узнаваемости персонажа в нескольких подсказках (например, «Используйте ссылку на персонажа «Лунный шарф»»).
Советы по обеспечению последовательности персонажей (практические шаги)
- Используйте «справочную фразу»: включайте в каждую подсказку короткую уникальную фразу, связанную с темой (например, «маркер персонажа: „Майя-синяя-куртка“»). Модель будет более надёжно связывать правки с одним и тем же персонажем, если вы будете использовать эту фразу повторно.
- Включить закрепленные детали: укажите отличительные, неизменные черты (например, «шрам на левой брови, зеленое родимое пятно на правой щеке»), чтобы модель имела фиксированные якоря для поддержания.
- По возможности сохраняйте позу и кадрирование.: если вы хотите настоящую последовательность, сохраняйте одинаковое описание ракурса/позы камеры во всех подсказках.
- Начните с того же исходного изображения: для рабочих процессов редактирования всегда предоставляйте то же исходное изображение, что и в качестве опорного. Если вам необходимо изменить фотографии, включите исходное изображение в качестве дополнительных входных данных и объясните процесс преобразования.
Каковы распространенные виды неисправностей и как их устранить?
Неудача: дрейф идентичности (субъект выглядит по-другому)
Причина: модель чрезмерно обобщила запрошенный стиль или неверно истолковала ограничение.
Исправления: добавьте явное предложение «сохранить», прикрепите исходное изображение в качестве ссылки или выполняйте редактирование небольшими шагами и проверяйте промежуточные результаты.
Неудача: несоответствие опор или рук
Причина: Руки и мелкие аксессуары исторически являются сложными для многих моделей.
Исправления: включите микроограничения («сохраните часы на правом запястье»), предоставьте подробные крупные планы мелких предметов или выполните последний этап целенаправленной коррекции, сосредоточившись только на проблемном элементе.
Неудача: освещение или тени выглядят неестественно.
Причина: значительные изменения (замена фона или существенное изменение освещения) могут привести к несоответствиям.
Исправления: попросите модель подобрать «направленный свет сверху слева, мягкие тени» или предоставить желаемое эталонное изображение освещения.
Заключение
Nano-Banana (Gemini 2.5 Flash Image) — это заметный шаг вперёд в области редактирования и создания изображений потребительского уровня: быстрое, стабильное и интегрированное с экосистемой Gemini от Google и инструментами безопасности. Наилучшие результаты достигаются с помощью четкие, ориентированные на задачу подсказки, четкие инструкции по сохранению, когда требуется согласованность идентичности, и поэтапные рабочие процессы, отделяющие быстрый предварительный просмотр от финального рендеринга. По мере развития модели и экосистемы инженеры по подсказкам должны продолжать тестирование, регистрировать результаты и создавать пользовательские элементы управления, которые делают редактирование прозрачным и обратимым.
