Полное руководство по нано-банану: как использовать и как выбрать лучший вариант

CometAPI
AnnaSep 8, 2025
Полное руководство по нано-банану: как использовать и как выбрать лучший вариант

Недавний релиз Google Флэш-изображение Gemini 2.5 — прозванное «Нано-бананом» быстро стал незаменимым инструментом для диалогового редактирования изображений: он обеспечивает единообразие сходств между редактированием, аккуратно объединяет несколько изображений и поддерживает очень естественное локальное редактирование с помощью подсказок. Ниже я расскажу, что такое Nano Banana, как использовать его через Близнецы от Google и с помощью сторонний доступ (например, CometAPI), приведите конкретные примеры подсказок и код, который можно использовать в проекте, а также поделитесь советами разработчика по многооборотному редактированию, масштабированию и расширенным подсказкам. Я пишу это как разработчик, ежедневно использующий модели изображений — считайте это практическим, слегка субъективным руководством.

Что такое Нано-Банан?

Что на самом деле означает «Gemini 2.5 Flash Image / Nano-Banana»?

Нано-Банан это прозвище сообщества / кодовое имя для Флэш-изображение Gemini 2.5, новейшая модель создания и редактирования изображений от Google DeepMind. Она разработана для подсказка-первый редактирование (вы даете ему инструкции на естественном языке) с особым акцентом на постоянство характера (сохранение одного и того же человека/питомца/объекта на всех этапах редактирования), слияние нескольких изображений (смешивание объектов на исходных фотографиях) и интерактивное использование с малой задержкой в ​​таких приложениях, как Gemini и Google AI Studio. Модель доступна через API Gemini от Google, AI Studio и уже представлена ​​в CometAPI.

Как разработчик, думайте о Nano-Banana не как о чистом генераторе изображений «с нуля», а как о высокоэффективном помощник по редактированию фотографий и композиции: он понимает содержание изображения, запоминает объект при редактировании и реагирует на инструкции на естественном языке, подстраиваясь под быстрый цикл итеративного дизайна. Это делает его особенно полезным для макетов продуктов, создания единообразных кадров персонажей, быстрых итераций концепций и социальных творческих игр.

резюме для разработчиков

  • Название модели: gemini-2.5-flash-image-preview / gemini-2.5-flash-image.
  • Последовательность и непрерывность: Nano-Banana сохраняет детали персонажей при каждом редактировании надежнее, чем многие конкуренты, что делает ее предпочтительной для последовательного редактирования и повествования.
  • Скорость. Пользователи отмечают быструю генерацию — зачастую менее 10 секунд для большого количества правок — что полезно для итеративных рабочих процессов.
  • Редактирование дизайна в первую очередь: В то время как многие модели оптимизированы для генерации исключительно на основе текста, UX и API Nano-Banana делают упор на редактирование (однократное редактирование, слияние нескольких изображений, перенос стилей).

Как можно редактировать с помощью Nano-Banana на CometAPI?

CometAPI — это рынок/оболочка API, объединяющая множество моделей (включая API изображений Flash Gemini 2.5 (Nano Banana)) за одной конечной точкой, совместимой с OpenAI. Если вы хотите быстро создать прототип или избежать подготовки учётных записей Google Cloud/Vertex для первого тестирования, CometAPI — это практичный мост: вы получаете ключ API, выбираете gemini-2.5-flash-image (или gemini-2.5-flash-image-preview ), а затем отправлять запросы, похожие на запросы на редактирование изображений в стиле чата. CometAPI также предлагает примеры и инструкция чтобы опробовать модель.

Зачем использовать CometAPI?

  • Один ключ API для управления всеми — упрощает тестирование нескольких поставщиков.
  • При изменении цен или соглашений об уровне обслуживания меняйте поставщиков в процессе производства.
  • Полезно для команд, которым необходим контроль уровня обслуживания (ограничение скорости, централизованное ведение журнала).

Как вызвать Nano-Banana (CometAPI) — практический пример

Ниже представлен простой пример. Заменить YOUR_COMET_KEY и пути к файлам укажите свои собственные.

CURL — базовое редактирование (изображение + подсказка → отредактированное изображение)

Это критически важно для анализа и выбора наиболее эффективных ключевых слов для улучшения рейтинга вашего сайта.

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

**Описание:**Сначала преобразуйте исходный файл изображения в строку Base64 и поместите его в inline_data.dataВо-вторых, не используйте префиксы типа data:image/jpeg;base64, . Выход также находится в candidates.content.parts и включает в себя:

  • Необязательная текстовая часть (описание или подсказка).
  • Часть изображения как inline_data (где data (это Base64 выходного изображения).

Если вы просто хотите попробовать редактирование изображений на Nano-Banana, CometAPI предлагает бесплатные кредиты новым пользователям. Вы можете попробовать Nano-Banana в игровой зоне или использовать Gemini 2.5 Flash Image API. Однако, если вы хотите использовать неограниченное количество инструментов, вы можете получить скидку 20% на Gemini.

У Nano-Banana есть несколько основных преимуществ: постоянное сходство, целевые локальные правки с помощью естественного языка и слияние нескольких изображений.

Далее я покажу преимущества Nano-Banana на примере нескольких вариантов его использования, и вы увидите его волшебство.

Пример 1: объединение нескольких изображений в один коллаж

Загрузить изображение:

Полное руководство по нано-банану: как использовать и как выбрать лучший вариант

Пример описания ввода: Модель позирует, прислонившись к розовому BMW. На ней надеты следующие предметы одежды, сцена происходит на светло-сером фоне. Зелёный инопланетянин — это брелок, прикреплённый к розовой сумочке. На плече модели также сидит розовый попугай. Рядом с ней сидит мопс в розовом ошейнике и золотых наушниках.

Возвращенный Base64 преобразован обратно в изображение:

Полное руководство по нано-банану: как использовать и как выбрать лучший вариант

Код:

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "A model is posing and leaning against a pink bmw. She is wearing the following items, the scene is against a light grey background. The green alien is a keychain and it's attached to the pink handbag. The model also has a pink parrot on her shoulder. There is a pug sitting next to her wearing a pink collar and gold headphones"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

Примечания: преобразуйте исходный файл изображения в строку Base64 и вставьте его в inline_data.data (не включайте префиксы типа data:image/jpeg;base64,).

Анализ вариантов использования: Используя слияние нескольких изображений, дизайнеры могут раскрыть свой творческий потенциал. Например, дизайнеры интерьеров могут комбинировать изображения, чтобы создать черновой вариант эффекта. Потребители могут сопоставлять свои изображения в полный рост с теми вещами, которые они хотят купить, чтобы определиться с покупкой. Это также можно использовать в качестве ориентира для анимации и создания комиксов.

Пример 2: Редактирование изображений для сохранения сходства

Ниже я представлю несколько раундов редактирования для тестирования нано-банана.

Сначала загрузите изображение:

Полное руководство по нано-банану: как использовать и как выбрать лучший вариант

Второе подскажите: Добавьте щенка на лужайку

Выход:

Полное руководство по нано-банану: как использовать и как выбрать лучший вариант

Наконец, подскажите: Используйте приложенное изображение персонажа. Сохраните собаку. Поместите персонажа на улицу дождливого неонового города ночью. Сохраните черты лица, как на референсе.

Полное руководство по нано-банану: как использовать и как выбрать лучший вариант

Анализ вариантов использования: Видно, что при многократном изменении изображения сохраняется достаточно высокая согласованность.

Пример 3: Перенос стиля и изменение деталей лица

Загрузить изображение:

Полное руководство по нано-банану: как использовать и как выбрать лучший вариант

подскажите: Слегка увеличьте резкость лица, добавьте зернистость плёнки 6%, обрежьте до 16:9. Не изменяйте черты лица, добавьте лёгкий контурный свет с правой стороны.

вывод:

Полное руководство по нано-банану: как использовать и как выбрать лучший вариант

Другие варианты использования Nano-Banana

1) Корпоративные портреты и профессиональные портреты

Применение: быстрое создание единообразных фирменных портретов (маркетинг, LinkedIn, биографии компаний). Nano-Banana сохраняет точность изображения лица при смене одежды, фона или освещения.

Подсказка — наряд + освещение (редактировать)

Edit the uploaded photo into a professional corporate headshot:
- Replace outfit with a navy single-breasted blazer and white shirt.
- Preserve face shape, eyeglasses, and expression exactly.
- Apply softbox studio lighting (slightly warm), remove harsh shadows.
- Output ratio 4:5 portrait, photorealistic, high detail.

Подсказка — замена фона + ретушь

Edit the uploaded image: replace background with a clean light-gray studio backdrop, remove small blemishes, slightly sharpen eyes, and keep all facial proportions. Preserve left ear earring and hairline.

2) Электронная коммерция и визуализация продуктов

Использование: размещайте продукты в сценах повседневной жизни, создавайте последовательные снимки продуктов с разных ракурсов или показывайте варианты цветов.

Подсказка — продукт в кадре (объединение нескольких изображений)

Using Image A (product photo on white) and Image B (cozy living room scene), place the product on the living room coffee table with natural shadows matching the scene. Keep product scale realistic and preserve product texture and labeling.

Подсказка — варианты цвета (редактировать)

Edit the uploaded product image: generate three color variants (forest green, deep navy, and charcoal). Keep product dimensions, seams, and label legible; output as a 3-up grid, photorealistic.

3) Социальный контент и маркетинг влияния

Применение: быстрое стилистическое редактирование, смена нарядов, сезонные наложения или многоформатная обрезка для социальных платформ.

Подсказка — сезонное редактирование ленты и истории

Edit the uploaded photo: swap casual tee for a chic leather jacket, add subtle golden-hour lighting from top-left, crop a square for feed and a 9:16 vertical for story. Preserve face and sunglasses.

Prompt — стилизованный промо-вариант

Edit the uploaded portrait to create a high-contrast editorial style: increase contrast moderately, add film grain, and maintain natural skin texture; preserve facial proportions and jewelry.

4) Согласованность персонажей и активов бренда (талисманы, повторяющиеся персонажи)

Использование: сохраняйте визуальную идентичность логотипов, талисманов или персонажей во всех сценах, кампаниях или эпизодах.

Подсказка — соблюдение листа персонажа

Reference: character_sheet.png (attached). Key identifiers to preserve exactly across edits: warm olive skin, split-dimple on right cheek, green scarf with gold pin. Create a portrait of the character on a busy café terrace; maintain identifiers and expression.

5) Восстановление и раскрашивание исторических фотографий

Применение: восстановление или раскрашивание архивных изображений с сохранением композиции и мелких деталей лица.

Подскажите — раскрасить + починить

Edit uploaded black-and-white photo: colorize with natural skin tones based on European 1940s palette, remove scratches and dust, repair torn left border, preserve original composition and facial proportions. Output: high-resolution TIFF-quality.

Какие передовые методы подсказок повышают надежность?

Используйте справочные якоря и микроограничения

Референсные точки — это краткие, проверяемые фрагменты информации, которые вы добавляете для устранения двусмысленности: точные названия одежды («тёмно-синий блейзер, однобортный, с острыми лацканами»), ссылки на освещение («Рембрандтовское освещение») или термины, связанные с камерой («портретный объектив 50 мм, f/2.8»). Микроограничения сообщают модели, что она не должна менять (например, «не меняйте татуировки на правом предплечье»). Они ограничивают свободу модели в продуктивном смысле и, как правило, повышают точность результата.

Итерационный цикл: спросить, оценить, уточнить

  1. Первый проход: используйте точную, но лаконичную подсказку.
  2. Оцените результаты: отметьте, в чем модель ошиблась (например, изменила форму лица, потеряла аксессуар).
  3. Целенаправленная коррекция: Отправьте короткую подсказку, ссылающуюся на предыдущий результат («Сохранить всё из предыдущего результата, но оставить оригинальную серёжку в левом ухе и сделать брови гуще»). Возможности Nano-Banana в области разговорного редактирования позволят вам быстро восстановиться.

Цепочка правок для сложных преобразований

Для крупных правок разбейте работу на цепочку более мелких правок, а не на одну большую инструкцию. Пример цепочки: (1) замена фона → (2) обновление наряда → (3) цветокоррекция → (4) финальная ретушь. Это позволяет сохранить целостность каждого запроса и избежать непредвиденных перекрёстных эффектов.

Как следует структурировать подсказки для игры «Нано-Банан»? (Анатомия подсказок)

Хорошие изображения-подсказки имеют последовательную структуру. Используйте следующее: быстрая анатомия для получения точных, повторяемых результатов:

Быстрая анатомия (рекомендуемый порядок)

  1. Действие/Цель — что вы хотите, чтобы модель do? (например, «Отредактируйте это селфи, чтобы создать профессиональный портрет» или «Создайте фотографию образа жизни продукта, объединив эти два изображения»).
  2. Предметы) — кто или что изображено на изображении? Укажите точную личность, возраст, количество людей, предметов и т. д.
  3. Атрибуты — визуальные характеристики: одежда, мимика, цвет глаз, волосы, реквизит.
  4. Окружающая среда и освещение — местоположение, время суток, атмосферное освещение, фокусное расстояние, подсказки по объективу («35 мм портрет»).
  5. Стиль и отделка — фотографический стиль (кинематографический, студийный, зернистость пленки, гиперреальный) или художественный стиль (масляная живопись, векторный, комикс).
  6. Ограничения/Безопасность — все, чего следует избегать (никаких логотипов, никакой наготы, никакого медицинского текста).
  7. Токен согласованности (необязательно) — короткая фраза, которую вы используете повторно для поддержания узнаваемости персонажа в нескольких подсказках (например, «Используйте ссылку на персонажа «Лунный шарф»»).

Советы по обеспечению последовательности персонажей (практические шаги)

  • Используйте «справочную фразу»: включайте в каждую подсказку короткую уникальную фразу, связанную с темой (например, «маркер персонажа: „Майя-синяя-куртка“»). Модель будет более надёжно связывать правки с одним и тем же персонажем, если вы будете использовать эту фразу повторно.
  • Включить закрепленные детали: укажите отличительные, неизменные черты (например, «шрам на левой брови, зеленое родимое пятно на правой щеке»), чтобы модель имела фиксированные якоря для поддержания.
  • По возможности сохраняйте позу и кадрирование.: если вы хотите настоящую последовательность, сохраняйте одинаковое описание ракурса/позы камеры во всех подсказках.
  • Начните с того же исходного изображения: для рабочих процессов редактирования всегда предоставляйте то же исходное изображение, что и в качестве опорного. Если вам необходимо изменить фотографии, включите исходное изображение в качестве дополнительных входных данных и объясните процесс преобразования.

Каковы распространенные виды неисправностей и как их устранить?

Неудача: дрейф идентичности (субъект выглядит по-другому)

Причина: модель чрезмерно обобщила запрошенный стиль или неверно истолковала ограничение.
Исправления: добавьте явное предложение «сохранить», прикрепите исходное изображение в качестве ссылки или выполняйте редактирование небольшими шагами и проверяйте промежуточные результаты.

Неудача: несоответствие опор или рук

Причина: Руки и мелкие аксессуары исторически являются сложными для многих моделей.
Исправления: включите микроограничения («сохраните часы на правом запястье»), предоставьте подробные крупные планы мелких предметов или выполните последний этап целенаправленной коррекции, сосредоточившись только на проблемном элементе.

Неудача: освещение или тени выглядят неестественно.

Причина: значительные изменения (замена фона или существенное изменение освещения) могут привести к несоответствиям.
Исправления: попросите модель подобрать «направленный свет сверху слева, мягкие тени» или предоставить желаемое эталонное изображение освещения.

Заключение

Nano-Banana (Gemini 2.5 Flash Image) — это заметный шаг вперёд в области редактирования и создания изображений потребительского уровня: быстрое, стабильное и интегрированное с экосистемой Gemini от Google и инструментами безопасности. Наилучшие результаты достигаются с помощью четкие, ориентированные на задачу подсказки, четкие инструкции по сохранению, когда требуется согласованность идентичности, и поэтапные рабочие процессы, отделяющие быстрый предварительный просмотр от финального рендеринга. По мере развития модели и экосистемы инженеры по подсказкам должны продолжать тестирование, регистрировать результаты и создавать пользовательские элементы управления, которые делают редактирование прозрачным и обратимым.

Читать далее

500+ моделей в одном API

Скидка до 20%