Как использовать API Nano Banana 2

CometAPI
AnnaFeb 27, 2026
Как использовать API Nano Banana 2

Nano Banana 2 — сокращение, которое сообщество использует для обозначения новейшей модели генерации изображений Google в семействе Gemini, — быстро изменил ожидания от быстрой, высокоточной генерации и редактирования изображений. Запущенная в конце февраля 2026 года, эта вариация «Flash Image» (Gemini 3.1 Flash Image / Nano Banana 2) ориентирована на разработчиков и продуктовые команды, которым нужен профессиональный уровень результата при высокой пропускной способности и низкой задержке. В этой статье я объединяю последние репортажи и документацию, чтобы объяснить, что такое Nano Banana 2, как он показывает себя в бенчмарках, как получить к нему доступ и вызывать (включая через сторонние шлюзы вроде CometAPI), а также практические шаблоны промптов и сценарии использования для продакшена.

CometAPI предоставляет единый интерфейс в стиле HTTP, который открывает доступ ко многим моделям (включая модели изображений) через единообразные эндпоинты. Nano Banana 2 (Gemini 3.1 Image) уже доступен в CometAPI.

What is Nano Banana 2?

Nano Banana 2 (внутренне соответствует Gemini 3.1 Flash Image) — специализированная, высокоэффективная модель генерации изображений от Google, которая делает упор на скорость, более низкую стоимость на изображение и более сильное следование инструкциям для творческих и редакторских задач. Она спроектирована как дополнение к более высокоточным вариантам «Pro»: Nano Banana 2 для высокой производительности и Nano Banana Pro (Gemini 3 Pro Image) для премиальных, «asset-grade» результатов.

Она предназначена для обеспечения:

  • Быстрого инференса (нацелена на очень низкую задержку, чтобы генерация и правки изображений ощущались почти мгновенно).
  • Высокого визуального качества, приближающегося к семейству «Pro», но при меньших вычислительных затратах/стоимости.
  • Лучшего следования инструкциям (более точная отрисовка запрошенных объектов, текста в изображении и многоперсонажных сцен).
  • Широкой поддержки разрешений и соотношений сторон, от быстрых небольших превью до нативных 2K/4K конвейеров для финальных ассетов.

What makes Nano Banana 2 different from the original Nano Banana / Pro?

  • Архитектура / движок: Построена на Flash-стеке инференса Gemini (Gemini 3.1 Flash Image), поэтому часть максимальных настроек качества обменена на резкий выигрыш в скорости и стоимости.
  • Сценарии использования: Идеальна для крупномасштабной автоматизации (маркетинговые ассеты, превью, UI), почти-реального времени при редактировании и процессов, где важны задержка и стоимость, но необходима точность элементов на уровне Pro.

Benchmark Performance of Nano Banana 2

Как использовать API Nano Banana 2

Consistent Across Categories

Gemini 3.1 Flash Image демонстрирует измеримые улучшения во всех заявленных категориях по сравнению с Gemini 2.5 Flash.

Strongest Gains

  • Визуальное качество
  • Композиционное редактирование с несколькими входными данными
  • Общая устойчивость/надёжность редактирования

Competitive Positioning

  • Лидирует во внутреннем GenAI-Bench по общему предпочтению.
  • Превосходит GPT-Image 1.5 по совокупным и визуальным метрикам.
  • Незначительные пошаговые улучшения указывают на архитектурную доводку, а не на радикальный сдвиг.

How can I access Nano Banana 2?

Where it’s available

Nano Banana 2 доступна через инструменты Google Gemini (приложение Gemini), Gemini API (документирован в разделе для разработчиков Google AI) и выводится через корпоративные облачные продукты, такие как Vertex AI, для предпросмотра/корпоративных интеграций. CometAPI также объявили поддержку и обёртки для упрощения интеграции.

How to Use Nano Banana 2 API (cometapi): what are the options?

Руководство CometAPI использует форму в стиле Gemini generateContent и возвращает изображения в Base64 в candidates[0].content.parts[].inline_data.data. Вы должны декодировать этот Base64, чтобы сохранить файл на стороне клиента. Вам нужно лишь заменить https: //generativelanguage.googleapis.com на https://api.cometapi.com . Возвращаемое изображение обычно предоставляется как Base64-кодированный inline_data. Его необходимо декодировать на стороне клиента и сохранить как файл. CometAPI предоставляет скидки, помогая использовать API Nano Banana 2.

CometAPI предлагает унифицированную REST-обёртку и явные эндпоинты для моделей Gemini — удобно, если вам нужен единый ключ и возможность переключаться между провайдерами без изменений в приложении. Для Nano Banana 2 на странице CometAPI есть готовый пример curl для их эндпоинта gemini-3.1-flash-image-preview:generateContent. Ниже приведён упрощённый пример curl на основе документации CometAPI.

Prerequisites for Using Nano Banana 2 via CometAPI

CometAPI Account & API Key: Создайте аккаунт на CometAPI и сгенерируйте ключ доступа к API (sk-…). Этот ключ используется для аутентификации всех запросов к эндпоинтам CometAPI.

Programming Languages & Runtimes:

  • Node.js 18+ (для JavaScript/TypeScript)
  • Python 3.10+
  • (или любой язык, способный выполнять HTTP-запросы)

HTTP Tools or SDKs:

  • Для JavaScript: fetch, axios или клиент, совместимый с OpenAI
  • Для Python: requests, httpx или клиент OpenAI
  • Эти инструменты помогают отправлять API-запросы и обрабатывать ответы.

Quick overview of the request pattern

  • Base URL: https://api.cometapi.com (база CometAPI).
  • Model names: gemini-3.1-flash-image-preview (Nano Banana 2 / gemini 3.1 Flash Image) или gemini-2.5-flash-image в зависимости от доступности.
  • Auth: заголовок Authorization: sk-xxxx — CometAPI обычно использует ключи в стиле sk-.
  • Response: изображения возвращаются в Base64 в response.candidates[0].content.parts[].inline_data.data. Декодируйте и сохраните на диск.

Example Workflow (High-Level)

  1. Получите ключ API в CometAPI.
  2. Выберите идентификатор модели (например, gemini-3.1-flash-image или похожий, в зависимости от доступности).
  3. Отправьте POST-запрос на эндпоинт генерации модели с вашим промптом.
  4. Обработайте возвращённые данные изображения в приложении (декодируйте Base64, отдайте как PNG и т. п.).
  5. Для редактирования изображений включите данные исходного изображения и инструкции по правке в запрос.

Using the official Gemini API (text → image)

Ниже приведён краткий пример на Node.js, показывающий вызов эндпоинта Gemini generateContent для gemini-3.1-flash-image-preview (соответствует официальным примерам в документации). Замените YOUR_API_KEY своим ключом и добавьте обработку ошибок для продакшена.

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

CometAPI предоставляет SDK и обёртки клиентов, совместимых с OpenAI, поэтому некоторые команды могут переключать провайдеров с минимальными изменениями кода, запрашивать Base64-кодированные изображения или размещаемые URL в зависимости от конфигурации. Всегда проверяйте официальную схему generateContent для точного состава полей полезной нагрузки.

Image→Image (edit) flow

Чтобы отредактировать существующее изображение:

  1. Конвертируйте исходное изображение в Base64 (без префикса data:image/...;base64,).
  2. Выполните POST-запрос с полезной нагрузкой, включающей inline_data.data с этой строкой Base64 и промпт для редактирования (например: «сменить фон на закатное небо, убрать водяной знак»).
  3. В ответе будет новое Base64-изображение, которое нужно декодировать и сохранить.
curl 
--location 
--request POST 'https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent' \ 
--header 'Authorization: ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "contents": 
[ { "role": "user", "parts": 
[ { "text": "Blend three images to output a high-resolution image" }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_first_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_second_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_third_image_base64_data_here>" } } 
] } 
], "generationConfig": { "responseModalities": [ "TEXT", "IMAGE" 
] } }'

Typical parameters to tune

  • model: выберите gemini-3.1-flash-image-preview (Nano Banana 2) или gemini-3-pro-image-preview (Pro).
  • imageConfig.aspect_ratio и imageConfig.image_size (512, 1K, 2K, 4K) — влияют на стоимость и задержку.
  • responseModalities: ["Image"] или ["Text","Image"] для мультимодальных потоков.

How should I craft prompts for Nano Banana 2?

Промпт-инжиниринг для моделей изображений сочетает композицию, стиль, подсказки по камере/освещению и формулировку ограничений. Nano Banana 2 настроен на надёжное следование инструкциям, поэтому соблюдайте баланс краткости и явной детализации.

  1. Основной субъект: кто/что изображено.
  2. Действие или состояние: что делает субъект.
  3. Окружение и настроение: сеттинг, свет, атмосфера.
  4. Технические указания: объектив, соотношение сторон, разрешение, композиция.
  5. Стиль и референсы: художественный стиль, ссылки на авторов (учитывайте правила об авторских правах), эпоха.
  6. Ограничения: количество персонажей/объектов, избегаемые цвета, включение читаемого текста.

Example prompt:

«Фотореалистичное изображение небольшого жёлтого банана в форме винтажной ракеты, лежащего на глянцевом столе из махагона в солнечной студии. Объектив 50 мм, малая глубина резкости, тёплый свет «золотого часа», высокая детализация, без видимых логотипов, 2048×1152.»

Tips for editing prompts (inpainting / replace)

  • Чётко укажите маску и какие области должны измениться.
  • Используйте формулировки «сохранить» для областей, которые нужно оставить (например: «сохранить черты лица субъекта, заменить только фон»).
  • Для текста в изображении укажите точную надпись и стиль шрифта (например: «читаемый гротеск, выравнивание по центру»). Nano Banana 2 усиливает отрисовку текста, но уточнения обязательны.

Prompt debugging checklist

  • Если результат не совпадает с ожиданием: попробуйте упростить — уменьшите креативные инструкции, затем постепенно добавляйте детали.
  • Если текст нечитаем: укажите шрифт, размер и контраст в промпте и увеличьте разрешение.
  • Если композиция неверна: используйте указания по ракурсу камеры и параметрам объектива.

What are common pitfalls and how do I avoid them?

Pitfall: Over-reliance on one-shot prompts

Не рассчитывайте, что один промпт решит обрезку, макет и многошаговые правки. Разделяйте работу: генерация базы → редактирование/замена → финальная полировка. Используйте сид и маски для точности.

Не выходите в продакшен без SynthID/C2PA или иных механизмов происхождения. Многим предприятиям нужна трассируемость контента, созданного ИИ.

Pitfall: Budget surprises

Отслеживайте использование на уровне модели и эндпоинта, установите жёсткие лимиты у провайдера или в прокси. Flash-уровни дешевле, но всё равно могут привести к расходам, если непреднамеренно рендерить тысячи 4K-изображений.

Внедрение генерации изображений в продакшен требует внимания к стоимости, задержке, контролю качества, происхождению и безопасности. Ниже — практические рекомендации, собранные из полевых отчётов, документов Google и тестов сообщества.

Prompt engineering & deterministic outputs

  • Шаблонизируйте промпты: для воспроизводимых результатов (например, товарные фото) используйте структурированные промпты с фиксированными сегментами (субъект, камера, освещение, текстуры, пост-обработка). Это снижает дрейф между вызовами.
  • Используйте референс-изображения и маски для правок вместо попыток выполнить сложные локальные изменения только текстом — это уменьшает семантические ошибки и артефакты.

Cost & performance tuning

  • Выбирайте режим Flash/«Nano Banana 2» для больших объёмов: если нужны быстрые итерации, используйте модели уровня Flash и меньшие размеры (2K вместо 4K), чтобы снизить стоимость и задержку.
  • Пакетуйте запросы, где возможно: некоторые провайдеры поддерживают батчинг промптов — это сокращает суммарную задержку на ассет в высокопроизводительных конвейерах (проверьте документацию вашего провайдера).
  • Включайте SynthID и C2PA-метаданные в сгенерированных ассетах для поддержки аудита и соответствия требованиям (особенно при использовании в рекламе/PR). Google и партнёры продвигают SynthID как механизм происхождения.
  • Human-in-the-loop для чувствительного контента: автоматические политики сильны, но не идеальны — используйте ручные проверки для публичных кампаний или материалов с участием публичных персон.

Quality assurance

  • Автоматизируйте QA-проверки: запускайте быстрый пост-генерационный классификатор на предмет неожиданных артефактов (ошибки текста, низкая достоверность лиц, случайные «логотипы»). Поддерживайте систему оценок и аварийный переход на рендеры Pro-уровня при провале автопроверки.
  • Сохраняйте промпты и сиды: для аудита и воспроизводимости сохраняйте точный промпт, метку времени, версию модели и любой сид или параметр детерминизма.

Latency-sensitive UX

  • Прогрессивный UX: отдавайте сначала низкое разрешение/быстрый черновой вариант, затем заменяйте на рендер высокого разрешения/Pro. Это поддерживает отзывчивость приложения (многие провайдеры предлагают «черновой» или Flash-вариант).

Final notes & next steps

Nano Banana 2 призван изменить экономику производств, где главное — изображения: сниженная задержка и стоимость на вызов открывают сценарии вроде генерации рекламных ассетов по требованию, быстрого A/B-тестирования креативов и инструментов для совместного дизайна в реальном времени. Модель уже интегрирована в пользовательские и облачные поверхности Google; разработчикам, желающим быстро запуститься, CometAPI предлагает удобную рыночную обёртку, поддерживающую эндпоинты Gemini для изображений и другие модели — практичный выбор, когда нужно экспериментировать с несколькими движками без изменений в коде.

Developers can access Nano Banana 2 via CometAPI now. To begin, explore the model’s capabilities in the Playground and consult the API guide for detailed instructions. Before accessing, please make sure you have logged in to CometAPI and obtained the API key. CometAPI offer a price far lower than the official price to help you integrate.

Ready to Go?→ Sign up fo Nano Banana 2 today !

If you want to know more tips, guides and news on AI follow us on VK, X and Discord!

Доступ к топовым моделям по низкой цене

Читать далее