Обзор API Nano Banana 2 Lite
API Nano Banana 2 Lite, официально gemini-3.1-flash-lite-image, — это ориентированная на эффективность модель изображений Gemini 3.1 от Google для массовой генерации и редактирования изображений. Google также называет её Gemini 3.1 Flash Lite Image. В CometAPI разработчики получают доступ к модели через нативный маршрут Gemini generateContent, что делает её практичной для быстрых 1K черновиков изображений, простых правок, интерактивных креативных инструментов, миниатюр, социальных креативов и производственных процессов, где скорость и контроль затрат важнее максимального разрешения.
Технические характеристики
| Параметр | Спецификация |
|---|---|
| Название модели | Nano Banana 2 Lite / Gemini 3.1 Flash Lite Image |
| ID модели API | gemini-3.1-flash-lite-image |
| Код модели в CometAPI | gemini-3-1-flash-lite-image |
| Провайдер | |
| Тип модели | Генерация и редактирование изображений |
| Функция в каталоге CometAPI | текст-в-изображение |
| Входные модальности | Текст и изображение |
| Выходные модальности | Изображение и текст |
| Endpoint в CometAPI | POST /v1beta/models/{model}:generateContent |
| Стабильный ID модели | gemini-3.1-flash-lite-image |
| Лимит токенов на вход | 65,536 токенов |
| Лимит токенов на выход | 4,096 токенов |
| Разрешение вывода | Только 1K / 1024px |
| Поддерживаемые соотношения сторон | 14 соотношений сторон, включая 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
| Мышление | Поддерживается; минимальный и высокий |
Что такое Nano Banana 2 Lite?
Nano Banana 2 Lite — это ориентированный на скорость и эффективность представитель семейства моделей изображений Gemini от Google. На странице модели Google описывает её как специалиста по эффективности для генерации изображений с ультранизкой задержкой и оптимальными затратами на генерацию и модификацию.
Компромисс преднамеренный: Nano Banana 2 Lite ориентирован на вывод 1K и массовое интерактивное использование, а не на максимальную детализацию. Google заявляет, что 2K и 4K вывод не поддерживаются для этой версии Lite, а руководство по генерации изображений указывает, что она не оптимизирована для множества референсных входов или многошагового последовательного редактирования. Это делает её хорошим выбором по умолчанию для быстрых черновиков и легкого редактирования, в то время как Gemini 3.1 Flash Image и Nano Banana Pro лучше подходят для высоких разрешений или задач с большим количеством референсов в продакшене.
Основные возможности API Nano Banana 2 Lite
1. Сверхнизкая задержка для интерактивных рабочих процессов с изображениями
Google позиционирует Nano Banana 2 Lite как специалиста по эффективности семейства Gemini для изображений. В официальной карточке модели указана цель — сквозная задержка менее 2 секунд, а в анонсном посте Google отмечается вывод текст-в-изображение примерно за 4 секунды при практической быстрой черновой работе. В продакшене фактическая задержка зависит от сложности промпта, размера входного изображения, сетевого пути, типа ответа и условий маршрутизации CometAPI, но модель явно разработана для быстрых циклов обратной связи, а не для офлайн-рендеринга с максимальным разрешением.
Это особенно полезно для интерактивных сценариев: интерфейсы приложений, генерирующие визуалы по мере ввода, системы массовых миниатюр, превью персонажей или аватаров, исследование вариантов рекламы, генерация плейсхолдеров для e-commerce и креативные инструменты, где пользователю может потребоваться десятки небольших итераций перед выбором финального направления.
2. Нативная генерация «текст-в-изображение» и «изображение-в-изображение»
Nano Banana 2 Lite поддерживает как текстовые, так и графические входы и может возвращать как изображения, так и текст. Через маршрут Gemini в CometAPI разработчики могут отправлять только текстовый промпт для нативной генерации текст-в-изображение или комбинировать входное изображение с текстовыми инструкциями для редактирования изображения на основе изображения.
Поскольку используется нативный процесс работы с изображениями Gemini, Nano Banana 2 Lite не ограничивается простой схемой «промпт на входе — картинка на выходе». Модель может считывать визуальный контекст пользователя, применять локальные правки, генерировать новое изображение и при необходимости включать текст в ответ. Это подходящая форма для инструментов мокапов продуктов, замены фона, быстрых трансферов стиля, локализованных вариантов кампаний и превью внутри потребительских приложений.
3. Быстрое многошаговое локальное редактирование
В карточке модели Google перечислены быстрые многошаговые локальные правки как ключевая способность, включая такие примеры, как замена цветов, создание стикеров и настройка фона. На практике это означает, что пользователи могут запросить первое изображение, затем продолжить уточнениями вроде «сделай куртку красной», «преврати это в стикер» или «замени фон на чистую студийную стену».
Ограничение важно: руководство по генерации изображений Google говорит, что Nano Banana 2 Lite не оптимизирован для нескольких референсных входов или многошагового последовательного редактирования. Используйте Lite для быстрых локальных правок и исследовательского диалога; переходите на Nano Banana 2 или Nano Banana Pro, когда необходима более тяжелая работа с референсами, длинные цепочки правок или профессиональный контроль макета.
4. Сильное следование промптам и согласованность персонажей
Google отмечает, что Nano Banana 2 Lite сохраняет степень контроля и точности, ожидаемую от Nano Banana, при ускорении процесса. В официальных материалах выделяются надежное следование промпту, сильная согласованность персонажей и высокое соответствие образу, соответствующие стандартам оригинального Nano Banana.
Это делает модель полезнее, чем обычный быстрый генератор изображений. Для повторяющихся креативных итераций модель должна сохранять задуманный субъект, цветовое направление, позу, окружение, брендовые элементы и идентичность персонажа между вариациями. Nano Banana 2 Lite разработан именно для такого сценария «быстро итератировать, не теряя задумки».
5. Улучшенная отрисовка текста внутри изображений
В анонсном посте Google говорится, что Nano Banana 2 Lite сохраняет разборчивую отрисовку текста в изображениях, несмотря на приоритет скорости. Это важно для миниатюр, простых постеров, UI-концептов, этикеток, стикеров и легких маркетинговых график, где в сгенерированном изображении нужно разместить короткое слово или фразу.
Для насыщенных текстом инфографик, многоязычных макетов, журнальных полос, упаковки продуктов или тонкой типографики лучше подходят Nano Banana 2 и Nano Banana Pro. Руководство по генерации изображений Google позиционирует Nano Banana 2 как универсальную модель с надежной отрисовкой текста, а Nano Banana Pro — как профессиональный вариант для точного текста и сложных макетов.
6. Вывод 1K с широкой поддержкой соотношений сторон
Nano Banana 2 Lite оптимизирован под вывод 1K; в карточке модели Google указаны 1024px / 1K как поддерживаемый размер изображения и отмечено, что 2K и 4K не поддерживаются. Поддерживаются распространенные соотношения сторон, включая квадратные, портретные, альбомные, вертикальные социальные форматы и ультраширокие макеты.
Для продакшена явно задавайте imageConfig.aspectRatio и imageConfig.imageSize, и используйте значение 1K в верхнем регистре или поддерживаемое значение 1024px. Если вашему процессу нужны 2K, 4K, 0.5K утилитарные превью или более высокое качество для печати и дизайна, используйте Nano Banana 2 или Nano Banana Pro.
Результаты бенчмарков Nano Banana 2 Lite
По данным публичных лидербордов Arena.ai от 29 июня 2026 года, gemini-3.1-flash-lite-image — высокорейтинговая модель эффективности, а не просто «дешевый черновик»: она набирает баллы близко к более тяжелым моделям изображений Gemini при генерации и остается конкурентоспособной в редактировании одиночного изображения, одновременно отдавая приоритет значительно меньшей задержке.
| Бенчмарк | Оценка Nano Banana 2 Lite | Сигнал ранжирования Arena.ai | Голоса | Что это означает |
|---|---|---|---|---|
| Text-to-Image Arena, Overall | 1251 +/- 8 | 5-е место из 70 моделей | 5,462 | Высокое качество генерации по мнению публики для модели класса Lite, чуть ниже mai-image-2.5 и Nano Banana 2, и выше 2K превью Nano Banana Pro на этом снэпшоте |
| Image Edit Arena, Single-Image Edit | 1308 +/- 7 | 15-е место из 49 моделей | 9,320 | Конкурентное качество редактирования, позади тяжеловесных флагманов, но впереди многих универсальных редакторов изображений |
Как выбрать: Nano Banana 2 Lite vs Nano Banana 2 vs Nano Banana Pro
Семейство моделей изображений Google Nano Banana разделено по скорости, качеству и контролю. Nano Banana 2 Lite — быстрая и эффективная модель для массовой генерации 1K. Nano Banana 2 — универсальный рабочий «трудяга» для высококачественной генерации и редактирования изображений с лучшей работой с референсами и выводом до 4K. Nano Banana Pro — премиум-модель для сложного дизайна, точности бренда, продвинутой локализации и прецизионного креативного контроля.
Лидерборд по генерации текст-в-изображение размещает gemini-3.1-flash-lite-image (nano-banana-2-lite) рядом с несколькими премиальными конкурентами: gemini-3.1-flash-image-preview (nano-banana-2) набирает 1270 +/- 4, mai-image-2.5 — 1257 +/- 5, gemini-3-pro-image-preview-2k (nano-banana-pro) — 1245 +/- 4, а gpt-image-1.5-high-fidelity — 1241 +/- 3. Лидерборд по редактированию изображений более требовательный для Lite: gpt-image-2 (medium) лидирует с 1464 +/- 4, тогда как 1308 +/- 7 у Nano Banana 2 Lite помещают её ниже флагманского уровня, но все еще в конкурентной верхней группе.
| Модель | Провайдер | Оптимальные сценарии | Публичные сигналы бенчмарков |
|---|---|---|---|
| Nano Banana 2 Lite (gemini-3.1-flash-lite-image) | Быстрая 1K генерация изображений, легкие правки, массовые черновики, интерактивные продуктовые сценарии | 1251 +/- 8 на Arena.ai Text-to-Image Overall; 1308 +/- 7 на Arena.ai Single-Image Edit | |
| Nano Banana 2 / Gemini 3.1 Flash Image | Генерация изображений Gemini 3.1 более высокого качества, лучшая работа с несколькими референсами, 2K/4K | 1270 +/- 4 на Arena.ai Text-to-Image Overall; 1387 +/- 4 на Arena.ai Single-Image Edit | |
| Nano Banana Pro / Gemini 3 Pro Image | Более требовательные композиции, богатый контекст и высокое разрешение в продакшене | 1245 +/- 4 для 2K превью на Arena.ai Text-to-Image Overall; 1388 +/- 3 для 2K превью на Arena.ai Single-Image Edit | |
| GPT Image 2 | OpenAI | Премиальная генерация и редактирование, где максимальное качество важнее задержки класса Lite | Лидирует в указанных снэпшотах Arena.ai с 1387 +/- 5 в Text-to-Image и 1464 +/- 4 в Single-Image Edit |
Выбирайте Nano Banana 2 Lite, когда опыт продукта зависит от скорости, контроля затрат и частых итераций. Это лучший вариант для UX, близкого к реальному времени, генерации черновиков и легкого редактирования в 1K.
Выбирайте Nano Banana 2, когда нужны наиболее безопасные настройки по качеству изображения, вывод 4K, несколько референсов, более сильная отрисовка текста и лучший баланс качества и задержки. Это лучший универсальный выбор для большинства производственных процессов с изображениями.
Выбирайте Nano Banana Pro, когда задача ближе к дизайнерскому продакшену, чем к быстрой генерации: брендовая реклама, мокапы продуктов, многоэлементные композиции, локализация, тонкая типографика, сложные диаграммы или ассеты, которым требуется максимальный уровень знаний об окружающем мире и креативного контроля.
Как использовать API Nano Banana 2 Lite в CometAPI
Шаг 1: Получите ключ API
Войдите на cometapi.com. Если вы еще не пользователь CometAPI, зарегистрируйтесь, затем откройте страницу токенов консоли CometAPI. В личном кабинете нажмите Add Token в разделе управления токенами API, сгенерируйте учетные данные доступа и скопируйте ключ токена в формате sk-xxxxx.
Храните этот ключ API в секрете и используйте его с бэкенда или из переменных окружения на локальной машине. В примерах ниже замените <YOUR_API_KEY> или $COMETAPI_KEY на фактический ключ CometAPI из вашего аккаунта.
Шаг 2: Отправьте запросы к API Nano Banana 2 Lite
Выберите endpoint модели gemini-3.1-flash-lite-image для Nano Banana 2 Lite. Запрос отправляется через маршрут изображений Gemini в CometAPI:
POST https://api.cometapi.com/v1beta/models/gemini-3.1-flash-lite-image:generateContent
Используйте метод и тело запроса из документации по изображениям Gemini в CometAPI. Где вызывать: Gemini генерирует изображение. Тот же маршрут поддерживает генерацию текст-в-изображение, редактирование изображений и многоизображенческие процессы, но Nano Banana 2 Lite сам по себе оптимизирован для быстрого вывода 1K, а не 2K/4K или сложных длинных цепочек правок.
Для «text-to-image» отправьте текстовый промпт в contents.parts.text и задайте generationConfig.responseModalities, включая IMAGE. Для редактирования изображений предоставьте входное изображение согласно руководству CometAPI, например, передав локальное изображение через Google Gen AI SDK или «сырые» данные изображения в документированном формате Gemini, затем добавьте текстовую инструкцию по редактированию. Для процессов с несколькими изображениями сначала загрузите или подготовьте исходные изображения и следуйте актуальной документации по поддерживаемым входам и ограничениям модели.
Шаг 3: Получение и проверка результатов
Обработайте ответ API, чтобы получить сгенерированное изображение. Ответы Gemini для изображений могут включать текстовые части, финальные части изображения и иногда промежуточные части изображений, помеченные как thought: true. Не сохраняйте первую попавшуюся картинку; пропускайте части с thought: true и сохраняйте последнюю оставшуюся часть изображения, где есть inlineData и thought не равен true.
В CometAPI playground вы можете скачать сгенерированное изображение напрямую, обычно в формате PNG. В процессах через API декодируйте и сохраните возвращенный inlineData изображения или скачайте URL результата, если выбранный вами маршрут CometAPI возвращает его. Загрузите или зафиксируйте сгенерированные ассеты своевременно, затем проверьте финальное изображение на разрешение, следование промпту, видимые артефакты, требования безопасности и то, что это именно финальный вывод, а не промежуточное «мышление» изображения.
Зачем использовать CometAPI для Nano Banana 2 Lite?
CometAPI полезен командам, которым нужен один аккаунт и один слой маршрутизации для нескольких моделей изображений. С Nano Banana 2 Lite в CometAPI команды могут запускать быструю 1K генерацию изображений Gemini, сравнивать результаты с Gemini 3.1 Flash Image, Nano Banana Pro, Imagen, Flux, маршрутами в стиле Midjourney и другими моделями изображений, а затем направлять задания в зависимости от профиля качества, задержки и стоимости.
Каталог моделей CometAPI также показывает текущий ID модели, провайдера, флаги возможностей, доступность и путь к endpoint. Это снижает неоднозначность интеграции для продакшн-приложений, которым нужны переключение моделей, резервирование (fallbacks), отслеживание использования и единообразное управление учетными данными.