Технические характеристики Gemini 3.1 Flash Image Preview
| Параметр | Gemini 3.1 Flash Image Preview |
|---|---|
| Поставщик | |
| Семейство моделей | Gemini 3.1 (уровень Flash) |
| Основное назначение | Быстрая мультимодальная генерация с предпросмотром изображений |
| Типы входных данных | Текст, Изображение |
| Типы выходных данных | Текст, Изображение (предварительный просмотр генерации) |
| Окно контекста | До 1M токенов (стандарт уровня Flash в Gemini 3.x) |
| Уровень задержки | Низкая задержка, высокая пропускная способность |
| Поддержка стриминга | Да |
| Вызов инструментов | Да (фреймворк инструментов Gemini API) |
| Версия | 3.1 |
Что такое Nano Banana 2
Nano Banana 2 — это популярное прозвище, которое пресса и сообщество разработчиков используют для недавно выпущенной модели Gemini-3.1-Flash-Image. Google позиционирует её как движок изображений уровня “Flash”, обеспечивающий визуальную точность, близкую к Pro, при значительно меньшей задержке и стоимости — подходит для высокообъёмной генерации, быстрого итеративного редактирования и интегрированных продуктовых процессов в сервисах Google. Она наследует мультимодальные рассуждения Gemini 3.1 и добавляет возможности, ориентированные на изображения (разборчивый текст на изображениях, композиция из нескольких изображений, поддержка широких соотношений сторон, нативное 4K).
Основные возможности
- Высокоскоростная генерация с несколькими разрешениями: скорость уровня Flash с вариантами 0.5K / 1K / 2K / 4K и новые экстремальные соотношения сторон (1:4, 4:1, 1:8, 8:1).
- Привязка к вебу в реальном времени: интегрирует результаты поиска по тексту и изображениям для привязки сгенерированного контента к текущей информации из интернета, когда включены “Thinking” или привязка к поиску. Полезно для актуальных справок и фактической инфографики.
- Улучшенная отрисовка текста: лучшая, чем у ранних моделей уровня Flash, отрисовка короткого и графического текста (шрифты, размеры); всё ещё неидеальна для длинных абзацев/мелкого текста.
- Многоисточечное редактирование и многошаговые процессы: мощная поддержка комбинирования нескольких изображений в качестве входных данных и итеративных правок по шагам.
📊 Производительность в бенчмарках — генерация и редактирование изображений (оценки Elo)
| Возможность | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Текст-в-изображение — общий рейтинг предпочтений | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Текст-в-изображение — визуальное качество | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Текст-в-изображение — инфографика (фактичность) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Редактирование — общее | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Редактирование — персонажи | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Редактирование — творческое | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Редактирование — объекты/окружение | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Редактирование — многоисточечное | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Редактирование — стилизация | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Ключевые выводы из этой таблицы бенчмарков:
- В категориях генерации из текста в изображение и редактирования изображений Gemini 3.1 Flash Image стабильно лидирует или сопоставима с наивысшими результатами среди моделей уровня Flash и многих конкурентных моделей генерации изображений.
- Модель особенно сильна по визуальному качеству и инфографике (фактичность) — это указывает, что она превосходит не только по эстетике, но и по структурно корректному отображению контента.
- В многоисточечном редактировании Nano Banana 2 также демонстрирует устойчивую обобщающую способность, показывая более высокие оценки, чем предыдущая версия уровня Flash.
Эти оценки получены по результатам человеческих попарных сравнений Elo на разнообразном наборе бенчмарков, отражающих как предпочтения, так и точность для типичных задач генерации/редактирования изображений.
Nano Banana 2 vs Nano Banana vs Nano Banana Pro
| Модель | Позиционирование | Представительные бенчмарки/примечания |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Уровень Flash: скорость + высокое визуальное качество (2K–4K) | Общий рейтинг предпочтений 1079.0 ± 7.0; визуальное качество 1140 ± 6.0 (внутренний GenAI-Bench). |
| Gemini 2.5 Flash Image (Nano Banana) | Более ранний релиз уровня Flash (ниже точность визуализации) | Немного более низкие показатели предпочтений/визуального качества по сравнению с 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Уровень Pro: более высокая воспринимаемая точность для сложных задач, выше стоимость/задержка | Иные компромиссы; по отдельным метрикам относительные позиции в специальных задачах отличаются. |
| GPT-Image 1.5 / другие коммерческие модели | Конкуренты (открытые/закрытые) | Во внутренних бенчмарках Google GPT-Image и другие показали результаты ниже Gemini 3.1 по визуальному качеству и общему предпочтению в представленной оценке. Независимые сторонние сравнения различаются. |
Когда выбирать Flash Image Preview:
- Предпросмотр изображений в реальном времени в приложениях
- Масштабная генерация изображений с ограниченным бюджетом
- Интерактивные ассистенты для дизайна
Как получить доступ и интегрировать Nano Banana 2
Шаг 1: Получите API-ключ
Войдите на cometapi.com. Если вы ещё не являетесь нашим пользователем, сначала зарегистрируйтесь. Войдите в свою консоль CometAPI. Получите учётные данные — ключ API для интерфейса. Нажмите “Add Token” в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте.
Шаг 2: Отправляйте запросы к API Nano Banana 2
Выберите эндпоинт “gemini-3.1-flash-image-preview8” для отправки API-запроса и задайте тело запроса. Метод и тело запроса приведены в документации API на нашем сайте. На нашем сайте также доступно тестирование в Apifox для вашего удобства. Замените <YOUR_API_KEY> на ваш реальный ключ CometAPI из аккаунта. Где вызывать:Генерация изображений Gemini
Nano Banana 2 поддерживает редактирование изображений, генерацию изображений и сценарии с несколькими входными изображениями. Для редактирования изображений необходимо загрузить URL изображения. По дополнительным параметрам обратитесь к документации.
Шаг 3: Получение и проверка результатов
Обработайте ответ API, чтобы получить сгенерированный результат. После обработки API возвращает статус задачи и выходные данные. Вы можете напрямую скачать изображение на локальную машину в песочнице (обычно в формате PNG). В процессе API генерируется URL изображения; пожалуйста, скачайте его своевременно.