What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 — это новейшая модель Google для генерации и редактирования изображений, созданная на базе технологии Gemini Flash Image, обеспечивающая быструю, высококачественную визуальную генерацию и точное следование инструкциям при работе с текстовыми и визуальными входными данными.

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 фактически является потребительским брендингом модели Google Gemini 3.1 Flash Image, объединяющим продвинутые возможности предыдущих версий Nano Banana со скоростью моделей Flash.

What improvements does Nano Banana 2 add over earlier Nano Banana models?

Nano Banana 2 предлагает более высокую скорость генерации, более чёткие детали, лучшую точность следования инструкциям, улучшенный рендеринг текста/локализованный перевод и более широкий творческий контроль, делая многие функции профессионального уровня доступными уже на базовом уровне.

What kinds of images and resolutions can Nano Banana 2 generate?

Модель поддерживает гибкие варианты вывода с различными соотношениями сторон и разрешениями до 4K, что подходит для социальных сетей, рекламы, экранов и профессионального контента.

Can Nano Banana 2 maintain consistency in complex compositions?

Да — она сохраняет согласованность между несколькими персонажами и объектами (например, до пяти персонажей и 14 объектов в рамках одного рабочего процесса с одним запросом), что помогает при работе с сюжетными сценами и задачами в стиле раскадровки.

What image generation use cases is Gemini 3.1 Flash Image best suited for?

Она хорошо подходит для профессионального создания и редактирования изображений, инфографики, согласованности между несколькими изображениями, рендеринга текста и локализованных многоязычных результатов, особенно когда в рабочих процессах требуется точный контроль и многократные итерации.

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 использует знания о реальном мире и интеграцию с поиском изображений, чтобы помогать создавать более точные объекты, инфографику и визуальные материалы с привязкой к местоположению.

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

Да — она может генерировать и отображать чёткий текст внутри изображений, но чрезвычайно мелкий или плотный многоабзацный текст иногда остаётся сложной задачей.

Доступный API Nano Banana 2 | text-to-image

Playground для Nano Banana 2

Изучите Playground Nano Banana 2 — интерактивную среду для тестирования моделей и выполнения запросов в реальном времени. Попробуйте промпты, настройте параметры и итерируйте мгновенно, чтобы ускорить разработку и проверить варианты использования.

Технические характеристики Gemini 3.1 Flash Image Preview

Item	Gemini 3.1 Flash Image Preview
Provider	Google
Model family	Gemini 3.1 (Flash tier)
Primary focus	Быстрая мультимодальная генерация с предпросмотром изображений
Input types	Text, Image
Output types	Text, Image (preview generation)
Context window	До 1M токенов (стандарт уровня Gemini 3.x Flash)
Latency tier	Низкая задержка, высокая пропускная способность
Streaming support	Yes
Tool calling	Yes (фреймворк инструментов Gemini API)
Version	3.1

Что такое Nano Banana 2

Nano Banana 2 — популярное прозвище, используемое прессой и разработчиками для недавно выпущенной модели Gemini-3.1-Flash-Image. Google позиционирует ее как движок изображений уровня «Flash», который обеспечивает почти профессиональную визуальную достоверность при значительно меньшей задержке и стоимости — подходит для массовой генерации, быстрого итеративного редактирования и интегрированных продуктовых рабочих процессов в сервисах Google. Она наследует мультимодальные возможности рассуждения Gemini 3.1 и добавляет ориентированные на изображения функции (разборчивый текст в изображениях, композиция из нескольких изображений, поддержка широких соотношений сторон, нативный 4K).

Основные возможности

Высокоскоростная генерация в нескольких разрешениях: скорость уровня Flash с вариантами 0.5K / 1K / 2K / 4K и новыми экстремальными соотношениями сторон (1:4, 4:1, 1:8, 8:1).
«Привязка» к вебу в реальном времени: интегрирует результаты текстового и поискового по изображениям для привязки генерируемого контента к текущей информации из интернета при включенном режиме «Thinking» или поисковой привязке. Полезно для актуальных справок и фактических инфографик.
Улучшенная отрисовка текста: лучшая отрисовка короткого текста и графического текста (шрифты, размеры), чем в ранних моделях уровня Flash; все еще несовершенна на длинных абзацах/мелком тексте.
Редактирование с несколькими входами и многошаговые процессы: сильная поддержка комбинирования нескольких изображений как входов и итеративных правок в нескольких шагах.

📊 Результаты бенчмарков — Генерация и редактирование изображений (оценки Elo)

Capability	Gemini 3.1 Flash Image (Nano Banana 2)	Gemini 2.5 Flash Image (Nano Banana)	Gemini 3 Pro Image (Nano Banana Pro)	GPT-Image 1.5	Seedream 5.0 Lite	Grok Imagine Image Pro
Text-to-Image — Overall Preference	1079.0 ± 7.0	1073.0 ± 5.0	942.0 ± 6.0	1021.0 ± 5.0	1047.0 ± 5.0	928.0 ± 8.0
Text-to-Image — Visual Quality	1140.0 ± 6.0	1129.0 ± 6.0	929.0 ± 6.0	1043.0 ± 5.0	975.0 ± 5.0	759.0 ± 10.0
Text-to-Image — Infographics (Factuality)	1114.0 ± 14.0	1074.0 ± 12.0	881.0 ± 13.0	1102.0 ± 13.0	985.0 ± 12.0	890.0 ± 22.0
Editing — General	1065.0 ± 9.0	1047.0 ± 9.0	913.0 ± 9.0	1051.0 ± 10.0	995.0 ± 8.0	937.0 ± 9.0
Editing — Character	1056.0 ± 7.0	1049.0 ± 7.0	952.0 ± 7.0	1050.0 ± 8.0	1025.0 ± 7.0	894.0 ± 8.0
Editing — Creative	1023.0 ± 7.0	1031.0 ± 7.0	976.0 ± 7.0	1004.0 ± 7.0	1017.0 ± 7.0	938.0 ± 7.0
Editing — Object/Environment	1029.0 ± 8.0	1018.0 ± 8.0	945.0 ± 8.0	1042.0 ± 10.0	976.0 ± 8.0	946.0 ± 9.0
Editing — Multi-Input	1037.0 ± 8.0	1016.0 ± 8.0	919.0 ± 9.0	1056.0 ± 12.0	1014.0 ± 9.0	Н/Д
Editing — Stylization	1045.0 ± 7.0	1031.0 ± 7.0	862.0 ± 8.0	1045.0 ± 9.0	996.0 ± 7.0	984.0 ± 7.0

Основные выводы из этой таблицы бенчмарков:

Во всех категориях генерации «текст-в-изображение» и редактирования изображений Gemini 3.1 Flash Image стабильно лидирует или соответствует наивысшим оценкам среди уровня Flash и многих конкурентных моделей.
Модель демонстрирует особенно сильные результаты в бенчмарках «Визуальное качество» и «Инфографика (фактичность)», что говорит о превосходстве не только в эстетике, но и в структурной точности отображаемого контента.
В редактировании с несколькими входами Nano Banana 2 также демонстрирует устойчивую обобщающую способность, показывая более высокие оценки по сравнению с предыдущей версией уровня Flash.

Эти оценки проводятся через парные сравнения людьми по системе Elo на разнообразном наборе бенчмарков, отражающих предпочтения и точность в распространенных задачах генерации/редактирования изображений.

Nano Banana 2 против Nano Banana и Nano Banana Pro

Model	Positioning	Representative benchmark/notes
Gemini 3.1 Flash Image (Nano Banana 2)	Уровень Flash: скорость + высокое визуальное качество (2K–4K)	Общая предпочтительность 1079.0 ± 7.0; визуальное качество 1140 ± 6.0 (внутренний GenAI-Bench).
Gemini 2.5 Flash Image (Nano Banana)	Ранний релиз уровня Flash (ниже достоверность)	Несколько ниже показатели предпочтительности/визуального качества по сравнению с 3.1.
Gemini 3 Pro Image (Nano Banana Pro)	Уровень Pro: более высокая воспринимаемая достоверность для сложных задач, более высокая стоимость/задержка	Иные компромиссы; по некоторым метрикам в специализированных задачах наблюдаются иные относительные ранги.
GPT-Image 1.5 / другие коммерческие модели	Конкуренты (открытые/закрытые)	Во внутренних бенчмарках Google GPT-Image и другие показали результаты ниже Gemini 3.1 по визуальному качеству и общей предпочтительности в данном тестировании. Независимые сторонние сравнения различаются.

Когда выбирать Flash Image Preview:

Предпросмотр изображений в реальном времени в приложениях
Масштабная генерация изображений с жесткими бюджетными ограничениями
Интерактивные ассистенты дизайнера

Как получить доступ и интегрировать Nano Banana 2

Шаг 1: Получить ключ API

Войдите на cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, зарегистрируйтесь. Войдите в свою панель CometAPI. Получите учетные данные доступа — ключ API интерфейса. Нажмите «Add Token» в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте.

Шаг 2: Отправьте запросы к API Nano Banana 2

Выберите конечную точку «gemini-3.1-flash-image-preview8» для отправки API-запроса и задайте тело запроса. Метод и тело запроса приведены в документации API на нашем сайте. На нашем сайте также доступен тест в Apifox для вашего удобства. Замените <YOUR_API_KEY> на ваш фактический ключ CometAPI из вашего аккаунта. Где вызывать: Gemini generates image

Nano Banana 2 поддерживает редактирование изображений, генерацию изображений и рабочие процессы с несколькими изображениями. Для редактирования необходимо загрузить URL изображения. По остальным параметрам, пожалуйста, обратитесь к документации.

Шаг 3: Получить и проверить результаты

Обработайте ответ API, чтобы получить сгенерированный результат. После обработки API отвечает статусом задачи и выходными данными. Вы можете напрямую скачать изображение на локальный компьютер в песочнице (обычно в формате PNG). В процессе API генерируется URL изображения; пожалуйста, скачайте его своевременно.

ЧАВО

Цены для Nano Banana 2

Изучите конкурентоспособные цены на Nano Banana 2, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как Nano Banana 2 может улучшить ваши проекты, сохраняя при этом управляемые расходы.

nano-banana-2（image）

variant / alias	Price
gemini-3.1-flash-image (0.5K)	≈ $0.03600
gemini-3.1-flash-image (1K)	≈ $0.05360
gemini-3.1-flash-image (2K)	≈ $0.08080
gemini-3.1-flash-image (4K)	≈ $0.12080
gemini-3.1-flash-image-preview (0.5K)	≈ $0.03600
gemini-3.1-flash-image-preview (1K)	≈ $0.05360
gemini-3.1-flash-image-preview (2K)	≈ $0.08080
gemini-3.1-flash-image-preview (4K)	≈ $0.12080

Пример кода и API для Nano Banana 2

Получите доступ к исчерпывающим примерам кода и ресурсам API для Nano Banana 2, чтобы упростить процесс интеграции. Наша подробная документация предоставляет пошаговые инструкции, помогая вам использовать весь потенциал Nano Banana 2 в ваших проектах.

POST

/v1beta/models/{model}:generateContent

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Python Code Example

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

JavaScript Code Example

import fs from "fs";
import path from "path";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3.1-flash-image-preview";

const prompt =
  "A woman leaning on a wooden railing of a traditional Chinese building. " +
  "She is wearing a blue cheongsam with pink and red floral motifs and a headdress " +
  "made of colorful flowers, including roses and lilacs. Realistic painting style, " +
  "focusing on the textural details of the clothing patterns and wooden buildings.";

const response = await fetch(`${base_url}/models/${model}:generateContent`, {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    Authorization: api_key,
  },
  body: JSON.stringify({
    contents: [
      {
        role: "user",
        parts: [{ text: prompt }],
      },
    ],
    generationConfig: {
      responseModalities: ["IMAGE"],
      imageConfig: {
        aspectRatio: "9:16",
      },
    },
  }),
});

const data = await response.json();

const outputDir = "./output";
if (!fs.existsSync(outputDir)) {
  fs.mkdirSync(outputDir, { recursive: true });
}

for (const candidate of data.candidates) {
  for (const part of candidate.content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageBuffer = Buffer.from(part.inlineData.data, "base64");
      const outputPath = path.join(outputDir, "gemini-3.1-flash-image-preview.png");
      fs.writeFileSync(outputPath, imageBuffer);
      console.log(`Image saved to ${outputPath}`);
    }
  }
}

Curl Code Example

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

Версии Nano Banana 2

Причина наличия нескольких снимков Nano Banana 2 может включать такие потенциальные факторы, как: изменения в выходных данных после обновлений, требующие сохранения старых снимков для обеспечения согласованности; предоставление разработчикам переходного периода для адаптации и миграции; а также наличие разных снимков, соответствующих глобальным или региональным конечным точкам для оптимизации пользовательского опыта. Для получения подробной информации о различиях между версиями обратитесь к официальной документации.

ID модели	описание	Доступность	Запрос
gemini-3.1-flash-image	Рекомендуется, указывает на самую новую модель	✅	Gemini генерирует изображение
gemini-3.1-flash-image-preview	Официальная предварительная версия	✅	Gemini генерирует изображение