МоделиЦеныПредприятие
500+ API моделей ИИ, всё в одном API. Только в CometAPI
API моделей
Разработчик
Быстрый стартДокументацияПанель управления API
Компания
О насПредприятие
Ресурсы
AI МоделиБлогЖурнал измененийПоддержка
Условия обслуживанияПолитика конфиденциальности
© 2026 CometAPI · All rights reserved
Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

Ввод:$1.5616/M
Вывод:$9.3696/M
Nano Banana Pro — модель искусственного интеллекта для универсальной помощи в текстоориентированных рабочих процессах. Она подходит для запросов в стиле инструкций, чтобы генерировать, преобразовывать и анализировать контент с управляемой структурой. Типичные варианты использования включают чат-ассистентов, суммирование документов, вопросно-ответные системы на основе знаний и автоматизацию рабочих процессов. Публичные технические сведения ограничены; интеграция соответствует распространённым шаблонам ИИ-ассистентов, таким как структурированные результаты, запросы, дополненные извлечением, и вызовы инструментов или функций.
Новый
Коммерческое использование
Playground
Обзор
Функции
Цены
API
Версии

Основные возможности

  • Текст → изображение: полнофункциональная генерация по промпту с высокой точностью следования промпту.
  • Изображение → изображение (редактирование): точечные и аккуратные правки с сохранением согласованности объекта/персонажа при нескольких последовательных изменениях.
  • Максимальное выходное разрешение: до 4K (примеры и точные поддерживаемые размеры в пикселях зависят от соотношения сторон; API предоставляет пресеты 1K/2K/4K)
  • Итеративное планирование и самокоррекция: внутренняя «многоэтапная» конвейерная обработка, которая обнаруживает и исправляет типичные визуальные ошибки (перспектива, текст, мелкая геометрия).
  • Продвинутый рендеринг текста внутри изображения: чёткий, разборчивый многоязычный текст (от коротких подписей до длинных абзацев), подходящий для постеров, мокапов и инфографики.
  • 5 персонажей и сохранение точности для до 14 объектов/референсных изображений в одном рабочем процессе.
  • Водяные знаки / происхождение: все сгенерированные изображения включают водяной знак SynthID; в некоторых продуктовых интеграциях модель встраивает метаданные C2PA для подтверждения происхождения.

Версии и наименования Gemini 3 Pro Image

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

Технические детали

Архитектура

  • Происхождение / базовая архитектура: Nano Banana Pro построен на развивающемся стеке image-моделей Gemini от Google — в частности, на новой архитектуре Gemini 3 Pro Image / GEMPIX 2 (более ёмкой мультимодальной системе для изображений и текста). Это развитие Gemini 2.5 Flash Image (оригинальной «nano-banana») в нативно мультимодальную image-модель с расширенными возможностями визуально-языкового рассуждения.
  • Поведение модели: нативная мультимодальность (изображение + текст + знания о мире), явные конвейеры для слияния нескольких изображений и внутренний поэтапный планировщик, который уточняет результат за несколько проходов, а не создаёт один статичный сэмпл. Ранние отчёты указывают на более сильное геометрическое/оптическое рассуждение (стекло, преломление) по сравнению с предыдущими версиями.
  • Мышление / внутренняя доработка: модель использует внутренний видимый процесс «мышления» для уточнения композиции (API документирует это поведение и отмечает, что эти внутренние шаги не тарифицируются как финальные токены изображения).
  • Grounding и инструменты: поддерживается Search grounding (может использовать веб-факты при генерации диаграмм/инфографики). Также поддерживаются системные инструкции для более детерминированного управления.

Ключевые параметры API:

  • thinking_level (low / high) для выбора между задержкой и глубиной рассуждения;
  • media_resolution (low/medium/high) для управления токенами OCR/считывания деталей изображения;
  • generationConfig.imageConfig для управления соотношением сторон/разрешением выходных изображений.

Ограничения по изображениям:

  • Поддерживаемые входные модальности: текст и изображения (модель не принимает аудио или видео в качестве входных данных для генерации изображений).
  • Максимум изображений в одном промпте: 14 (для Gemini 3 Pro Image preview).
  • Максимальный размер изображения (загрузка): 7 MB на одно входное изображение.
  • Поддерживаемые соотношения сторон: 1:1, 3:2, 16:9, 9:16, 21:9 и т. д.

Выходные изображения / токены: высокие лимиты, поддерживается 4K/4096px.

Производительность в бенчмарках

Краткое резюме: доступные на данный момент публичные/ранние бенчмарки в основном качественные и основаны на сообществе, но стабильно сообщают о существенных улучшениях в разрешении, снижении артефактов и физической достоверности по сравнению с оригинальной nano-banana (Gemini 2.5 Flash Image). Для некоторых конкретно названных «испытаний» были заметны явные визуальные улучшения, однако публичных стандартизированных числовых таблиц бенчмарков от Google с сравнением v1 → v2 по стандартным метрикам генерации изображений пока нет.

  • Качественные тесты сообщества: более чистые края, более чёткие микродетали, более правдивые цвета и более точное следование промпту (меньше галлюцинированных объектов, более согласованные персонажи). Популярные неформальные тесты включают так называемые “Wine Glass Test” и “Glass Burger Challenge”, где GEMPIX2 (Nano Banana Pro) заметно лучше справляется с прозрачностью и преломлением, чем более ранние сборки.
  • Работа с текстом: Nano Banana Pro демонстрирует заметно улучшенную типографику и размещение текста внутри изображений (традиционно слабое место для многих image-моделей). Сравнения сообщества показывают меньше искажённых отрисованных глифов.
  • Пропускная способность / UX: более высокая скорость итераций и UX, выполняющий многоэтапную доработку на серверной стороне, благодаря чему пользователи получают более надёжные результаты уже с первой попытки (что уменьшает необходимость ручных перегенераций).

Ограничения и риски

  • Фильтры контента и детекция: платформы, интегрирующие модель (например, Whisk/сторонние приложения), могут включать строгую детекцию знаменитостей или сходства внешности и блокировать определённые результаты, что влияет на творческие рабочие процессы, завязанные на реалистичное сходство со знаменитостями.
  • Галлюцинации / пограничные случаи рассуждения: несмотря на улучшения, модель всё ещё может создавать физически нереалистичные артефакты, особенно при плотном символическом тексте внутри изображений или в очень технических диаграммах — хотя NB2, по-видимому, снижает количество таких ошибок по сравнению с более ранними версиями.
  • Безопасность и злоупотребление: генеративные image-модели могут использоваться для создания проблемного или вредоносного контента. Google применяет ограничения, фильтры контента и водяной знак SynthID для подтверждения происхождения; тем не менее случаи злоупотребления уже происходили (в том числе громкий скандал, связанный с изображением, сгенерированным Nano Banana, в политически чувствительном контексте).

Как Nano Banana Pro выглядит на фоне других моделей

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — сильная мобильная интеграция, слияние нескольких изображений, итеративная самокоррекция, нативный 2K/апскейл до 4K, плотная интеграция с приложениями Google (Search, Photos, Workspace/Gemini). Лучше всего подходит для сценариев, где нужны надёжные правки, непрерывность персонажей и интеграция с сервисами Google.
  • Midjourney — отлично подходит для стилизованных художественных результатов и промпт-инжиниринга, развиваемого сообществом; обычно не ориентирован на фотореалистичное слияние нескольких изображений или глубокие мультимодальные конвейеры редактирования.
  • Stable Diffusion / open weights — полностью открытая, высоко настраиваемая и пригодная для локального хостинга система; экосистема чекпойнтов и fine-tuning является решающим преимуществом для исследований и офлайн-использования. При этом у неё меньше «one-click» мобильной интеграции и менее стабильная согласованность при редактировании нескольких изображений «из коробки», чем у Nano Banana Pro.
  • Seedream 4.0 (ByteDance) — недавно явно позиционировалась как конкурент Nano Banana, с акцентом на сверхбыстрый рендеринг, выход 2K и поддержку большого числа референсных изображений (до шести). Позиционируется как профессиональная альтернатива для креаторов.

(Эти сравнения даны на высоком уровне; выбирайте победителя, исходя из своего сценария: открытость/настраиваемость → Stable Diffusion; стилизованное искусство → Midjourney; интегрированное, согласованное мобильное редактирование с агрессивной итерацией → Nano Banana Pro / семейство Gemini 3 Pro Image.)

Реальные сценарии использования

  • Мобильное редактирование фотографий и креативные фильтры (интеграции с Google Photos — изменение стиля, слияние фона, перекомпозиция портрета).
  • Маркетинговые и рекламные материалы — быстрая генерация концептов, согласованные бренд-персонажи в нескольких кадрах/ракурсах.
  • Концепт-арт и сторибординг — слияние нескольких изображений помогает сохранять непрерывность персонажей между панелями.
  • E-commerce / продуктовые мокапы — генерация согласованных снимков продукта в разных контекстах/условиях освещения.
  • Быстрое прототипирование AR/VR-ассетов — высококачественные результаты 2K/4K, которые можно масштабировать для иммерсивных сценариев.
  • Как получить доступ к API gemini-3-pro-image(Nano Banana Pro)

Необходимые шаги

  • Войдите на cometapi.com. Если вы ещё не являетесь нашим пользователем, сначала зарегистрируйтесь
  • Получите учётные данные доступа — API key интерфейса. Нажмите “Add Token” в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте его.
  • Получите URL этого сайта: https://api.cometapi.com/

Способ использования

  1. Выберите endpoint “gemini-3-pro-image”, чтобы отправить API-запрос, и задайте тело запроса. Метод запроса и тело запроса можно получить из API-документации на нашем сайте. На нашем сайте также доступен тест Apifox для вашего удобства.
  2. Замените <YOUR_API_KEY> на ваш фактический ключ CometAPI из вашей учётной записи.
  3. Вставьте ваш вопрос или запрос в поле content — именно на него модель будет отвечать.
  4. Обработайте API-ответ, чтобы получить сгенерированный результат.

CometAPI предоставляет полностью совместимый REST API — для бесшовной миграции. Ключевые детали:

  • Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Названия моделей: gemini-3-pro-image
  • Аутентификация: заголовок Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

ЧАВО

Может ли Gemini 3 Pro Image генерировать изображения в разрешении 4K?

Да, Nano Banana Pro (Gemini 3 Pro Image) поддерживает нативный вывод вплоть до разрешения 4K с соотношениями сторон 1:1, 3:2, 16:9, 9:16 и 21:9. Он также поддерживает пресеты 1K и 2K через параметр imageConfig.

Как Nano Banana Pro обрабатывает рендеринг текста внутри изображений?

Nano Banana Pro обладает продвинутыми возможностями рендеринга текста внутри изображений, поддерживая четкий, разборчивый многоязычный текст — от коротких подписей до длинных абзацев. Это делает его идеальным для постеров, инфографики, UI-макетов и маркетинговых материалов.

Могу ли я редактировать изображения в диалоговом режиме с Gemini 3 Pro Image?

Да, Nano Banana Pro поддерживает многотуровое диалоговое редактирование. Просто попросите внести изменения, например: 'Сделай фон закатным', и модель сохранит визуальный контекст между ходами с помощью Thought Signatures.

Чем Nano Banana Pro отличается от FLUX 2 Pro или Midjourney?

Nano Banana Pro превосходно справляется с итеративной самокоррекцией, последовательным сохранением персонажей при множественных правках и тесной интеграцией с экосистемой Google. Он поддерживает до 14 референсных изображений для сложных сценариев слияния нескольких изображений.

Использует ли Nano Banana Pro Google Search для генерации изображений с опорой на факты?

Да, Nano Banana Pro может использовать Search grounding для проверки фактов перед генерацией изображений. Например, он может получить текущие данные о погоде, чтобы создать точную инфографику о погоде в Токио.

Сколько референсных изображений Nano Banana Pro может обработать в одном запросе?

Nano Banana Pro поддерживает до 14 входных изображений на один запрос с максимальным размером 7 МБ на изображение. Он сохраняет согласованность объектов и персонажей для до 5 персонажей в сложных сценариях слияния нескольких изображений.

Цены для Nano Banana Pro

Изучите конкурентоспособные цены на Nano Banana Pro, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как Nano Banana Pro может улучшить ваши проекты, сохраняя при этом управляемые расходы.

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Пример кода и API для Nano Banana Pro

Получите доступ к исчерпывающим примерам кода и ресурсам API для Nano Banana Pro, чтобы упростить процесс интеграции. Наша подробная документация предоставляет пошаговые инструкции, помогая вам использовать весь потенциал Nano Banana Pro в ваших проектах.
POST
/v1beta/models/{model}:generateContent
POST
/v1beta/models/{model}:generateContent
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Python Code Example

from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

JavaScript Code Example

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
import * as path from "node:path";
import { fileURLToPath } from "node:url";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const BASE_URL = "https://api.cometapi.com";

const __filename = fileURLToPath(import.meta.url);
const __dirname = path.dirname(__filename);

async function main() {
  const ai = new GoogleGenAI({
    apiKey: COMETAPI_KEY,
    httpOptions: { baseUrl: BASE_URL },
  });

  const prompt =
    "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English.";
  const aspectRatio = "1:1"; // "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
  const resolution = "4K"; // "1K", "2K", "4K"

  const response = await ai.models.generateContent({
    model: "gemini-3-pro-image-preview",
    contents: prompt,
    config: {
      responseModalities: ["TEXT", "IMAGE"],
      imageConfig: {
        aspectRatio: aspectRatio,
        imageSize: resolution,
      },
    },
  });

  // Output directory
  const outputDir = path.join(__dirname, "..", "output");
  if (!fs.existsSync(outputDir)) {
    fs.mkdirSync(outputDir, { recursive: true });
  }

  for (const part of response.candidates[0].content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const outputPath = path.join(outputDir, "butterfly_4k.png");
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync(outputPath, buffer);
      console.log(`Image saved to: ${outputPath}`);
    }
  }
}

main();

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here

# Output directory
SCRIPT_DIR="$(cd "$(dirname "$0")" && pwd)"
OUTPUT_DIR="$SCRIPT_DIR/../output"
mkdir -p "$OUTPUT_DIR"

curl -s -X POST \
  "https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $COMETAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."}]}],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"],
      "imageConfig": {"aspectRatio": "1:1", "imageSize": "4K"}
    }
  }' | jq -r '.candidates[0].content.parts[] | select(.inlineData) | .inlineData.data' | head -1 | base64 --decode > "$OUTPUT_DIR/butterfly_4k.png"

echo "Image saved to: $OUTPUT_DIR/butterfly_4k.png"

Версии Nano Banana Pro

Причина наличия нескольких снимков Nano Banana Pro может включать такие потенциальные факторы, как: изменения в выходных данных после обновлений, требующие сохранения старых снимков для обеспечения согласованности; предоставление разработчикам переходного периода для адаптации и миграции; а также наличие разных снимков, соответствующих глобальным или региональным конечным точкам для оптимизации пользовательского опыта. Для получения подробной информации о различиях между версиями обратитесь к официальной документации.
ID моделиОписаниеДоступностьЗапрос
nano-banana-pro-allИспользуемая технология неофициальная, генерация нестабильна и т. д., Чат формат✅Чат формат
gemini-3-pro-imageРекомендуется, указывает на новейшую модель✅Генерация изображений Gemini
gemini-3-pro-image-previewОфициальная предварительная версия✅Генерация изображений Gemini