Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

Енгізу:$1.5616/M
Шығыс:$9.3696/M
Nano Banana Pro — мәтінге бағытталған жұмыс ағындарында жалпы мақсаттағы көмек көрсетуге арналған ЖИ моделі. Ол құрылымы басқарылатын мазмұнды жасау, түрлендіру және талдау үшін нұсқау стиліндегі промпттарға қолайлы. Әдеттегі қолдану мысалдарына чат-ассистенттер, құжаттарды қысқаша мазмұндау, білімге қатысты QA және жұмыс ағындарын автоматтандыру жатады. Қоғамға ашық техникалық мәліметтер шектеулі; интеграция құрылымдалған нәтижелер, іздеумен толықтырылған промпттар және құралды немесе функцияны шақыру сияқты кең таралған ЖИ ассистенті үлгілеріне сәйкес келеді.
Жаңа
Коммерциялық пайдалану
Playground
Шолу
Мүмкіндіктер
Баға белгілеу
API
Нұсқалар

Негізгі мүмкіндіктер

  • Мәтін → Сурет: промптқа қатаң сәйкестікпен толық промптқа негізделген генерация.
  • Сурет → Сурет (түзетулер): бірқатар түзетулер барысында субъект/кейіпкер тұрақтылығын сақтай отырып, дәл, нысаналы түзетулер.
  • Ең жоғары шығыс ажыратымдылығы: 4K-қа дейін (мысалдар мен қолдау көрсетілетін нақты пиксель өлшемдері аспект қатынасына байланысты; API 1K/2K/4K алдын ала баптауларын ұсынады)
  • Итеративті жоспарлау және өзін-өзі түзету: жиі кездесетін визуалды қателерді (перспектива, мәтін, нәзік геометрия) анықтап, түзететін ішкі «көп сатылы» конвейер.
  • Сурет ішіндегі мәтінді жетілдірілген көрсету: постерлер, мокаптар және инфографика үшін қолайлы, анық әрі оқуға жеңіл көптілді мәтін (қысқа жазулардан ұзын абзацтарға дейін).
  • Бір жұмыс шеңберінде 5 кейіпкер және 14 нысан/анықтамалық суретке дейінгі дәлдік.
  • Сутаңба / шығу тегі: барлық жасалған суреттер SynthID сутаңбасын қамтиды; кейбір өнімдік интеграцияларда модель түпнұсқалылығын растау үшін C2PA метадеректерін ендіреді.

Gemini 3 Pro Image нұсқалары мен атаулары

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

Техникалық мәліметтер

Архитектура

  • Тегі/арқаулығы: Nano Banana Pro Google-дың дамып келе жатқан Gemini кескін стекіне негізделген — дәлірек айтқанда жаңа Gemini 3 Pro Image / GEMPIX 2 архитектурасына (жоғары сыйымдылықты кескін+мәтін мультимодальды негіз). Бұл Gemini 2.5 Flash Image (бастапқы «nano-banana») нұсқасынан табиғи мультимодальды, көбірек көру-тілдік пайымдау мүмкіндіктері бар кескін моделіне эволюция.
  • Модельдің мінез-құлқы: табиғи мультимодалдылық (кескін + мәтін + әлем туралы білім), көп суретті біріктіруге арналған айқын конвейерлер, сондай-ақ бір реттік статикалық үлгі орнына бірнеше өту арқылы нәтижені жетілдіретін ішкі кезеңдік жоспарлағыш. Алғашқы есептер алдыңғы нұсқаларға қарағанда геометриялық/оптикалық пайымдаудың (шыны, сыну) күшейгенін көрсетеді.
  • Ойлау / ішкі жетілдіру: Модель композицияны жетілдіру үшін ішкі жағында көрінетін «ойлау» үдерісін қолданады (API бұл мінез-құлықты құжаттайды және осы ішкі қадамдарға соңғы сурет токендері ретінде ақы алынбайтынын ескертеді).
  • Негіздеу және құралдар: Search grounding қолдайды (диаграмма/инфографика генерациясына веб деректерін қоса алады). Сондай-ақ неғұрлым детерминистік басқару үшін жүйелік нұсқауларды қолдайды.

Негізгі API параметрлері:

  • thinking_level (low / high) кідіріс уақыты мен пайым тереңдігі арасындағы таңдау үшін;
  • media_resolution (low/medium/high) суреттегі OCR/деталь оқу токендерін басқару үшін;
  • generationConfig.imageConfig сурет шығыстарындағы аспект қатынасы/ажыратымдылығын басқару үшін.

Сурет шектеулері:

  • Қолдау көрсетілетін кіріс модальдіктері: Мәтін және суреттер (модель сурет генерациясына аудио немесе видеоны кіріс ретінде қабылдамайды).
  • Бір промптқа ең көп сурет саны: 14 (Gemini 3 Pro Image preview үшін).
  • Суреттің ең үлкен көлемі (жүктеу): әрбір кіріс сурет үшін 7 MB.
  • Қолдау көрсетілетін аспект қатынастары: 1:1, 3:2, 16:9, 9:16, 21:9 және т.б.

Шығыс суреттері / токендер: жоғары шектер, 4K/4096px қолдауымен.

Эталондық өнімділік

Қысқаша түйін: әзірге жария/ерте бенчмарктер негізінен сапалық және қауымдастыққа сүйенген, бірақ бастапқы nano-banana (Gemini 2.5 Flash Image) нұсқасымен салыстырғанда ажыратымдылық, артефакттарды азайту және физикалық дәлдік тұрғысынан елеулі жақсартуларды тұрақты түрде хабарлайды. Атаулы «сын-қатерлер» айқын визуалды табыстар көрсетті, алайда v1 → v2 салыстыруына арналған стандартты кескін генерациясы метрикалары бойынша Google тарапынан (публичті) стандартталған сандық кестелер әлі жоқ.

  • Қауымдастықтың сапалық сынақтары: таза қырлар, өткір микро-детальдар, шынайырақ түстер және промптқа адалдықтың жоғарылауы (ойдан шығарылған реквизиттер аз, кейіпкерлер тұрақтырақ). Танымал бейресми сынақтарға «Wine Glass Test» және «Glass Burger Challenge» жатады, мұнда GEMPIX2 (Nano Banana Pro) мөлдірлік пен сынуды алдыңғы құранымдарға қарағанда айтарлықтай жақсырақ өңдейді.
  • Мәтінмен жұмыс: Nano Banana Pro суреттер ішіндегі типография мен мәтінді орналастыруды көзге көрінерлік жақсартты (көптеген кескін модельдері үшін тұрақты әлсіз тұс). Қауымдастық салыстырулары бүлінген глифтердің азайғанын көрсетеді.
  • Өткізу қабілеті / UX: итерация жылдамдығы жоғары және артқы жақта көпсатылы жетілдіру орындайтын UX, сондықтан қолданушылар алғашқы өтуде анағұрлым сенімді нәтижелер көреді (қолмен қайта генерациялауды азайтады).

Шектеулер мен тәуекелдер

  • Мазмұн сүзгілері және анықтау: Модель біріктірілген платформалар (мысалы, Whisk/үшінші тарап қолданбалары) қатаң танымал тұлғаларды немесе ұқсастықтарды анықтауды қосып, кейбір нәтижелерді бұғаттауы мүмкін; бұл реалистік танымал тұлға ұқсастықтарына сүйенетін шығармашылық жұмыс процестеріне әсер етеді.
  • Қиялдау / пайымдаудың шекаралық жағдайлары: жетілдірілгеніне қарамастан, модель әлі де физикалық тұрғыдан шынайы емес артефактілер шығара алады, әсіресе суреттер ішіндегі тығыз символдық мәтін немесе тым техникалық диаграммалар кезінде — дегенмен NB2 мұндай қателерді алдыңғы нұсқалармен салыстырғанда азайтатын сияқты.
  • Қауіпсіздік және теріс пайдалану: генеративті кескін модельдері проблемалы немесе зиянды мазмұн жасауға қолданылуы мүмкін. Google шығу тегін растауға көмектесу үшін шектеулер, мазмұн сүзгілері және SynthID сутаңбасын қолданады; соған қарамастан, теріс пайдалану жағдайлары болған (саяси сезімтал ортада Nano Banana жасаған суретке байланысты көпшілік назарына іліккен дау).

Nano Banana Pro басқа модельдермен салыстырғанда

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — қуатты мобильді интеграция, көп суретті біріктіру, итеративті өзін-өзі түзету, 2K табиғи/4K апскейлинг, Google қолданбаларымен (Search, Photos, Workspace/Gemini) тығыз интеграция. Сенімді түзетулерді, тұтастықты және Google қызметтерімен интеграцияны қажет ететін жұмыс процестеріне ең қолайлы.
  • Midjourney — стильдендірілген көркем нәтижелерде және қауымдастыққа негізделген промпт-инженерингте озады; әдетте фото-тораптағы дәл көп суретті біріктіру немесе терең мультимодальды өңдеу конвейерлеріне арналмаған.
  • Stable Diffusion / open weights — толық ашық, жоғары мөлшерде бапталатын және локалды түрде орналастыруға болады; checkpoint-тер мен fine-tuning экожүйесі зерттеу және офлайн қолдану үшін шешуші артықшылық. Nano Banana Pro-ға қарағанда дайын күйінде «бір рет басу» мобильді интеграциясы аз және көп суретті өңдеуде тұтастығы төменірек.
  • Seedream 4.0 (ByteDance) — жақында Nano Banana бәсекелесі ретінде айқын позицияланды, өте жылдам рендерингті, 2K шығысты және көптеген анықтамалық суреттерді (алтауға дейін) қолдауды ерекше атап өтеді. Кәсіби/креаторларға балама ретінде ұсынылады.

(Бұл салыстырулар жоғары деңгейде; жеңімпазды өз жұмыс процесіңізге сәйкес таңдаңыз: ашықтық/бейімделгіштік → Stable Diffusion; стильдендірілген өнер → Midjourney; интеграцияланған, тұрақты мобильді өңдеу және агрессивті итерация → Nano Banana Pro/ Gemini 3 Pro image тобы.)

Нақты қолдану жағдайлары

  • Мобильді фотоөңдеу және креативті фильтрлер (Google Photos интеграциялары — қайта стильдеу, фондарды біріктіру, портретті қайта композициялау).
  • Маркетинг және жарнамалық активтер — жылдам концепт генерациясы, бірнеше кадр/ракурста тұрақты бренд кейіпкерлері.
  • Концепт-арт және сторибординг — көп суретті біріктіру панельдер бойынша кейіпкердің тұтастығын сақтауға көмектеседі.
  • Электрондық сауда / өнім мокаптары — әртүрлі контекст/жарықта тұрақты өнім түсірілімдерін генерациялау.
  • AR/VR активтері үшін жедел прототиптеу — жоғары сапалы 2K/4K шығыстар, иммерсивті қолдануларға апскейл жасауға болады.
  • gemini-3-pro-image(Nano Banana Pro) API-ге қол жеткізу тәсілі

Қажетті қадамдар

  • cometapi.com сайтына кіріңіз. Егер әлі пайдаланушы болмасаңыз, алдымен тіркеліңіз
  • Интерфейске арналған қолжетімділік API кілтін алыңыз. Жеке кабинеттегі API token бөлімінде “Add Token” батырмасын басып, токен кілтін алыңыз: sk-xxxxx және жіберіңіз.
  • Осы сайттың URL мекенжайын алыңыз: https://api.cometapi.com/

Қолдану әдісі

  1. API сұрауын жіберу үшін “gemini-3-pro-image” endpoint-н таңдап, сұрау денесін орнатыңыз. Сұрау әдісі мен денесі біздің веб-сайттағы API құжатынан алынады. Ыңғайлылық үшін веб-сайтта Apifox тесті де бар.
  2. <YOUR_API_KEY> мәнін аккаунтыңыздағы нақты CometAPI кілтімен ауыстырыңыз.
  3. Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель осыған жауап береді.
  4. . Генерацияланған жауапты алу үшін API жауапты өңдеңіз.

CometAPI толық үйлесімді REST API ұсынады — үздіксіз көшу үшін. Негізгі мәліметтер :

  • Негізгі URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Модель атаулары: gemini-3-pro-image
  • Аутентификация: Bearer YOUR_CometAPI_API_KEY header
  • Content-Type: application/json .

ЖҚС

Can Gemini 3 Pro Image generate 4K resolution images?

Yes, Nano Banana Pro (Gemini 3 Pro Image) supports native output up to 4K resolution with aspect ratios including 1:1, 3:2, 16:9, 9:16, and 21:9. It also supports 1K and 2K presets via the imageConfig parameter.

How does Nano Banana Pro handle text rendering inside images?

Nano Banana Pro features advanced in-image text rendering with clear, legible multi-language text support—from short captions to long paragraphs. This makes it ideal for posters, infographics, UI mockups, and marketing assets.

Can I edit images conversationally with Gemini 3 Pro Image?

Yes, Nano Banana Pro supports multi-turn conversational editing. Simply ask for changes like 'Make the background a sunset' and the model maintains visual context through Thought Signatures between turns.

What makes Nano Banana Pro different from FLUX 2 Pro or Midjourney?

Nano Banana Pro excels at iterative self-correction, consistent character preservation across multiple edits, and tight Google ecosystem integration. It handles up to 14 reference images for complex multi-image fusion workflows.

Does Nano Banana Pro use Google Search for grounded image generation?

Yes, Nano Banana Pro can use Search grounding to verify facts before generating images. For example, it can fetch current weather data to create an accurate Tokyo weather infographic.

How many reference images can Nano Banana Pro process in one request?

Nano Banana Pro supports up to 14 input images per prompt with a maximum of 7MB per image. It maintains subject and character consistency across up to 5 characters in complex multi-image fusion scenarios.

Nano Banana Pro үшін мүмкіндіктер

[Модель атауы] негізгі мүмкіндіктерін зерттеңіз, олар өнімділік пен пайдалану ыңғайлылығын арттыруға арналған. Бұл мүмкіндіктердің сіздің жобаларыңызға қалай пайда әкелетінін және пайдаланушы тәжірибесін қалай жақсартатынын біліңіз.

Nano Banana Pro үшін баға белгілеу

[Модель атауы] үшін әртүрлі бюджеттер мен пайдалану қажеттіліктеріне сәйкес келетін бәсекеге қабілетті баға белгілеуді зерттеңіз. Біздің икемді жоспарларымыз сіз тек пайдаланған нәрсеңіз үшін ғана төлеуіңізді қамтамасыз етеді, бұл сіздің талаптарыңыз өскен сайын масштабтауды жеңілдетеді. [Модель атауы] шығындарды басқарылатын деңгейде ұстай отырып, сіздің жобаларыңызды қалай жақсарта алатынын біліңіз.

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Nano Banana Pro үшін үлгі код және API

[Модель атауы] үшін кешенді үлгі кодтары мен API ресурстарына қол жеткізіп, интеграция процесіңізді жеңілдетіңіз. Біздің толық құжаттама қадам-қадаммен нұсқаулық береді, жобаларыңызда [Модель атауы] мүмкіндіктерін толық пайдалануға көмектеседі.
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Nano Banana Pro нұсқалары

Nano Banana Pro бірнеше снупшоттарының болуының себептеріне мыналар жатады: жаңартулардан кейінгі шығыстардың өзгеруі, бұрынғы снупшоттарды тұрақтылықты сақтау үшін қолдану, әзірлеушілерге бейімделу және көшіру үшін өту кезеңін ұсыну, сондай-ақ әртүрлі снупшоттардың жаһалдық немесе аймақтық эндпоинттерге сәйкес келуі арқылы пайдаланушы тәжірибесін оңтайландыру. Нұсқалар арасындағы егжей-тегжейлі айырмашылықтар үшін ресми құжаттамаға жүгініңіз.
Модель idСипаттамасыҚолжетімділікСұрау
nano-banana-pro-allҚолданылатын технология ресми емес және генерация тұрақсыз т.б., Чат пішімі✅Чат пішімі
gemini-3-pro-imageҰсынылады, ең жаңа модельге бағытталған✅Gemini сурет генерациялайды
gemini-3-pro-image-previewРесми алдын ала қарау✅Gemini сурет генерациялайды

Көбірек модельдер