Nano Banana Pro — ресми түрде Gemini 3 Pro Image — бұл Google/DeepMind-тің студия деңгейіндегі бейне генерациялау және өңдеу моделі; ол жетілдірілген көпмодалды пайымдауды, жоғары дәлдіктегі мәтінді рендерлеуді, көп бейнені композициялауды және студиялық деңгейдегі шығармашылық басқаруды біріктіреді.
Nano Banana Pro деген не және неге оған мән беру керек?
Nano Banana Pro — Google-дың ең жаңа бейне генерациялау және бейнені өңдеу моделі — “Gemini 3 Pro Image” релизі — 4K-қа дейін студиялық сапада контекстке сезімтал бейнелер мен бейненің үстіндегі мәтінді жоғары дәлдікпен шығаруға арналған. Бұл бұрынғы Nano Banana үлгілерінің (Gemini 2.5 Flash Image / “Nano Banana”) ізбасары, онда пайымдау жақсартылған, Google Search арқылы нақты деректермен негіздеу бар, мәтінді рендерлеу күшейтілген және жергілікті өңдеу басқармалары анағұрлым қуатты. Модель интерактивті пайдаланушылар үшін Gemini қолданбасында қолжетімді, ал бағдарламалық қолжетімділік үшін стандартты Gemini API арқылы Nano Banana Pro-ға қол жеткізуге болады: қажетті модель идентификаторын (gemini-3-pro-image-preview немесе оның тұрақты мұрагерін) таңдаңыз.
Бұл не үшін маңызды: Nano Banana Pro тек әдемі бейнелер жасау үшін емес, сонымен қатар ақпаратты визуализациялау үшін құрастырылған — инфографика, деректерге сүйенген сәттік көріністер (ауа райы, спорт), мәтіні көп постерлер, өнім макеттері және көп бейнені біріктіру (14-ке дейін кіріс бейне және 5 адамға дейін тұлға бірізділігін сақтау). Дизайнерлер, өнім командалары және әзірлеушілер үшін дәлдік, бейне үстіндегі мәтін және бағдарламалық қолжетімділік үйлесімі бұған дейін автоматтандыру қиын болған өндірістік үдерістерді ашып береді.
API арқылы қандай функциялар қолжетімді?
Әзірлеушілерге әдетте мына мүмкіндіктер ұсынылады:
- Мәтін → Бейне генерациясы (бірқадамды немесе көпқадамды «ойлау» композиция ағындары).
- Бейнені өңдеу (жергілікті маскалар, инпайнтинг, стильді түзету).
- Көп бейнені біріктіру (анықтамалық бейнелерді біріктіру).
- Кеңейтілген сұрау басқармалары: ажыратымдылық, кадр қатынасы, пост-өңдеу қадамдары және алдын ала қарау режимдерінде жөндеу/талдау үшін «композиция ойы» іздері.
Nano Banana Pro-ның негізгі инновациялары мен функциялары
Мазмұнды ақылдырақ пайымдау
Gemini 3 Pro-ның пайымдау стегін пайдалана отырып күрделі, көпқадамды визуалды нұсқауларды түсіндіреді (мысалы, «мына деректер жиынынан 5-қадамды инфографика жаса және екі тілдегі түсініктеме қос»). API «Thinking» механизміне қолжеткізеді, ол соңғы нәтижені пысықтау үшін аралық композиция сынақтарын жасай алады.
Бұл не үшін маңызды: Бір өтіммен «сұрау → пиксель» сәйкестендірудің орнына модель ішкі «ойлау» процесін жүргізеді, композицияны пысықтайды және фактімен негіздеу үшін сыртқы құралдарды (мысалы, Google Search) шақыра алады (мысалы, диаграмма таңбаларын дәл, не жергілікті белгілерді дұрыс көрсету үшін). Бұл инфографика, диаграммалар немесе өнім макеттері сияқты тапсырмаларда тек әдемі ғана емес, семантикалық тұрғыда дұрыс бейнелер алуға мүмкіндік береді.
Қалай жүзеге асады: Nano Banana Pro-ның «Thinking» мүмкіндігі — бұл басқарылатын ішкі пайымдау/композиция өтімі; модель соңғы бейнені шығарудан бұрын аралық визуалдар мен пайымдау трассаларын жасайды. API модельдің екі аралық кадрға дейін жасай алатынын және соңғы бейненің сол тізбектің соңғы сатысы екенін ашық көрсетеді. Өндірісте бұл композицияны, мәтіннің орналасуын және макет шешімдерін жақсартуға көмектеседі.
Мәтінді дәлірек рендерлеу
Бейнелердің ішіндегі мәтін (мәзірлер, постерлер, диаграммалар) оқылуы жақсарған әрі локализацияланған. Nano Banana Pro мәтінді бейнеде рендерлеу бойынша жаңа деңгейге жетті:
- Бейнедегі мәтін анық, оқуға ыңғайлы және дұрыс жазылған;
- Көптілді генерацияны қолдайды (Қытай тілі, Жапон тілі, Корей тілі, Араб тілі және т.б.);
- Пайдаланушылар ұзын абзацтарды немесе көпжолды сипаттамалық мәтінді тікелей бейнелерге жаза алады;
- Автоматты аудару және локализация қолжетімді.
Бұл не үшін маңызды: Дәстүрлі бейне үлгілері оқылатын, дұрыс тураланған мәтінді шығаруда қиналады. Nano Banana Pro оқылатын мәтінді рендерлеуге және локализациялауға (мысалы, аудару және макетті сақтау) арнайы оңтайландырылған, бұл постерлер, орауыштар немесе көптілді жарнамалар сияқты нақты шығармашылық қолдануларды ашады.
Қалай жүзеге асады: Мәтінді рендерлеу жақсартулары көпмодалды архитектураның негізінде, бейнедегі мәтін мысалдарына ерекше мән беретін деректер жиындарына үйретумен және мақсатты бағалау жинақтарымен (адамдардың бағалауы және регрессиялық жинақтар) келеді. Модель глиф пішіндерін, қаріптерді және макет шектеулерін сәйкестендіруді үйреніп, бейнелердің ішінде оқылатын, локализацияланған мәтін шығарады — дегенмен өте ұсақ мәтін мен тым тығыз абзацтарда қателер болуы мүмкін.
Көрнекі бірізділік пен дәлдік күштірек
Студиялық басқарулар (жарық, фокус, камера бұрышы, түстік градация) және көп бейнені композициялау (14-ке дейін анықтамалық бейне, бірнеше адамға арналған арнайы рұқсаттармен) бірдей кейіпкерді (сол адам/кейіпкерді) өңдеулер арасында сақтауға және брендтің сәйкестендіруін қорғауға көмектеседі. Модель 1K/2K/4K нативті нәтижелерді қолдайды.
Бұл не үшін маңызды: Маркетинг және ойын-сауық үдерістері кадрлар мен өңдеулер арасында кейіпкерлердің бірізділігін талап етеді. Модель бес адамға дейінгі ұқсастықты сақтай алады және бір композицияға 14-ке дейін анықтамалық бейнені араластырып, Эскиз → 3D рендер шығарады. Бұл жарнама креативтері, орауыштар немесе көпкадрлы сторителлинг үшін пайдалы.
Қалай жүзеге асады: Модель енгізулері бірнеше бейнені нақты рөлдермен қабылдайды (мысалы, «A бейнесі: поза», «B бейнесі: бетке анықтама», «C бейнесі: фон текстурасы»). Архитектура генерацияны осы бейнелерге шарттап, сәйкестік/поза/стильді сақтай отырып трансформацияларды (жарық, камера) қолданады.
Nano Banana Pro өнімділік бенчмарктары
Nano Banana Pro (Gemini 3 Pro Image) «Мәтін→Бейне AI бенчмарктарында озат» және бұрынғы Nano Banana үлгілеріне қарағанда пайымдау мен контекстік негіздеуді жақсартатынын көрсетеді. Ол алдыңғы релиздермен салыстырғанда жоғары дәлдік пен мәтінді рендерлеудің жақсарғанын баса көрсетеді.

Практикалық өнімділік бойынша нұсқаулар
2K/4K жоғары сапалы рендерлер үшін 1K немесе жылдамдыққа оңтайланған “Flash” үлгілеріне қарағанда кідіріс пен құнының жоғары болуын күтіңіз. Егер өткізу қабілеті/кешігу сындарлы болса, жоғары көлем үшін flash нұсқасын (мысалы, Gemini 2.5 Flash / Nano Banana) пайдаланыңыз; сапа және күрделі пайымдау тапсырмалары үшін Nano Banana Pro / gemini-3-pro-image таңдаңыз.
Әзірлеушілер Nano Banana Pro-ға қалай қол жеткізе алады?
Қандай соңғы нүктелер мен үлгілерді таңдау керек
Модель идентификаторы (preview / pro): gemini-3-pro-image-preview (preview) — Nano Banana Pro мүмкіндіктері қажет кезде осыны пайдаланыңыз. Жылдамырақ, төмен құнды жұмыстар үшін gemini-2.5-flash-image (Nano Banana) қолжетімді болып қала береді.
Қолдануға болатын беттер
- Gemini API (generativelanguage endpoint): xx-ке қол жеткізу үшін CometAPI кілтін қолдана аласыз. CometAPI ресми сайтқа қарағанда тиімдірек бағамен дәл сол API-ді ұсынады. Бейнені генерациялау үшін
generateContent-ке тікелей HTTP / SDK шақырулары (төменде мысалдар). - Google AI Studio: Жылдам эксперименттер мен демо қолданбаларды ремикстеуге арналған веб-бет.
- Vertex AI (enterprise): Қамтамасыз етілген өткізу қабілеті, биллинг таңдаулары (пайдаланғаныңызша төлеу / enterprise деңгейлері) және ауқымды продакшн үшін қауіпсіздік сүзгілері. Үлкен конвейерлерге немесе пакеттелген рендерлеу жұмыстарын интеграциялағанда Vertex қолданыңыз.
Тегін деңгейде пайдалану шегі шектеулі; лимиттен асқан жағдайда Nano Banana-ға қайта ауысады. Plus/Pro/Ultra деңгейлері жоғары лимиттер мен сутаңбасыз нәтижелер ұсынады, ал Ultra Flow видео құралдарында және Antigravity IDE-де 4K режимінде қолдануға болады.
Nano Banana Pro арқылы бейне қалай генерациялауға болады (қадам-қадамымен)?
1) Gemini қолданбасын интерактивті пайдалану үшін жылдам рецепт
- Gemini → Tools → Create images ашыңыз.
- Модель ретінде Thinking (Nano Banana Pro) таңдаңыз.
- Сұрауды енгізіңіз: тақырыпты, әрекетті, көңіл күйді, жарықты, камераны, кадр қатынасын және бейнеде көрінетін кез келген мәтінді түсіндіріңіз. Мысал:
«Робототехника шеберханасының 4K постерін жаса: үстелдің айналасында әртүрлі команда, блупринт оверлейі, sans serif қаріпімен батыл тақырып ‘Robots in Action’, жылы вольфрам жарығы, шағын тереңдік, кинематографиялық 16:9.» - (Қосымша) 14-ке дейін бейнені біріктіру үшін жүктеңіз немесе анықтама ретінде қолданыңыз. Жергілікті өңдеу үшін таңдау/маска құралын пайдаланыңыз.
- Генерациялаңыз, табиғи тілмен итерациялаңыз (мысалы, «тақырыпты көк түске бояп, үстіңгі-орталыққа турала; блупринттағы контрастты арттыр»), содан соң экспорттаңыз.
2) HTTP арқылы Gemini кескін endpoint-іне жіберу
Кілт алу үшін CometAPI-ге кіріңіз.
# save your API key to $CometAPI_API_KEY securely before running
curl -s -X POST \
"https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
-H "x-goog-api-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"role": "user",
"parts": [{
"text": "Photorealistic 4K image of a yellow banana floating over Earth, studio lighting, cinematic composition. Add bold text overlay: \"Nano Banana Pro\" in top right corner."
}]
}],
"generationConfig": {
"imageConfig": {
"resolution": "4096x4096",
"aspectRatio": "1:1"
}
}
}' \
| jq -r '.candidates.content.parts[] | select(.inlineData) | .inlineData.data' \
| base64 --decode > nano_banana_pro_4k.png
Бұл үлгі base64 бейне пейлоадын PNG файлына жазады. generationConfig.imageConfig.resolution параметрі 3 Pro Image моделіне қолжетімді 4K нәтижені сұратады.
3) Бейнені генерациялау үшін generateContent-ке тікелей SDK шақырулары
Google SDK орнатуды және Google аутентификациясын талап етеді. Python мысалы (мәтін + анықтамалық бейнелер + негіздеу):
# pip install google-genai pillow
from google import genai
from PIL import Image
import base64
client = genai.Client() # reads credentials from env / config per SDK docs
# Read a reference image and set inline_data
with open("ref1.png", "rb") as f:
ref1_b64 = base64.b64encode(f.read()).decode("utf-8")
prompt_parts = [
{"text": "Create a styled product ad for a yellow banana-based energy bar. Use studio lighting, shallow DOF. Include a product label with the brand name 'Nano Bar'."},
{"inline_data": {"mime_type": "image/png", "data": ref1_b64}}
]
response = client.models.generate_content(
model="gemini-3-pro-image-preview",
contents=,
generation_config={
"imageConfig": {"resolution":"4096x4096", "aspectRatio":"4:3"},
# tools can be provided to ground facts, e.g. "google_search"
"tools":
}
)
for part in response.candidates.content.parts:
if part.inline_data:
image = part.as_image()
image.save("product_ad.png")
Бұл мысал inline анықтамалық бейнені жүктеп, 4K композиция сұратуды және google_search құралын қосуға мүмкіндік беруді көрсетеді. Python SDK төмен деңгейлі REST бөлшектерін өзі өңдейді.
Көп бейнені біріктіру және кейіпкер бірізділігі
Бір адамды әртүрлі көріністерде сақтайтын композит шығару үшін фото топтамадан таңдалған бірнеше inline_data бөлігін беріңіз және модельге «шығуларда тұлға/идентификацияны сақта» деген шығармашылық нұсқау қосыңыз.
Қысқа практикалық мысал — нақты сұрау және күтілетін ағын
Сұрау:
"Generate a 2K infographic: 'Q4 Sales by Region 2025' — stacked bar chart with North America 35%, EMEA 28%, APAC 25%, LATAM 12%. Include title top-center, caption with source bottom-right, clean sans-serif labels, neutral palette, vector look, 16:9."
Күтілетін құбыр: қосымша → сұрау шаблоны + CSV деректері → сұраудағы орынбасарларды ауыстыру → API шақыру image_size=2048x1152 → base64 PNG қабылдау → ресурс пен шығу тегі метадеректерін сақтау → қажет болса дәл қаріпті композитормен үстінен қабаттап қою.
Өндірістік құбырды қалай құрастыру және қауіпсіздік / шығу тегімен қалай жұмыс істеу керек?
Ұсынылатын өндірістік архитектура
- Сұрау + қара жоба (жылдам модель): Арзан/жылдам кіші ажыратымдылықтағы вариацияларды көп шығару үшін
gemini-2.5-flash-image(Nano Banana) қолданыңыз. - Таңдау және пысықтау: ең жақсы кандидаттарды таңдаңыз, сұрауларды пысықтаңыз, дәлдік үшін инпайнтинг/маска өңдеулерін қолданыңыз.
- Жоғары дәлдіктегі соңғы рендер: соңғы 2K/4K рендерлер және пост-өңдеу (апсемплинг, түстік градация) үшін
gemini-3-pro-image-preview(Nano Banana Pro) шақырыңыз. - Шығу тегі және метадеректер: сұрауды, модель нұсқасын, уақыт белгісін және SynthID ақпаратын актив метадеректер қоймасына сақтаңыз — модель SynthID сутаңбасын қосады және нәтижелерді сәйкестік пен контент аудиті үшін ізін кесуге болады.
Қауіпсіздік, құқықтар және модерация
- Авторлық құқық және құқықтарды тазарту: құқықтарды бұзатын контентті жүктемеңіз немесе генерацияламаңыз. Пайдаланушы берген бейнелер немесе танылатын бейнелерді жасауға әкелуі мүмкін сұрауларға айқын пайдаланушы растауын қолданыңыз. Google-дың Тыйым салынған пайдалану саясаты және модель қауіпсіздік сүзгілері сақталуы тиіс.
- Сүзгілеу және автоматтандырылған тексерулер: жариялаудан немесе төменгі тұтынудан бұрын генерацияланған бейнелерді ішкі контент модерация құбыры арқылы өткізіңіз (NSFW, өшпенділік символдары, саяси/сезімтал контентті анықтау).
Бейнені өңдеу (инпайнтинг), көп бейнені композициялау және мәтінді рендерлеуді қалай жасауға болады?
Nano Banana Pro мультимодалды өңдеу ағындарын қолдайды: бір немесе бірнеше кіріс бейнені және өңдеулерді сипаттайтын мәтіндік нұсқауды беріңіз (нысанды алып тастау, аспанды өзгерту, мәтін қосу). API бір сұрауда бейне + мәтінді қабылдайды; модель жауап ретінде кезектескен мәтін мен бейнелерді шығара алады. Үлгілер маскалы өңдеулерді және көп бейнені араластыруды (стильді беру / композиция) қамтиды. contents массивтерінде мәтін блоктары мен бинарлық бейнелерді біріктіру үлгілерін құжаттан қараңыз.
Мысал: Өңдеу (Python псевдо-ағыны)
from google import genai
from PIL import Image
client = genai.Client()
prompt = "Remove the person on the left and add a small red 'Nano Banana Pro' sticker on the top-right of the speaker"
# contents can include Image objects or binary data per SDK; see doc for exact call
response = client.models.generate_content(
model="gemini-3-pro-image-preview",
contents=, # order matters: image + instruction
)
# Save result as before
Бұл диалогтық өңдеу өндіріске дайын активке дейін нәтижені қайталап, біртіндеп түзетуге мүмкіндік береді.
Node.js мысалы — маска және бірнеше анықтамамен бейнені өңдеу
// npm install google-auth-library node-fetch
const { GoogleAuth } = require('google-auth-library');
const fetch = require('node-fetch');
const auth = new GoogleAuth({ scopes: });
async function runEdit() {
const client = await auth.getClient();
const token = await client.getAccessToken();
const API_URL = "https://api.generativemodels.googleapis.com/v1alpha/gemini:editImage";
const MODEL = "gemini-3-pro-image";
// Attach binary image content or URLs depending on API.
const payload = {
model: MODEL,
prompt: { text: "Replace background with an indoor studio set, keep subject, add rim light." },
inputs: {
referenceImages: [
{ uri: "gs://my-bucket/photo_subject.jpg" },
{ uri: "gs://my-bucket/target_studio.jpg" }
],
mask: { uri: "gs://my-bucket/mask.png" },
imageConfig: { resolution: "2048x2048", format: "png" }
},
options: { preserveIdentity: true }
};
const res = await fetch(API_URL, {
method: 'POST',
headers: {
'Authorization': `Bearer ${token.token}`,
'Content-Type': 'application/json'
},
body: JSON.stringify(payload)
});
const out = await res.json();
console.log(JSON.stringify(out, null, 2));
}
runEdit();
(API-лер кейде Cloud Storage URI-ларын немесе base64 бейне пейлоадтарын қабылдайды; дәл енгізу форматтарын Gemini API құжатынан тексеріңіз.)
CometAPI арқылы бейнелерді генерациялау және өңдеу туралы ақпаратты gemini-3-pro-image шақыру нұсқаулығынан қараңыз.
Қорытынды
Nano Banana Pro (Gemini 3 Pro Image) — бейне генерациялауда өндірістік деңгейге секіріс: деректерді визуализациялайтын, локализацияланған өңдеулер жасайтын және әзірлеуші ағындарын қамтамасыз ететін құрал. Жылдам прототиптеу үшін Gemini қолданбасын, продакшн интеграциясы үшін API-ді пайдаланыңыз және шығынды бақылауға, қауіпсіздікті қамтамасыз етуге және бренд сапасын сақтауға арналған жоғарыдағы ұсынымдарды орындаңыз. Әрқашан нақты пайдаланушы ағындарын сынаңыз және ашықтық пен аудит талаптарын орындау үшін шығу тегі метадеректерін сақтаңыз.
Студиялық сапалы активтер, композицияны дәл басқару, бейне ішіндегі мәтінді жақсартылған рендерлеу және бірнеше анықтаманы бір тұтас нәтижеге біріктіру қажет кезде Nano Banana Pro пайдаланыңыз.
Әзірлеушілер Gemini 3 Pro Image (Nano Banana Pro) API-ге CometAPI арқылы қол жеткізе алады. Бастаудан бұрын CometAPI мүмкіндіктерін Playground ішінде зерттеп, егжей-тегжейлі нұсқаулар үшін API нұсқаулығын қараңыз. Қол жеткізбес бұрын CometAPI-ге кіріп, API кілтін алғаныңызға көз жеткізіңіз. CometAPI интеграцияға көмектесу үшін ресми бағадан әлдеқайда төмен баға ұсынады.
Дайынсыз ба?→ CometAPI-ге бүгін тіркеліңіз!
Егер AI туралы көбірек кеңестер, нұсқаулықтар және жаңалықтар білгіңіз келсе, бізді VK, X және Discord желілерінде бақылаңыз!
