Nano Banana Pro(Gemini 3 Pro Image) API қалай пайдалануға болады?

CometAPI
AnnaDec 10, 2025
Nano Banana Pro(Gemini 3 Pro Image) API қалай пайдалануға болады?

Nano Banana Pro — ресми түрде Gemini 3 Pro кескіні — Google/DeepMind компаниясының жетілдірілген мультимодальды пайымдауды, жоғары дәлдіктегі мәтінді көрсетуді, көп кескін композициясын және студиялық деңгейдегі шығармашылық басқару элементтерін біріктіретін жаңа студиялық дәрежедегі кескіндерді жасау және өңдеу моделі.

Nano Banana Pro дегеніміз не және сізге неге қамқорлық қажет?

Nano Banana Pro — Google компаниясының кескіндерді жасау және өңдеуге арналған ең жаңа үлгісі — «Gemini 3 Pro Image» шығарылымы — 4K дейінгі студиялық сапасымен жоғары дәлдіктегі, мәтінмәнді ескеретін кескіндер мен кескін мәтінін шығаруға арналған. Бұл бұрынғы Nano Banana үлгілерінің (Gemini 2.5 Flash Image / «Nano Banana») мұрагері, себебі жақсартылған пайымдаулары, іздеуді негізге алу (нақты әлем фактілері), күштірек мәтінді көрсету және жергілікті өңдеуді басқарудың күшті элементтері. Модель интерактивті пайдаланушылар үшін Gemini қолданбасында қол жетімді және стандартты Gemini API арқылы Nano Banana Pro-ға қол жеткізе алады, бірақ сіз нақты үлгі идентификаторын таңдайсыз (gemini-3-pro-image-preview немесе оның тұрақты мұрагері). бағдарламалық қатынас үшін.

Неліктен бұл маңызды: Nano Banana Pro әдемі кескіндерді жасау үшін ғана емес, сонымен қатар жасау үшін жасалған ақпаратты визуализациялау — инфографика, деректерге негізделген суреттер (ауа-райы, спорт), мәтіні көп плакаттар, өнім макеттері және көп кескінді біріктіру (14 кіріс кескініне дейін және 5 адамға дейін таңбаның сәйкестігін сақтайды). Дизайнерлер, өнім топтары және әзірлеушілер үшін дәлдік, кескіндегі мәтін және бағдарламалық қол жеткізудің үйлесімі бұрын автоматтандыру қиын өндіріс жұмыс үрдістерін ашады.

API арқылы қандай функциялар көрсетіледі?

Әзірлеушілерге берілетін типтік API мүмкіндіктері мыналарды қамтиды:

  • Мәтін → Кескінді құру (бір сатылы немесе көп сатылы «ойлау» композициясы ағындары).
  • Суретті өңдеу (жергілікті маскалар, бояу, стильді түзету).
  • Көп кескінді біріктіру (анықтамалық суреттерді біріктіру).
  • Кеңейтілген сұрау басқару элементтері: ажыратымдылық, арақатынасы, өңдеуден кейінгі қадамдар және алдын ала қарау режимдерінде отладка/тексеруге арналған «композициялық ой» іздері.

Nano Banana Pro негізгі инновациялары мен функциялары

Мазмұнды дәлелдеу

Күрделі, көп сатылы визуалды нұсқауларды (мысалы, «осы деректер жинағынан 5 қадамдық инфографиканы жасаңыз және екі тілде жазуды қосыңыз») түсіндіру үшін Gemini 3 Pro дәлелдеме стегін пайдаланады. API соңғы нәтижені нақтылау үшін аралық композиция сынақтарын жасай алатын «Ойлау» механизмін ашады.

Неліктен маңызды? Нұсқау → пиксельді салыстыратын жалғыз өтудің орнына модель композицияны нақтылайтын және нақты негіздеу үшін сыртқы құралдарды (мысалы, Google Search) шақыра алатын ішкі «ойлау» процесін орындайды (мысалы, нақты диаграмма белгілері немесе жергілікті тілге сәйкес белгілер). Бұл инфографика, диаграммалар немесе өнім макеттері сияқты тапсырмалар үшін әдемірек ғана емес, семантикалық тұрғыдан дұрысырақ кескіндерді береді.

Қалай қол жеткізуге болады: Nano Banana Pro-ның «Ойлау» - бұл соңғы кескінді жасамас бұрын модель аралық көрнекіліктер мен пайымдау іздерін жасайтын бақыланатын ішкі ойлау/композициялық өту. API модельдің екі аралық кадрға дейін жасай алатынын және соңғы кескін осы тізбектің соңғы сатысы екенін көрсетеді. Өндірісте бұл композицияға, мәтінді орналастыруға және орналасу шешімдеріне көмектеседі.

Мәтінді дәлірек көрсету

Кескіндер (мәзірлер, плакаттар, диаграммалар) ішіндегі оқылатын, локализацияланған мәтін айтарлықтай жақсартылған. Nano Banana Pro кескін мәтінін көрсетуде жаңа биіктерге жетеді:

  • Суреттердегі мәтін анық, анық және дұрыс жазылған;
  • Көптілді ұрпақты қолдайды (соның ішінде қытай, жапон, корей, араб және т.б.);
  • Пайдаланушыларға ұзын абзацтарды немесе көп жолды сипаттаушы мәтінді тікелей кескіндерге жазуға мүмкіндік береді;
  • Автоматты аударма және локализация қол жетімді.

Неліктен маңызды? Дәстүрлі түрде кескін үлгілері оқылатын, дұрыс тураланған мәтінді көрсету үшін күреседі. Nano Banana Pro сенімді мәтінді көрсету және локализациялау (мысалы, макетті аудару және сақтау) үшін нақты оңтайландырылған, ол плакаттар, қаптамалар немесе көп тілді жарнамалар сияқты нақты шығармашылық пайдалану жағдайларын ашады.

Қалай қол жеткізуге болады: Мәтінді көрсетуді жақсартулар негізгі мультимодальды архитектура мен мақсатты бағалау жиындарымен (адамдық бағалаулар және регрессия жиындары) біріктірілген кескіндегі мәтін мысалдарына баса назар аударатын деректер жиындары бойынша оқытудан келеді. Модель кескіндердің ішінде түсінікті, локализацияланған мәтінді жасау үшін глиф пішіндерін, қаріптерді және орналасу шектеулерін туралауды үйренеді, бірақ шағын мәтін мен өте тығыз абзацтар әлі де қате болуы мүмкін.

Күшті визуалды консистенция мен адалдық

Студияның басқару элементтері (жарықтандыру, фокус, камера бұрышы, түс градациясы) және көп кескін композициясы (бірнеше адам субъектілері үшін арнайы рұқсаттары бар 14 анықтамалық кескінге дейін) таңбалардың үйлесімділігін (өңдеулерде бір адам/кейіпкерді сақтау) және жасалған активтердегі бренд сәйкестігін сақтауға көмектеседі. Модель жергілікті 1K/2K/4K шығыстарын қолдайды.

Неліктен маңызды? Маркетинг және ойын-сауық жұмыс процестері кадрлар мен өңдеулер бойынша дәйекті кейіпкерлерді қажет етеді. Модель ұқсастықты сақтай алады бес адамдар және араласады 14 Sketch → 3D Render жасау кезінде кескіндерді бір композицияға сілтеме жасаңыз. Бұл жарнамалық креативтілік, буып-түйу немесе көп реттік сюжетті баяндау үшін пайдалы.

Қалай қол жеткізуге болады: Модель кірістері айқын рөл тағайындаулары бар бірнеше кескіндерді қабылдайды (мысалы, «Сурет A: поза», «Сурет B: бет анықтамасы», «Сурет C: фондық текстура»). Архитектура түрлендірулерді (жарықтандыру, камера) қолдану кезінде сәйкестікті/позаны/стильді сақтау үшін сол кескіндерде генерациялауды шарттайды.

Nano Banana Pro өнімділік көрсеткіштері

Nano Banana Pro (Gemini 3 Pro Image) «Мәтін→Image AI көрсеткіштері бойынша жақсы» және ол бұрынғы Nano Banana үлгілерімен салыстырғанда жақсартылған пайымдау мен контекстік негіздеуді көрсетеді. Ол алдыңғы шығарылымдарға қарағанда жоғары дәлдік пен жақсартылған мәтінді көрсетуге баса назар аударады.

Nano Banana Pro(Gemini 3 Pro Image) API қалай пайдалануға болады?

Тәжірибелік орындаушылық нұсқау

күту жоғары кідіріс 1K немесе жылдамдық үшін оңтайландырылған «Flash» үлгілеріне қарағанда, 2K/4K жоғары дәлдіктегі рендерлердің құны. Өткізу қабілеті/кідіріс өте маңызды болса, жоғары дыбыс үшін флэш нұсқасын (мысалы, Gemini 2.5 Flash / Nano Banana) пайдаланыңыз; сапалы және күрделі ойлау тапсырмалары үшін Nano Banana Pro / gemini-3-pro-image пайдаланыңыз.

Әзірлеушілер Nano Banana Pro-ға қалай қол жеткізе алады?

Қандай соңғы нүктелер мен үлгілерді таңдау керек

Үлгі идентификаторы (алдын ала қарау / кәсіби): gemini-3-pro-image-preview (алдын ала қарау) — мұны Nano Banana Pro мүмкіндіктері қажет болғанда пайдаланыңыз. Жылдам әрі арзан жұмыс үшін, gemini-2.5-flash-image (Нано банан) қолжетімді болып қалады.

Қолданылатын беттер

  • Gemini API (генеративті тілдің соңғы нүктесі): xx қатынасу үшін CometAPI кілтін пайдалануға болады. CometAPI бірдей API-ны ресми веб-сайтқа қарағанда тиімдірек бағамен ұсынады. Тікелей HTTP/SDK қоңыраулары generateContent кескін жасау үшін (төмендегі мысалдар).
  • Google AI Studio: Жылдам тәжірибе жасауға және демо қолданбаларды қайта араластыруға арналған веб-бет.
  • Vertex AI (кәсіпорын): Қамтамасыз етілген өткізу қабілеттілігі, есепшот таңдаулары (барған сайын төлеу / кәсіпорын деңгейлері) және ауқымды өндіріске арналған қауіпсіздік сүзгілері. Үлкен құбыр желілеріне немесе топтамалық көрсету тапсырмаларына біріктіру кезінде Vertex пайдаланыңыз.

Тегін деңгейдің шектеулі пайдалану шегі бар; шектен асып кету Nano Banana-ға қайтарылады. Plus/Pro/Ultra деңгейлері жоғарырақ шектеулер мен су таңбасынсыз шығуды ұсынады, бірақ Ultra 4K режимінде Flow бейне құралдарында және Antigravity IDE-де пайдалануға болады.

Nano Banana Pro көмегімен кескінді қалай жасауға болады (қадамдық)?

1) Gemini қолданбасын пайдаланатын жылдам интерактивті рецепт

  1. Gemini → Құралдар → ашыңыз Суреттер жасау.
  2. таңдау Ойлау (Nano Banana Pro) үлгі ретінде.
  3. Шақыруды енгізіңіз: тақырыпты, әрекетті, көңіл-күйді, жарықтандыруды, камераны, арақатынасты және кескінде пайда болатын кез келген мәтінді түсіндіріңіз. Мысалы:
    «Робототехника шеберханасының 4K постерін жасаңыз: үстелдің айналасында әртүрлі топ, сызбаның қабаттасуы, сансыз серифтегі «Роботтар әрекетте» деген қалың тақырып, жылы вольфрам жарығы, терең емес өріс, кинематография 16:9.»
  4. (Қосымша) Сақтандырғыш немесе сілтеме ретінде пайдалану үшін 14 суретке дейін жүктеп салыңыз. Аймақтарды жергілікті өңдеу үшін таңдау/маска құралын пайдаланыңыз.
  5. Табиғи тілмен жасаңыз, қайталаңыз (мысалы, «тақырыпты көк және ортасына туралаңыз; сызбадағы контрастты арттыру»), содан кейін экспорттаңыз

2) Gemini кескінінің соңғы нүктесіне жіберу үшін HTTP пайдаланыңыз

Кілтті алу үшін CometAPI жүйесіне кіруіңіз керек.

# save your API key to $CometAPI_API_KEY securely before running

curl -s -X POST \
  "https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "role": "user",
      "parts": [{
        "text": "Photorealistic 4K image of a yellow banana floating over Earth, studio lighting, cinematic composition. Add bold text overlay: \"Nano Banana Pro\" in top right corner."
      }]
    }],
    "generationConfig": {
      "imageConfig": {
        "resolution": "4096x4096",
        "aspectRatio": "1:1"
      }
    }
  }' \
  | jq -r '.candidates.content.parts[] | select(.inlineData) | .inlineData.data' \
  | base64 --decode > nano_banana_pro_4k.png

Бұл үлгі base64 кескінінің пайдалы жүктемесін PNG файлына жазады. The generationConfig.imageConfig.resolution параметр 4K шығысын сұрайды (3 Pro Image үлгісі үшін қолжетімді)

3) Тікелей SDK қоңыраулары generateContent кескінді қалыптастыру үшін

Google SDK орнатуды және Google аутентификациясын алуды талап етеді. Python мысалы (мәтін + анықтамалық кескіндер + жерге қосу):

# pip install google-genai pillow

from google import genai
from PIL import Image
import base64

client = genai.Client()  # reads credentials from env / config per SDK docs

# Read a reference image and set inline_data

with open("ref1.png", "rb") as f:
    ref1_b64 = base64.b64encode(f.read()).decode("utf-8")

prompt_parts = [
    {"text": "Create a styled product ad for a yellow banana-based energy bar. Use studio lighting, shallow DOF. Include a product label with the brand name 'Nano Bar'."},
    {"inline_data": {"mime_type": "image/png", "data": ref1_b64}}
]

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,
    generation_config={
        "imageConfig": {"resolution":"4096x4096", "aspectRatio":"4:3"},
        # tools can be provided to ground facts, e.g. "google_search"

        "tools": 
    }
)

for part in response.candidates.content.parts:
    if part.inline_data:
        image = part.as_image()
        image.save("product_ad.png")

Бұл мысал кірістірілген анықтамалық кескінді жүктеп салуды және қосу кезінде 4K композициясын сұрауды көрсетеді google_search құрал ретінде. Python SDK төмен деңгейлі REST мәліметтерін өңдейді.

Көп кескінді біріктіру және таңбалардың үйлесімділігі

Көріністерде бір адамды сақтайтын композицияны жасау үшін өтіңіз бірнеше inline_data бөліктерін (фотосуреттер жинағынан таңдалған) және үлгінің «шығыстар бойынша сәйкестікті сақтауы» керектігі туралы шығармашылық нұсқауды көрсетіңіз.

Қысқа практикалық мысал — нақты жедел және күтілетін ағын

Кеңес:
"Generate a 2K infographic: 'Q4 Sales by Region 2025' — stacked bar chart with North America 35%, EMEA 28%, APAC 25%, LATAM 12%. Include title top-center, caption with source bottom-right, clean sans-serif labels, neutral palette, vector look, 16:9."

Күтілетін құбыр: қолданба → шақыру үлгісі + CSV деректері → сұраудағы толтырғыштарды ауыстыру → API қоңырауы image_size=2048x1152 → base64 PNG алу → активті сақтау + шығу метадеректері → қажет болса, құрастырушы арқылы нақты қаріпті қосымша қабаттастыру.

Өндіріс құбырын қалай жобалауым керек және қауіпсіздікті/шығуды қалай өңдеуім керек?

Ұсынылатын өндіріс архитектурасы

  1. Шақыру + жоба рұқсаты (жылдам үлгі): пайдалану gemini-2.5-flash-image (Nano Banana) көптеген шағын ажыратымдылықтағы вариацияларды арзан шығару үшін.
  2. Таңдау және нақтылау: ең жақсы үміткерлерді таңдаңыз, нұсқауларды нақтылаңыз, дәлдік үшін бояу/маска өңдеулерін қолданыңыз.
  3. Жоғары дәлдіктегі соңғы көрсету: шақыру gemini-3-pro-image-preview (Nano Banana Pro) соңғы 2K/4K рендерлер мен кейінгі өңдеуге (жоғары үлгі алу, түс дәрежесі).
  4. Шығу және метадеректер: шақыруды, үлгі нұсқасын, уақыт белгілерін және SynthID ақпаратын актив метадеректер қоймасында сақтаңыз — модель SynthID су таңбасын қосады және сәйкестік пен мазмұн аудиті үшін шығыстарды бақылауға болады.

Қауіпсіздік, құқықтар және модерация

  • Авторлық және құқықтарды тазарту: құқықтарды бұзатын мазмұнды жүктеп салмаңыз немесе жасамаңыз. Танылатын ұқсастықтарды жасай алатын пайдаланушы ұсынатын кескіндер немесе сұраулар үшін анық пайдаланушы растауларын пайдаланыңыз. Google тыйым салынған пайдалану саясаты мен үлгі қауіпсіздік сүзгілері сақталуы керек.
  • Сүзу және автоматтандырылған тексерулер: генерацияланған кескіндерді ішкі мазмұнды модерациялау құбыры (NSFW, жек көру белгілері, саяси/байланыстырушы мазмұнды анықтау) арқылы төмен тұтыну немесе жалпыға көрсету алдында іске қосыңыз.

Суретті өңдеу (бояу), көп кескінді композиция және мәтінді көрсетуді қалай орындаймын?

Nano Banana Pro мультимодальды өңдеу жұмыс үрдістерін қолдайды: бір немесе бірнеше енгізу кескіндерін және өңдеулерді сипаттайтын мәтіндік нұсқаулықты қамтамасыз етіңіз (нысанды жою, аспанды өзгерту, мәтін қосу). API бір сұраудағы сурет + мәтінді қабылдайды; модель жауап ретінде аралас мәтін мен кескіндерді жасай алады. Мысал үлгілерге маскаланған өңдеулер және көп кескін араласуы (стильді тасымалдау / композиция) кіреді. үшін құжаттарды қараңыз contents мәтіндік блоктарды және екілік кескіндерді біріктіретін массивтер.

Мысал: Өңдеу (Python псевдо-ағыны)

from google import genai
from PIL import Image

client = genai.Client()

prompt = "Remove the person on the left and add a small red 'Nano Banana Pro' sticker on the top-right of the speaker"

# contents can include Image objects or binary data per SDK; see doc for exact call

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=,  # order matters: image + instruction

)
# Save result as before

Бұл сөйлесу өңдеуі өндіріске дайын активке жеткенше нәтижелерді қайталап реттеуге мүмкіндік береді.

Node.js мысалы — маска және бірнеше сілтемелер арқылы кескінді өңдеу

// npm install google-auth-library node-fetch
const { GoogleAuth } = require('google-auth-library');
const fetch = require('node-fetch');

const auth = new GoogleAuth({ scopes:  });
async function runEdit() {
  const client = await auth.getClient();
  const token = await client.getAccessToken();
  const API_URL = "https://api.generativemodels.googleapis.com/v1alpha/gemini:editImage";
  const MODEL = "gemini-3-pro-image";

  // Attach binary image content or URLs depending on API.
  const payload = {
    model: MODEL,
    prompt: { text: "Replace background with an indoor studio set, keep subject, add rim light." },
    inputs: {
      referenceImages: [
        { uri: "gs://my-bucket/photo_subject.jpg" },
        { uri: "gs://my-bucket/target_studio.jpg" }
      ],
      mask: { uri: "gs://my-bucket/mask.png" },
      imageConfig: { resolution: "2048x2048", format: "png" }
    },
    options: { preserveIdentity: true }
  };

  const res = await fetch(API_URL, {
    method: 'POST',
    headers: {
      'Authorization': `Bearer ${token.token}`,
      'Content-Type': 'application/json'
    },
    body: JSON.stringify(payload)
  });
  const out = await res.json();
  console.log(JSON.stringify(out, null, 2));
}
runEdit();

(API кейде Cloud Storage URI немесе base64 кескінінің пайдалы жүктемелерін қабылдайды; нақты енгізу пішімдері үшін Gemini API құжаттарын тексеріңіз.)

CometAPI көмегімен кескіндерді жасау және өңдеу туралы ақпаратты мына жерден қараңыз Gemini-3-pro-image-ге қоңырау шалу бойынша нұсқаулық .

қорытынды

Nano Banana Pro (Gemini 3 Pro Image) - кескін жасаудағы өндіріс деңгейіндегі секіріс: деректерді визуализациялауға, локализацияланған өңдеулерді жасауға және әзірлеушілердің жұмыс үрдістерін қуаттандыруға арналған құрал. Жылдам прототиптеу үшін Gemini қолданбасын, өндірісті біріктіру үшін API пайдаланыңыз және шығындарды бақылау, қауіпсіздікті қамтамасыз ету және бренд сапасын сақтау үшін жоғарыдағы ұсыныстарды орындаңыз. Мөлдірлік пен аудит қажеттіліктерін қанағаттандыру үшін әрқашан нақты пайдаланушы жұмыс процестерін сынап, шығу метадеректерін сақтаңыз.

Қажет кезде Nano Banana Pro пайдаланыңыз студиялық сапа активтер, композицияны нақты бақылау, кескіндердің ішіндегі жақсартылған мәтінді көрсету және бірнеше сілтемелерді бір үйлесімді шығысқа біріктіру мүмкіндігі.

Әзірлеушілер қол жеткізе алады Gemini 3 Pro Image (Nano Banana Pro) API CometAPI арқылы. Бастау үшін үлгі мүмкіндіктерін зерттеңізCometAPI ішінде Ойын алаңы және толық нұсқаулар үшін API нұсқаулығын қараңыз. Қол жеткізу алдында CometAPI жүйесіне кіріп, API кілтін алғаныңызға көз жеткізіңіз. СetAPI біріктіруге көмектесу үшін ресми бағадан әлдеқайда төмен баға ұсыныңыз.

Баруға дайынсыз ба?→ CometAPI-ге бүгін тіркеліңіз !

Егер сіз AI туралы көбірек кеңестер, нұсқаулықтар және жаңалықтар білгіңіз келсе, бізге жазылыңыз VKX және Арасындағы айырмашылық!

SHARE THIS BLOG

Толығырақ оқу

500+ модель бір API-да

20%-ға дейін жеңілдік