Nano Banana — Google компаниясының қауымдастық лақап аты (және ішкі стенографиясы). Gemini 2.5 Flash кескіні — жоғары сапалы, кідіріссіз мультимодальды кескінді генерациялау + өңдеу моделі. Бұл ұзақ пішінді нұсқаулық (код, үлгілер, орналастыру қадамдары және CometAPI мысалдары бар) өндірісте пайдалануға болатын үш практикалық қоңырау әдісін көрсетеді: (1) OpenAI үйлесімді Chat интерфейсі (мәтін→сурет), (2) Google ресми generateContent мәтін → кескін интерфейсі және (3) Google ресми generateContent Base64 енгізу/шығару арқылы сурет → кескін интерфейсі. Жолда сіз тарату/орналастыру бойынша қадамдық кеңес, ортаны орнату, CometAPI-дан API операцияларын алу жолы, баға және су белгісі ескертпелері және сенімді, үнемді нәтижелерге арналған ең жақсы кеңестер аласыз.
Nano Banana (Gemini 2.5 Flash Image) дегеніміз не?
Нано банан – Gemini 2.5 Flash Image, Google компаниясының Gemini отбасындағы соңғы кескін үлгісіне берілген бейресми атау. Ол фотореалистік кескіндерді құруға және кескінді дәл өңдеуге (жергілікті өңдеулер, көп кескінді біріктіру, өңдеулер арасында дәйекті таңбаларды сақтау) арналған және Google Gemini API, Google AI Studio және Vertex AI арқылы қол жетімді. Модель шығу тегі үшін көрінбейтін SynthID су таңбасымен жеткізіледі.
Неліктен бұл әзірлеушілер үшін маңызды: Nano Banana сізге бір, жоғары сапалы мультимодальды модельді ұсынады, ол мыналарды өңдей алады:
- Мәтін → Сурет (мәтіндік сұраулардан жаңа суреттер жасау)
- Кескін → Сурет (берілген фотосуретті өңдеу/түрлендіру)
- Көп кескінді араластыру (бірнеше суретті бір композицияға біріктіру)
Мұның барлығына Google ресми сайты арқылы қол жеткізуге боладыgenerateContentсоңғы нүктелер (Vertex AI / Gemini API) немесе CometAPI және OpenRouter сияқты үшінші тарап API шлюздері ұсынатын OpenAI-үйлесімді соңғы нүктелер арқылы. Бұл сіз Gemini 2.5 Flash кескінін бар OpenAI-үйлесімді кодтық базаларға біріктіре аласыз немесе Google ресми SDK-леріне тікелей қоңырау шала аласыз дегенді білдіреді.
Ол немен ерекшеленеді
- Мақсатты, жергілікті өңдеулер (көйлек түсін өзгерту, нысандарды жою, позаларды түзету).
- Қайта өңдеу кезінде тақырып/сипат сәйкестігін сақтау.
- Бірнеше кескінді үйлесімді композицияға араластыру/біріктіру.
- Ауыр зерттеу үлгілерімен салыстырғанда төмен кідіріс және үнемді қорытынды (Google «Flash» үлгілерін жоғары өнімділік опциялары ретінде орналастырады).
API арқылы Nano Banana қоңырау шалу үшін әзірлеу ортамды қалай орнатуым керек?
Төменде кейінірек сипатталған үш қоңырау әдісінің кез келгені үшін база ретінде қарастыруға болатын қадамдық бақылау тізімі берілген.
Пререквизиттер (шоттар, кілттер, квота)
- Google тіркелгісі + Cloud жобасы — Егер сіз Gemini-ге Google (Gemini API / Vertex AI) арқылы тікелей қоңырау шалуды жоспарласаңыз, Google Cloud жобасын жасаңыз және Vertex AI / Gemini API интерфейстерін қосыңыз. Сізге төлем және тиісті рөлдер қажет болады (мысалы,
Vertex AI AdminorService Accountқорытынды жасау құқығымен). - Gemini API рұқсаты — Кейбір Gemini кескін үлгілері алдын ала қарау/қолжетімділігі шектеулі; тіркелгіңізге байланысты Google AI Studio немесе Vertex AI арқылы рұқсат сұрау немесе үлгіні пайдалану қажет болуы мүмкін.
- CometAPI (қосымша шлюз) — Әртүрлі үлгілерді (соның ішінде Gemini) проксиге жібере алатын жалғыз жеткізуші-агностикалық API қажет болса, API кілтін алу және олардың үлгілер тізімін қарап шығу үшін CometAPI сайтына тіркеліңіз (олар Gemini 2.5 Flash нұсқаларын және OpenAI-үйлесімді соңғы нүктені көрсетеді). CometAPI әзірлеуді жеңілдетеді және қолданба кодын өзгертпестен провайдерлерді ауыстыруға мүмкіндік береді.
Жергілікті құралдар
- Тілдің орындалу уақыты: Node.js 18+, Python 3.10+ ұсынылады.
- HTTP клиенті:
fetch/axiosJS үшін;requests/httpxPython (немесе ресми SDK) үшін. - Сурет көмекшілері:
Pillow(Python) немесеsharp(Түйін) өлшемін өзгертуге, пішімді түрлендіруге және Base64 кодтауына/декодтауына арналған. - қауіпсіздік: кілттерді ортаның айнымалы мәндерінде немесе құпиялар қоймасында сақтаңыз (HashiCorp Vault, AWS Secrets Manager, Google Secret Manager). API кілттерін ешқашан қабылдамаңыз.
Google/үйлесімді SDK орнату (қосымша)
Google SDK және openai кітапхана сыйысымдылық блоктары — OpenAI клиенттік кітапханаларын Gemini-ге қарсы бірнеше жолды өзгерту арқылы пайдалануға болады (негізгі URL + API кілті), бірақ толық мультимодальды мүмкіндіктер үшін жергілікті Gemini/Google клиенті ұсынылады. CometAPI немесе OpenAI-үйлесімді шлюз пайдаланылса, OpenAI клиентін пайдалану дамуды жылдамдатады, мысалдар:
Ресми Google маршруты (Python):
python -m venv venv && source venv/bin/activate
pip install --upgrade pip
pip install google-genai # official Google GenAI SDK
pip install Pillow requests jq # for local image handling in examples
CometAPI / OpenAI-үйлесімді клиент (Python):
pip install openai requests
Nano Banana үшін үш қоңырау әдісін қалай таңдауға болады?
Қоңырау әдісін таңдау архитектураға, кідіріс/құн талаптарына және Google ресми соңғы нүктесіне немесе үшінші тарап OpenAI-үйлесімді шлюзіне сенгіңіз келетініне байланысты. Үш жалпы үлгі:
1) OpenAI үйлесімді чат интерфейсі (мәтіннен суретке)
Сізде OpenAI стиліндегі код немесе SDK бар болса және ең аз өзгерістермен үлгілерді ауыстырғыңыз келсе, оны пайдаланыңыз. Көптеген шлюздер (CometAPI, OpenRouter) Gemini үлгілерін OpenAI-үйлесімді REST бетінде көрсетеді, осылайша сіздің бар chat or completions қоңыраулар басқаша жұмыс істейді base_url және үлгі атауы. Google Cloud аутентификациясын басқарғыңыз келмесе, бұл көбінесе өндіріске апаратын ең жылдам жол.
2) Егіздер ресми generateContent — мәтіннен суретке
Google ресми сайтын пайдаланыңыз generateContent арқылы genai (Google) клиенті немесе Vertex AI ресми, толық қолдау көрсетілетін SDK және соңғы мүмкіндіктерге (жақсы генерациялау параметрлері, ағын, үлкен активтерге арналған файл API) қол жеткізгіңіз келсе, сонымен қатар Google Cloud есепшоты/мониторингі. Бұл өндірісті қолдау және кәсіпорын деңгейіндегі басқару элементтері қажет болғанда ұсынылады.
3) Егіздер ресми generateContent — суреттен кескінге (Base64 енгізу/шығару)
Мұны екілік кескіндерді кірістірілген (Base64) жіберу қажет болғанда немесе кескінді өңдеу / кескіннен кескінге конвейерлер қажет болғанда пайдаланыңыз. Google компаниясы generateContent кірістірілген (base64) кескіндерді және үлкенірек немесе қайта пайдалануға болатын активтерге арналған File API интерфейсін қолдайды. Жасалған/өңделген кескіндер үшін жауаптар әдетте кодты шешетін және сақтайтын Base64 жолдары ретінде қайтарылады. Бұл ең айқын мультимодальды басқаруды береді.
OpenAI-үйлесімді чат интерфейсі (мәтіннен суретке) арқылы Nano Banana-ға қалай қоңырау шалуға болады?
OpenAI-үйлесімді чаттың соңғы нүктесі реттілігін қабылдайды {role, content} хабарламалар; пайдаланушы хабарында қандай кескін қажет екенін сипаттайсыз және шлюз (CometAPI немесе OpenAI үйлесімділік тетігі) оны негізгі Gemini үлгісіне қоңырауға аударады. Қолданбаңыз әлдеқашан сөйлесу ағындарын пайдаланса немесе мәтін құру + кескін жасауды бір алмасуда біріктіргіңіз келсе, бұл ыңғайлы.
қадамдары
1.CometAPI жүйесіне тіркеліп, API кілтін алыңыз: CometAPI сайтында тіркеліңіз, жоба жасаңыз, API кілтін көшіріңіз. CometAPI жалғыздың артында көптеген модельдерді көрсетеді base_url. ()
-
OpenAI-үйлесімді клиентті орнатыңыз: Python:
pip install openaiнемесе жаңасын пайдаланыңызopenai/OpenAIКөптеген шлюздер пайдаланатын SDK ораушысы. -
SDK-ны CometAPI-ге бағыттаңыз және сөйлесуді аяқтаудың соңғы нүктесіне қоңырау шалыңыз:
curl https://api.cometapi.com/v1/chat/completions \
-H "Authorization: Bearer $COMET_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-2-5-flash-image-preview",
"stream": true,
"messages": [{"role": "user",
"content": "Generate a cute kitten sitting on a cloud, in a cartoon style"}]
}'
Ескертулер:
-
ағын ақиқат болуы керек; жауап ағын ретінде қайтарылады;
-
Жауап құрылымы OpenAI үйлесімділігі үшін CometAPI арқылы оралған.
-
Жауапта Base64 кескіні бар; қажетінше декодтау және оны клиентке сақтау:
Gemini ресми арқылы Nano Banana қалай қоңырау шалуға болады generateContent мәтіннен суретке интерфейс?
Google қамтамасыз етеді Gemini Developer API (Gemini API) және Gemini үлгілерін арқылы көрсетеді Vertex AI. Gemini 2.5 Flash Image (Nano Banana) қолданбасына қолдау көрсетілетін жолмен бағдарламалық қатынас үшін ресми generateContent әдіс тек мәтіндік немесе мультимодальды генерацияға арналған канондық кіру нүктесі болып табылады. Google компаниясын пайдаланыңыз GenAI SDK (Python: google-genai) немесе REST соңғы нүктесіне тікелей қоңырау шалыңыз. Бұл модельдің параметрлері мен әдістеріне тікелей қол жеткізуге мүмкіндік береді және Google соңғы нүктелеріне қоңырау шалу кезінде кеңейтілген мүмкіндіктерді (дәл өңдеу, көп кескінді біріктіру) пайдаланудың ұсынылатын жолы болып табылады.
- Google қызметтерін пайдаланыңыз GenAI SDK (Python:
google-genai)
Тарату/қоңырау қадамдары (шолу):
- API кілтін алыңыз Google AI Studio қолданбасынан немесе Vertex AI қызмет тіркелгісін орнатыңыз (платформаға байланысты).
- SDK орнатыңыз (
pip install --upgrade google-genai) және аутентификация (API кілті немесе Google қолданбасының әдепкі тіркелгі деректері). - таңдау модель:
gemini-2.5-flash-imageнемесе құжаттарда көрсетілген алдын ала қарау слогы (нақты слаг GA/алдын ала қарау күйіне байланысты). - шақыру
client.models.generate_content(...)кәдімгі мәтін шақыруымен (мәтіннен суретке). - Декоды қайтарылған суреттер (егер Base64 қайтарылса) және сақтау/сақтау.
Python (ресми клиент) мысалы — мәтін→сурет:
from google import genai
from base64 import b64decode, b64encode
client = genai.Client(api_key="YOUR_GEMINI_KEY")
prompt = {
"content": "A hyperrealistic photo of a vintage motorcycle parked under neon lights at midnight",
"mime_type": "text/plain"
}
# request generateContent for image output
result = client.generate_content(
model="gemini-2-5-flash-image-preview",
prompt=prompt,
response_modalities=,
image_format="PNG",
)
# handle binary or base64 in response (depends on API mode)
(Ескертпе: нақты параметр атаулары үшін ресми клиент API-ін тексеріңіз — жоғарыдағы мысалдар Google құжаттарындағы үлгілерге сәйкес келеді.)
2. Қоңырау шалыңыз Нано банан REST соңғы нүктесі арқылы
EST соңғы нүктесі (мәтіннен суретке мысал): https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent.
Аутентификация опциялары: жабдықтау тақырыбы x-goog-api-key: $CometAPI_API_KEY. (CometAPI ішінде кілт жасаңыз.)
Бұл мәтіндік шақыруды жібереді және қайтарылған base64 кескінін сақтайды:
curl -s -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{ "text": "A photorealistic nano banana dish plated in a stylish restaurant, cinematic lighting, 3:2 aspect ratio" }
]
}]
}' \
| jq -r '.candidates.content.parts[] | select(.inline_data) | .inline_data.data' \
| base64 --decode > gemini-image.png
Ескертпелер: кескіннің екілік нұсқасы base64 дюйм ретінде қайтарылады
candidates.content.parts.inline_data.data. Жоғарыдағы мысал пайдаланыладыjqкірістірілген деректерді таңдау және оны декодтау үшін. Ресми құжаттар бірдей ағымды көрсетеді.
Gemini ресми арқылы Nano Banana қалай қоңырау шалуға болады generateContent суреттен кескінге интерфейсі (Base64 кіріс/шығыс)?
Суреттен кескінге (негізгі 64 кіріс/шығыс) қашан пайдалану керек?
Қажет кезде суретті кескінге пайдаланыңыз:
- Бар фотосуретті өңдеу (бояу, стильді тасымалдау, нысанды ауыстыру).
- Бірнеше бастапқы кескіндерді бір композицияға біріктіріңіз.
- Өңдеулерде субъектінің сәйкестігін сақтаңыз (Nano Banana-ның күшті жақтарының бірі).
Егіздер generateContent Base64 (немесе файл URI ретінде) арқылы кірістірілген кескін деректерін қолдайды және жасалған немесе өңделген кескіндерді Base64 жолдары ретінде қайтарады. Құжаттар қамтамасыз ету үшін нақты мысалдар береді inline_data бірге mime_type және data.
Тарату / қоңырау қадамдары (суреттен кескінге)
- Дайындық кіріс кескін(дер): файл байттарын оқу, Base64 кодтау немесе SDK көмекшісі арқылы өңделмеген байтты беру.
- Құрылым a
contentsбір бөлігі кірістірілген кескін болатын массив (mimeTypeжәнеdata) және одан кейінгі бөліктер мәтінді өңдеу нұсқауларын қамтиды. - POST дейін
generateContent(ресми SDK немесе REST). - алу жауап: API Base64 жолдары ретінде кодталған жасалған/өңделген кескіндерді қайтарады. Оларды жергілікті түрде декодтау және сақтаңыз.
Мысал — Python (GenAI SDK арқылы кірістірілген байттарды қолданатын кескіннен кескінге)
# pip install google-genai
from google import genai
from google.genai import types
import base64
client = genai.Client(api_key="YOUR_GOOGLE_API_KEY")
# Read local image
with open("input_photo.jpg", "rb") as f:
img_bytes = f.read()
# Using SDK helper to attach bytes as a part
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[
types.Part.from_bytes(
data=img_bytes,
mime_type="image/jpeg"
),
"Make a high-quality edit: change the subject's jacket color to teal, keep natural lighting and preserve the person's facial features."
],
)
# The returned image will typically be in response.candidates[].content.parts with base64-encoded data
# Decode and save (pseudo-access shown; check SDK response structure)
b64_out = response.candidates.content.parts.data # example path
with open("edited.jpg","wb") as out:
out.write(base64.b64decode(b64_out))
Python мысалы: демалыс нүктесі арқылы Base64 көмегімен кескін → кескін
import base64, json, requests
API_URL = "https://api.gemini.googleapis.com/v1/generateContent"
API_KEY = "YOUR_GEMINI_KEY"
# read and base64-encode image
with open("input.jpg","rb") as f:
b64 = base64.b64encode(f.read()).decode("utf-8")
payload = {
"model": "gemini-2-5-flash-image-preview",
"input": [
{"mime_type": "image/jpeg", "bytes_base64": b64},
{"mime_type": "text/plain", "text": "Remove the lamppost and make the sky golden at sunset."}
],
"response_modalities":
}
resp = requests.post(API_URL, headers={"Authorization":f"Bearer {API_KEY}", "Content-Type":"application/json"}, json=payload)
resp.raise_for_status()
data = resp.json()
# data.candidates... may contain image base64 — decode and save
out_b64 = data
with open("edited.png","wb") as out:
out.write(base64.b64decode(out_b64))
Егер сіз оған CometAPI демалыс порты арқылы қол жеткізгіңіз келсе:
curl
--location
--request POST "https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" ^
--header "Authorization: sk-" ^
--header "User-Agent: Apifox/1.0.0 (https://apifox.com)" ^
--header "Content-Type: application/json" ^
--header "Accept: */*" ^
--header "Host: api.CometAPI.com" ^
--header "Connection: keep-alive" ^
--data-raw "{ \"contents\": } ], \"generationConfig\": { \"responseModalities\": }}"
Кірістірілген үшін: суретті оқыңыз және оны base64 кодтаңыз. Қайталап пайдалану немесе >20 МБ үшін File API арқылы жүктеп салыңыз және файл дескрипторына сілтеме жасаңыз
generateContent.Енгізілген кескіндерді және мәтіндік өңдеу нұсқауларын қажет ететін дәл өңдеулер мен жұмыс процестері үшін ең жақсы.
Nano Banana-мен жұмыс істеудің ең жақсы кеңестері қандай?
Жедел инженерия және бақылау
- Ашық болыңыз: қажетті пішімін, мәнер сілтемелерін (тек рұқсат етілген жағдайда орындаушы аттары), камера объективін, жарықтандыруды және композицияны қамтиды. Мысалы, «Фотореалистикалық, 3:2, өріс тереңдігі таяз, алтын сағат, Nikon 50 мм объектив.»
- Кезекті өңдеуді пайдаланыңыз: үлкен бір реттік шақыруларға қарағанда бірнеше өтулердегі кішірек, жергілікті өңдеулерді ұнатады — бұл тақырып сәйкестігін сақтайды. Nano Banana-ның күші итеративті өңдеу болып табылады.
Бейне гигиенасы
- Кірістерді алдын ала өңдеу: түс кеңістігін қалыпқа келтіріңіз, құпиялылық қажет болса, енгізілген EXIF жойыңыз, таңбалауыштарды сақтау үшін ақылға қонымды ажыратымдылыққа дейін масштабтаңыз.
- Процесстен кейінгі нәтижелер: бетті анықтауды іске қосыңыз, пайдаланушыларға оралмас бұрын жеңіл сүзгілер (Жастық / өткір) арқылы кішігірім артефакттарды тазалаңыз.
Қауіпсіздік, сәйкестік және мазмұн саясаты
- Кескіндерді сақтау/қызмет көрсету алдында автоматтандырылған мазмұн қауіпсіздігін тексеруді (көру модерация үлгілері немесе қара тізімді тексеру) орындаңыз.
- Адамдардың суреттерін жүктеп салсаңыз, қолданыстағы құпиялылық заңдарын (GDPR/CCPA) орындаңыз және қажетті келісімді алыңыз.
- Авторлық құқықпен қорғалған кейіпкерлерді немесе бар өнер туындыларын сұраған кезде үлгіні пайдалану саясаттары мен авторлық құқық ережелерін құрметтеңіз.
Жабу жазбалары
Nano Banana (Gemini 2.5 Flash Image) мультимодальды кескінді жасау және өңдеу үшін прагматикалық, жоғары дәлдіктегі қадамды білдіреді: ол өңдеулер арасындағы үйлесімділікке және бай мультимодальды негіздемеге арналған. Nano Banana (Gemini 2.5 Flash Image) кескінді жасау/өңдеудегі маңызды қадам болып табылады — жоғары консистенцияны және көп сатылы AI интерфейсін қамтамасыз етеді. CometAPI және Google сияқты шлюздер generateContent API). Қолдану жылдамдығы үшін CometAPI сияқты шлюздер OpenAI стиліндегі кодты қайта пайдалануға мүмкіндік береді. Әрқашан жауаптарды қадағалаңыз, мазмұн саясаты мен шығу мүмкіндіктерін (SynthID) құрметтеңіз және итерация кезінде шығындарды бақылаңыз.
Басталу
CometAPI – OpenAI GPT сериялары, Google Gemini, Anthropic's Claude, Midjourney, Suno және т.б. сияқты жетекші провайдерлердің 500-ден астам AI үлгілерін бір, әзірлеушілерге ыңғайлы интерфейске біріктіретін бірыңғай API платформасы. Тұрақты аутентификацияны, сұрауды пішімдеуді және жауаптарды өңдеуді ұсына отырып, CometAPI қолданбаларыңызға AI мүмкіндіктерін біріктіруді айтарлықтай жеңілдетеді. Чат-боттарды, кескін генераторларын, музыкалық композиторларды немесе деректерге негізделген аналитикалық құбырларды құрастырып жатсаңыз да, CometAPI сізге AI экожүйесіндегі соңғы жетістіктерге қол жеткізе отырып, жылдамырақ қайталауға, шығындарды басқаруға және жеткізуші-агностикалық күйде қалуға мүмкіндік береді.
Әзірлеушілер қол жеткізе алады Gemini 2.5 Flash кескіні(Nano Banana CometAPI тізімі gemini-2.5-flash-image-preview/gemini-2.5-flash-image олардың каталогындағы стиль жазбалары.) CometAPI арқылы тізімделген соңғы үлгілер нұсқасы мақаланың жарияланған күнінде берілген. Бастау үшін үлгінің мүмкіндіктерін зерттеңіз Ойын алаңы және кеңесіңіз API нұсқаулығы егжей-тегжейлі нұсқаулар үшін. Қол жеткізу алдында CometAPI жүйесіне кіріп, API кілтін алғаныңызға көз жеткізіңіз. CometAPI біріктіруге көмектесу үшін ресми бағадан әлдеқайда төмен баға ұсыныңыз.



