Google Nano Banana Pro (ресми үлгі идентификаторы gemini-3-pro-image-preview) Gemini 3 Pro кескінді жасау / кескінді өңдеу нұсқасы болып табылады. Бұл 2K/4K шығысын, жоғары дәлдіктегі көп кескін композициясын қосатын, алдын ала қарау сатысы, кәсіби деңгейдегі кескін үлгісі. 14 анықтамалық суреттер, үшін таңбаның сәйкестігі 5 адамға дейін), кескіндегі мәтінді күшейту және нақты әлем фактілерін іздеу негізі.
Негізгі ерекшеліктері
- Мәтін → Сурет: күшті жедел ұстануы бар толық жедел басқарылатын ұрпақ.
- Кескін → Кескін (өңдеу): бірнеше өңдеуде тақырып/сипат сәйкестігі сақталған жақсы, мақсатты өңдеулер.
- Максималды шығыс ажыратымдылығы: дейін 4K (Мысалдар мен қолдау көрсетілетін нақты пиксел өлшемдері арақатынасына байланысты; API 1K/2K/4K алдын ала орнатуларды көрсетеді)
- Итеративті жоспарлау және өзін-өзі түзету: жалпы көрнекі қателерді анықтайтын және түзететін ішкі «көп сатылы» құбыр желісі (перспективалық, мәтін, тамаша геометрия).
- Кескін ішіндегі кеңейтілген мәтінді көрсету: плакаттарға, макеттерге және инфографикаға жарамды анық, түсінікті көп тілді мәтін (ұзын абзацтарға қысқаша жазулар).
- 5 таңбалар дейін адалдық 14 нысан/анықтамалық кескіндер бір жұмыс үрдісінде.
- Су таңбалау/шығу: барлық жасалған кескіндер SynthID су белгісін қамтиды; модель кейбір өнім интеграцияларында шығу тегі үшін C2PA метадеректерін ендіреді.
Gemini 3 Pro кескін нұсқалары және атаулары
gemini-3-pro-image-previewgemini-3-pro-image
Техникалық мәліметтер
сәулет
- Тегі / омыртқасы: Nano Banana Pro Google-дың дамып келе жатқан Gemini кескіндер стекіне, әсіресе жаңасына құрылады Gemini 3 Pro Image / GEMPIX 2 архитектура (сиымдылығы жоғары мультимодальды кескін+мәтіндік құрылым). Бұл эволюция Gemini 2.5 Flash кескіні (түпнұсқа «нано-банан») кеңейтілген көру-тілді ойлау мүмкіндіктері бар жергілікті мультимодальды кескін үлгісіне айналды.
- Үлгі мінез-құлық: жергілікті мультимодальдылық (сурет + мәтін + әлем туралы білім), көп кескінді біріктіруге арналған айқын конвейерлер және бір статикалық үлгіні жасаудың орнына бірнеше өту арқылы нәтижелерді нақтылайтын ішкі кезеңді жоспарлаушы. Алғашқы есептер алдыңғы нұсқаларға қарағанда күшті геометриялық/оптикалық пайымдауды (әйнек, сыну) көрсетеді.
- Ойлау / ішкі нақтылау: Модель композицияны нақтылау үшін ішкі көрінетін "ойлау" процесін пайдаланады (API бұл әрекетті құжаттайды және сол ішкі қадамдар соңғы кескін таңбалауыштары ретінде ақы алынбайтынын ескертеді).
- Жерге қосу және құралдар: Қолдайды Жерлендіруді іздеу (диаграммаға/инфографиялық генерацияға веб-фактілерді қосуға болады). Ол сондай-ақ детерминирленген басқару үшін жүйелік нұсқауларды қолдайды.
Негізгі API параметрлері:
thinking_level(төмен/жоғары) сауда кідірісі мен пайымдау тереңдігі;media_resolution(төмен/орташа/жоғары) кескін OCR/детальдарды оқу белгілерін басқару үшін;generationConfig.imageConfigкескін шығыстарындағы арақатынасты/ажырымдылықты басқару үшін.
Кескін шектеулері:
- Қолдау көрсетілетін енгізу әдістері: Мәтін және кескіндер (модель аудио немесе бейнені кескін жасау кірістері ретінде қабылдамайды).
- Бір шақырудағы максималды кескіндер: 14 (Gemini 3 Pro Image алдын ала қарау үшін).
- Суреттің максималды өлшемі (жүктеп салу): Енгізілген кескін үшін 7 МБ.
- Қолдау көрсетілетін арақатынастары: 1:1, 3:2, 16:9, 9:16, 21:9, т.б.
Шығару кескіндері/белгілері: жоғары шектеулер, 4K/4096px қолдау көрсетеді.
Эталондық өнімділік
Қысқаша қорытынды: әзірге жалпыға ортақ/алғашқы эталондар негізінен сапалы/қауымдастыққа негізделген, бірақ бастапқы нано-бананға (Gemini 2.5 Flash Image) қарағанда ажыратымдылық, артефакттарды азайту және физикалық сенімділік бойынша айтарлықтай жақсартулар туралы дәйекті түрде хабарлайды. Арнайы аталған «қиындықтар» айқын көрнекі жетістіктерді көрсетті, бірақ v1 → v2 стандартты кескін жасау көрсеткіштері бойынша салыстыратын Google ұсынған стандартталған (жалпыға ортақ) сандық эталондық кестелер әлі жоқ.
- Сапалы қауымдастық сынақтары: Таза жиектер, айқынырақ микро-детальдар, шынайы түстер және сенімдірек жылдам ұстану (галлюцинацияланған тіректер азырақ, дәйекті кейіпкерлер). Танымал бейресми сынақтарға GEMPIX2 (Nano Banana Pro) мөлдірлік пен сынуды бұрынғы құрастырылғандарға қарағанда айтарлықтай жақсырақ басқаратын «Шарап шыны сынағы» және «Шыны Бургер Челленджі» кіреді.
- Мәтінді өңдеу: Nano Banana Pro кескіндер ішіндегі көрінетін жақсартылған типография мен мәтінді орналастыруды көрсетеді (көптеген кескін үлгілері үшін тұрақты әлсіздік). Қауымдастық салыстырулары бұрмаланған глифтердің аз екенін көрсетеді.
- Өткізу / UX: жылдамырақ итерация жылдамдығы және артқы жағында көп сатылы нақтылауды орындайтын UX, осылайша пайдаланушылар сенімдірек бірінші өту нәтижелерін көреді (қолмен қайталауды азайтады).
Шектеулер мен тәуекелдер
- Мазмұн сүзгілері және анықтау: Үлгіні біріктіретін платформалар (мысалы, Whisk/үшінші тарап қолданбалары) атақты немесе ұқсастықты анықтауды қосып, белгілі бір нәтижелерді бұғаттауы мүмкін, бұл танымал адамдардың шынайы ұқсастықтарына негізделген шығармашылық жұмыс үрдістеріне әсер етеді.
- Галлюцинация/ойлаудың шеткі жағдайлары: жетілдірілгенімен, модель әлі де физикалық шындыққа сәйкес келмейтін артефакттарды, әсіресе кескіндер ішіндегі тығыз символдық мәтінді немесе жоғары техникалық диаграммаларды жасай алады, бірақ NB2 бұл қателерді бұрынғы нұсқалармен салыстырғанда азайтады.
- Қауіпсіздік және дұрыс пайдаланбау: генеративті кескін үлгілері проблемалық немесе зиянды мазмұнды жасау үшін пайдаланылуы мүмкін. Google шығу тегін анықтау үшін шектеулерді, мазмұн сүзгілерін және SynthID су белгісін қолданады; соған қарамастан, теріс пайдалану орын алды (саяси тұрғыдан сезімтал ортада жасалған Nano Banana кескініне байланысты жоғары профильді дау).
Nano Banana Pro басқа модельдерге қарағанда қалай жиналады
- Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro кескіні) — күшті мобильді интеграция, көп кескінді біріктіру, қайталанатын өзін-өзі түзету, 2K жергілікті/4K масштабтау, Google қолданбаларына (Search, Photos, Workspace/Gemini) тығыз біріктірілген. Сенімді өңдеулерді, үздіксіздікті және Google қызметтерімен интеграцияны қажет ететін жұмыс процестері үшін ең жақсы нұсқа.
- Орташа сапар — стильдендірілген көркемдік нәтижелер мен қауымдастыққа негізделген жедел инженерияда озық; әдетте фото-дәл көп кескінді біріктіруге немесе терең мультимодальды өңдеу құбырларына бағытталмаған.
- Тұрақты диффузия / ашық салмақтар — толығымен ашық, жоғары теңшеуге болатын және жергілікті жерде қолайлы; бақылау-өткізу пункттерінің экожүйесі және дәл баптау зерттеу және офлайн пайдалану үшін шешуші артықшылық болып табылады. Nano Banana Pro-ға қарағанда, «бір рет басу» мобильді интеграциясы азырақ және көп кескінді өңдеудің үйлесімділігі азырақ.
- Seedream 4.0 (ByteDance) — жақында ультра жылдам көрсетуді, 2K шығаруды және көптеген анықтамалық кескіндерді (алтыға дейін) қолдауды ерекше көрсететін Nano Banana бәсекелесі ретінде анық көрсетілген. Профессор/жасаушы баламасы ретінде орналастырылған.
(Бұл салыстырулар жоғары деңгейде; құралды жұмыс үрдісіне сәйкестендіру арқылы жеңімпазды таңдаңыз: ашықтық/бейнелеу мүмкіндігі → Тұрақты диффузия; стильдендірілген өнер → Орташа саяхат; агрессивті итерациямен біріктірілген, дәйекті мобильді өңдеу → Nano Banana Pro/ Gemini 3 Pro суреттер тобы.)
Нақты әлемдегі қолдану жағдайлары
- Мобильді фотосуреттерді өңдеу және шығармашылық сүзгілер (Google Photos интеграциясы — рестайлинг, фондық біріктіру, портретті қайта құрастыру).
- Маркетинг және жарнама активтері — концепцияны жылдам генерациялау, бірнеше кадр/бұрыштардағы тұрақты бренд кейіпкерлері.
- Концепциялық өнер және сюжеттік тақта — көп кескінді біріктіру панельдерде кейіпкердің үздіксіздігін сақтауға көмектеседі.
- Электрондық коммерция/өнім макеттері — әртүрлі контексттерде/жарық жағдайларында дәйекті өнім суреттерін жасау.
- AR/VR активтері үшін жылдам прототиптеу — иммерсивті пайдалану үшін кеңейтуге болатын жоғары сапалы 2K/4K шығыстары.
Gemini-3-pro-image() қалай шақыруға боладыNano Banana Pro) API
CometAPI жүйесіндегі Nano Banana API бағасы, ресми бағадан 20% жеңілдік:
| баға | $0.19200 |
Қажетті қадамдар
- Жүйеге кіріңіз cometapi.com. Егер сіз әлі біздің пайдаланушы болмасаңыз, алдымен тіркеліңіз
- Интерфейстің кіру тіркелгі деректерінің API кілтін алыңыз. Жеке орталықтағы API токеніндегі «Токенді қосу» түймесін басыңыз, таңбалауыш кілтін алыңыз: sk-xxxxx және жіберіңіз.
- Осы сайттың URL мекенжайын алыңыз: https://api.cometapi.com/
Пайдалану әдісі
- “
gemini-3-pro-image” API сұрауын жіберуге және сұраудың негізгі бөлігін орнатуға арналған соңғы нүкте. Сұрау әдісі мен сұрау мәтіні біздің веб-сайт API құжатынан алынған. Біздің веб-сайт сізге ыңғайлы болу үшін Apifox сынағын да ұсынады. - Ауыстыру тіркелгіңізден нақты CometAPI кілтімен.
- Мазмұн өрісіне сұрағыңызды немесе сұрауыңызды енгізіңіз — үлгі осыған жауап береді.
- . Жасалған жауапты алу үшін API жауабын өңдеңіз.
CometAPI үздіксіз тасымалдау үшін толық үйлесімді REST API қамтамасыз етеді. Негізгі мәліметтер:
- Негізгі URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
- Модель атаулары:
gemini-3-pro-image - Түпнұсқалық растама:
Bearer YOUR_CometAPI_API_KEYтақырып - Мазмұн түрі:
application/json.
Сондай-ақ, қараңыз Gemini 2.5 Flash кескін API (нано-банан)



