Негізгі мүмкіндіктер
- Мәтін → Сурет: промптқа қатаң сәйкестікпен толық промптқа негізделген генерация.
- Сурет → Сурет (түзетулер): бірқатар түзетулер барысында субъект/кейіпкер тұрақтылығын сақтай отырып, дәл, нысаналы түзетулер.
- Ең жоғары шығыс ажыратымдылығы: 4K-қа дейін (мысалдар мен қолдау көрсетілетін нақты пиксель өлшемдері аспект қатынасына байланысты; API 1K/2K/4K алдын ала баптауларын ұсынады)
- Итеративті жоспарлау және өзін-өзі түзету: жиі кездесетін визуалды қателерді (перспектива, мәтін, нәзік геометрия) анықтап, түзететін ішкі «көп сатылы» конвейер.
- Сурет ішіндегі мәтінді жетілдірілген көрсету: постерлер, мокаптар және инфографика үшін қолайлы, анық әрі оқуға жеңіл көптілді мәтін (қысқа жазулардан ұзын абзацтарға дейін).
- Бір жұмыс шеңберінде 5 кейіпкер және 14 нысан/анықтамалық суретке дейінгі дәлдік.
- Сутаңба / шығу тегі: барлық жасалған суреттер SynthID сутаңбасын қамтиды; кейбір өнімдік интеграцияларда модель түпнұсқалылығын растау үшін C2PA метадеректерін ендіреді.
Gemini 3 Pro Image нұсқалары мен атаулары
gemini-3-pro-image-previewgemini-3-pro-image
Техникалық мәліметтер
Архитектура
- Тегі/арқаулығы: Nano Banana Pro Google-дың дамып келе жатқан Gemini кескін стекіне негізделген — дәлірек айтқанда жаңа Gemini 3 Pro Image / GEMPIX 2 архитектурасына (жоғары сыйымдылықты кескін+мәтін мультимодальды негіз). Бұл Gemini 2.5 Flash Image (бастапқы «nano-banana») нұсқасынан табиғи мультимодальды, көбірек көру-тілдік пайымдау мүмкіндіктері бар кескін моделіне эволюция.
- Модельдің мінез-құлқы: табиғи мультимодалдылық (кескін + мәтін + әлем туралы білім), көп суретті біріктіруге арналған айқын конвейерлер, сондай-ақ бір реттік статикалық үлгі орнына бірнеше өту арқылы нәтижені жетілдіретін ішкі кезеңдік жоспарлағыш. Алғашқы есептер алдыңғы нұсқаларға қарағанда геометриялық/оптикалық пайымдаудың (шыны, сыну) күшейгенін көрсетеді.
- Ойлау / ішкі жетілдіру: Модель композицияны жетілдіру үшін ішкі жағында көрінетін «ойлау» үдерісін қолданады (API бұл мінез-құлықты құжаттайды және осы ішкі қадамдарға соңғы сурет токендері ретінде ақы алынбайтынын ескертеді).
- Негіздеу және құралдар: Search grounding қолдайды (диаграмма/инфографика генерациясына веб деректерін қоса алады). Сондай-ақ неғұрлым детерминистік басқару үшін жүйелік нұсқауларды қолдайды.
Негізгі API параметрлері:
thinking_level(low / high) кідіріс уақыты мен пайым тереңдігі арасындағы таңдау үшін;media_resolution(low/medium/high) суреттегі OCR/деталь оқу токендерін басқару үшін;generationConfig.imageConfigсурет шығыстарындағы аспект қатынасы/ажыратымдылығын басқару үшін.
Сурет шектеулері:
- Қолдау көрсетілетін кіріс модальдіктері: Мәтін және суреттер (модель сурет генерациясына аудио немесе видеоны кіріс ретінде қабылдамайды).
- Бір промптқа ең көп сурет саны: 14 (Gemini 3 Pro Image preview үшін).
- Суреттің ең үлкен көлемі (жүктеу): әрбір кіріс сурет үшін 7 MB.
- Қолдау көрсетілетін аспект қатынастары: 1:1, 3:2, 16:9, 9:16, 21:9 және т.б.
Шығыс суреттері / токендер: жоғары шектер, 4K/4096px қолдауымен.
Эталондық өнімділік
Қысқаша түйін: әзірге жария/ерте бенчмарктер негізінен сапалық және қауымдастыққа сүйенген, бірақ бастапқы nano-banana (Gemini 2.5 Flash Image) нұсқасымен салыстырғанда ажыратымдылық, артефакттарды азайту және физикалық дәлдік тұрғысынан елеулі жақсартуларды тұрақты түрде хабарлайды. Атаулы «сын-қатерлер» айқын визуалды табыстар көрсетті, алайда v1 → v2 салыстыруына арналған стандартты кескін генерациясы метрикалары бойынша Google тарапынан (публичті) стандартталған сандық кестелер әлі жоқ.
- Қауымдастықтың сапалық сынақтары: таза қырлар, өткір микро-детальдар, шынайырақ түстер және промптқа адалдықтың жоғарылауы (ойдан шығарылған реквизиттер аз, кейіпкерлер тұрақтырақ). Танымал бейресми сынақтарға «Wine Glass Test» және «Glass Burger Challenge» жатады, мұнда GEMPIX2 (Nano Banana Pro) мөлдірлік пен сынуды алдыңғы құранымдарға қарағанда айтарлықтай жақсырақ өңдейді.
- Мәтінмен жұмыс: Nano Banana Pro суреттер ішіндегі типография мен мәтінді орналастыруды көзге көрінерлік жақсартты (көптеген кескін модельдері үшін тұрақты әлсіз тұс). Қауымдастық салыстырулары бүлінген глифтердің азайғанын көрсетеді.
- Өткізу қабілеті / UX: итерация жылдамдығы жоғары және артқы жақта көпсатылы жетілдіру орындайтын UX, сондықтан қолданушылар алғашқы өтуде анағұрлым сенімді нәтижелер көреді (қолмен қайта генерациялауды азайтады).
Шектеулер мен тәуекелдер
- Мазмұн сүзгілері және анықтау: Модель біріктірілген платформалар (мысалы, Whisk/үшінші тарап қолданбалары) қатаң танымал тұлғаларды немесе ұқсастықтарды анықтауды қосып, кейбір нәтижелерді бұғаттауы мүмкін; бұл реалистік танымал тұлға ұқсастықтарына сүйенетін шығармашылық жұмыс процестеріне әсер етеді.
- Қиялдау / пайымдаудың шекаралық жағдайлары: жетілдірілгеніне қарамастан, модель әлі де физикалық тұрғыдан шынайы емес артефактілер шығара алады, әсіресе суреттер ішіндегі тығыз символдық мәтін немесе тым техникалық диаграммалар кезінде — дегенмен NB2 мұндай қателерді алдыңғы нұсқалармен салыстырғанда азайтатын сияқты.
- Қауіпсіздік және теріс пайдалану: генеративті кескін модельдері проблемалы немесе зиянды мазмұн жасауға қолданылуы мүмкін. Google шығу тегін растауға көмектесу үшін шектеулер, мазмұн сүзгілері және SynthID сутаңбасын қолданады; соған қарамастан, теріс пайдалану жағдайлары болған (саяси сезімтал ортада Nano Banana жасаған суретке байланысты көпшілік назарына іліккен дау).
Nano Banana Pro басқа модельдермен салыстырғанда
- Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — қуатты мобильді интеграция, көп суретті біріктіру, итеративті өзін-өзі түзету, 2K табиғи/4K апскейлинг, Google қолданбаларымен (Search, Photos, Workspace/Gemini) тығыз интеграция. Сенімді түзетулерді, тұтастықты және Google қызметтерімен интеграцияны қажет ететін жұмыс процестеріне ең қолайлы.
- Midjourney — стильдендірілген көркем нәтижелерде және қауымдастыққа негізделген промпт-инженерингте озады; әдетте фото-тораптағы дәл көп суретті біріктіру немесе терең мультимодальды өңдеу конвейерлеріне арналмаған.
- Stable Diffusion / open weights — толық ашық, жоғары мөлшерде бапталатын және локалды түрде орналастыруға болады; checkpoint-тер мен fine-tuning экожүйесі зерттеу және офлайн қолдану үшін шешуші артықшылық. Nano Banana Pro-ға қарағанда дайын күйінде «бір рет басу» мобильді интеграциясы аз және көп суретті өңдеуде тұтастығы төменірек.
- Seedream 4.0 (ByteDance) — жақында Nano Banana бәсекелесі ретінде айқын позицияланды, өте жылдам рендерингті, 2K шығысты және көптеген анықтамалық суреттерді (алтауға дейін) қолдауды ерекше атап өтеді. Кәсіби/креаторларға балама ретінде ұсынылады.
(Бұл салыстырулар жоғары деңгейде; жеңімпазды өз жұмыс процесіңізге сәйкес таңдаңыз: ашықтық/бейімделгіштік → Stable Diffusion; стильдендірілген өнер → Midjourney; интеграцияланған, тұрақты мобильді өңдеу және агрессивті итерация → Nano Banana Pro/ Gemini 3 Pro image тобы.)
Нақты қолдану жағдайлары
- Мобильді фотоөңдеу және креативті фильтрлер (Google Photos интеграциялары — қайта стильдеу, фондарды біріктіру, портретті қайта композициялау).
- Маркетинг және жарнамалық активтер — жылдам концепт генерациясы, бірнеше кадр/ракурста тұрақты бренд кейіпкерлері.
- Концепт-арт және сторибординг — көп суретті біріктіру панельдер бойынша кейіпкердің тұтастығын сақтауға көмектеседі.
- Электрондық сауда / өнім мокаптары — әртүрлі контекст/жарықта тұрақты өнім түсірілімдерін генерациялау.
- AR/VR активтері үшін жедел прототиптеу — жоғары сапалы 2K/4K шығыстар, иммерсивті қолдануларға апскейл жасауға болады.
- gemini-3-pro-image(Nano Banana Pro) API-ге қол жеткізу тәсілі
Қажетті қадамдар
- cometapi.com сайтына кіріңіз. Егер әлі пайдаланушы болмасаңыз, алдымен тіркеліңіз
- Интерфейске арналған қолжетімділік API кілтін алыңыз. Жеке кабинеттегі API token бөлімінде “Add Token” батырмасын басып, токен кілтін алыңыз: sk-xxxxx және жіберіңіз.
- Осы сайттың URL мекенжайын алыңыз: https://api.cometapi.com/
Қолдану әдісі
- API сұрауын жіберу үшін “
gemini-3-pro-image” endpoint-н таңдап, сұрау денесін орнатыңыз. Сұрау әдісі мен денесі біздің веб-сайттағы API құжатынан алынады. Ыңғайлылық үшін веб-сайтта Apifox тесті де бар. - <YOUR_API_KEY> мәнін аккаунтыңыздағы нақты CometAPI кілтімен ауыстырыңыз.
- Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель осыған жауап береді.
- . Генерацияланған жауапты алу үшін API жауапты өңдеңіз.
CometAPI толық үйлесімді REST API ұсынады — үздіксіз көшу үшін. Негізгі мәліметтер :
- Негізгі URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
- Модель атаулары:
gemini-3-pro-image - Аутентификация:
Bearer YOUR_CometAPI_API_KEYheader - Content-Type:
application/json.