Gemini 3 Pro (Preview) — Gemini 3 отбасындағы Google/DeepMind компаниясының ең жаңа флагмандық мультимодальды пайымдау моделі. Оны «әзірге ең ақылды модельдері» ретінде ұсынады; ол терең пайымдауға, агенттік жұмыс ағындарына, жетілдірілген кодтауға және ұзын-контексті мультимодальды түсінуге (мәтін, кескіндер, аудио, бейне, код және құралдармен ықпалдасу) арналған.
Негізгі мүмкіндіктері
- Модальдар: Мәтін, кескін, бейне, аудио, PDF файлдары (және құралдардың құрылымдалған шығыстары).
- Агенттік/құралдар: Кіріктірілген функцияларды шақыру, search-as-tool, кодты орындау, URL контексті және көпқадамды агенттерді оркестрациялауды қолдау. Thought-signature механизмі шақырулар арасында көпқадамды пайымдауды сақтайды.
- Кодтау және “vibe coding”: Фронтенд генерациясына, интерактивті UI генерациясына және агенттік кодтауға оңтайландырылған (Google хабарлаған тиісті рейтингтерде көш бастап тұр). Бұл олардың осы уақытқа дейінгі ең қуатты “vibe-coding” моделі ретінде ұсынылады.
- Жаңа әзірлеуші басқарымдары:
thinking_level(low|high) — құн/кідіріс пен пайымдау тереңдігі арасындағы ымыраны реттеу, алmedia_resolution— әрбір кескін не бейне кадры үшін мультимодальды айқындықты басқару. Бұл өнімділік, кідіріс және құн арасындағы тепе-теңдікті ұстауға көмектеседі.
Бенчмарк нәтижелері
- Gemini3Pro LMARE-де 1501 ұпаймен бірінші орын алып, Grok-4.1-thinking-нің 1484 ұпайын басып озды және Claude Sonnet 4.5 пен Opus 4.1-ді де артта қалдырды.
- Сондай-ақ WebDevArena бағдарламалау аренасында 1487 ұпаймен бірінші орынға шықты.
- Humanity’s Last Exam академиялық пайымдауында — 37.5% (құралдарсыз); GPQA Diamond ғылымында — 91.9%; ал MathArena Apex математика сайысында — 23.4%, жаңа рекорд орнатты.
- Мультимодальды мүмкіндіктерде MMMU-Pro — 81%; ал Video-MMMU бейне түсінуінде — 87.6%.
Техникалық егжей-тегжейі және архитектурасы
- “Thinking level” параметрі: Gemini 3
thinking_levelбасқарымын ұсынады, ол әзірлеушілерге ішкі пайымдау тереңдігі мен кідіріс/құн арасындағы ымыраны таңдауға мүмкіндік береді. Модельthinking_level-ді ішкі көпқадамды пайымдауға берілетін салыстырмалы рұқсат ретінде қарастырады, қатаң токен кепілдігі ретінде емес. Pro үшін әдетте әдепкі мәні —high. Бұл көпқадамды жоспарлау мен ой-тізбегі тереңдігін баптауға арналған айқын жаңа басқарым. - Құрылымдалған шығыстар және құралдар: Модель құрылымдалған JSON шығыстарын қолдайды және кіріктірілген құралдармен (Google Search негіздеуі, URL контексті, код орындау және т.б.) бірге қолданылуы мүмкін. Құрылымдалған шығыс + құралдардағы кейбір мүмкіндіктер тек
gemini-3-pro-previewүшін алдын ала қаралымда. - Мультимодальды және агенттік интеграциялар: Gemini 3 Pro агенттік жұмыс ағымдарына арнайы жасалған (құралдар + код/терминал/браузер бойынша бірнеше агент).
Шектеулер және белгілі ескертпелер
- Фактологиялық дәлдік мінсіз емес — галлюцинациялар мүмкін. Google мәлімдеген жетілдірулерге қарамастан, жоғары тәуекел салаларда (құқықтық, медициналық, қаржылық) дереккөзге негіздеу және адамдық шолу қажет.
- Ұзын контекстегі өнімділік тапсырмаға тәуелді. 1M енгізу терезесін қолдау — нақты мүмкіндік, бірақ өте ұзын контексттерде кейбір бенчмарктерде тәжірибелік тиімділік төмендеуі мүмкін (бірқатар ұзын-контекст тесттерінде 1M-де нүктелік төмендеулер байқалған).
- Құн мен кідіріс арасындағы ымыралар. Үлкен контексттер және жоғары
thinking_levelбаптаулары есептеу жүктемесін, кідірісті және құнды арттырады; баға деңгейлері токен көлеміне байланысты қолданылады. Құнды басқару үшінthinking_levelмен бөлшектеу стратегияларын пайдаланыңыз. - Қауіпсіздік және мазмұн сүзгілері. Google қауіпсіздік саясаттарын және модерация қабаттарын қолдануды жалғастыруда; кейбір мазмұн мен әрекеттер шектелген немесе бас тарту режимдерін іске қосады.
Gemini 3 Pro Preview басқа үздік модельдермен салыстыру
Жоғары деңгейлі салыстыру (превью → сапалық):
Gemini 2.5 Pro-пен салыстырғанда: Пайымдау, агенттік құралдарды пайдалану және мультимодальды интеграцияда сапалы секіріс; әлдеқайда үлкен контекстті өңдеу және ұзақ пішіндегі мазмұнды жақсырақ түсіну. DeepMind академиялық пайымдау, кодтау және мультимодальды тапсырмаларда тұрақты өсімдер көрсетеді.
GPT-5.1 және Claude Sonnet 4.5-пен салыстырғанда (есеп бойынша): Google/DeepMind ұсынған бенчмарк жинағында Gemini 3 Pro агенттік, мультимодальды және ұзын контекстке қатысты бірнеше метрикада алда көрсетіледі (мысалы, Terminal-Bench, MMMU-Pro, AIME). Нақты салыстырмалы нәтижелер тапсырмаға байланысты өзгереді.
Әдеттегі және жоғары құндылықты қолдану сценарийлері
- Үлкен құжат/кітапты қысқаша мазмұндау және Q&A: ұзын контекст қолдауы құқықтық, зерттеу және сәйкестік командалары үшін тартымды етеді.
- Репозиторий ауқымында кодты түсіну және генерация: кодтау құралдар тізбегімен интеграция және жетілдірілген пайымдау үлкен код базасын рефакторлау мен автоматтандырылған код шолу үрдістеріне көмектеседі.
- Мультимодальды өнім ассистенттері: кескін + мәтін + аудио жұмыс ағымдары (скриншоттар, қоңырау үзінділері және құжаттарды қабылдайтын клиент қолдау).
- Медиа генерациясы және өңдеу (фото → видео): Gemini отбасының бұрынғы мүмкіндіктері енді Veo/Flow-стиліндегі фото→видео мүмкіндіктерін қамтиды; алдын ала қаралым прототиптер мен медиа жұмыс ағымдары үшін тереңірек мультимедиа генерациясын меңзейді.
Gemini 3 Pro API-іне қалай қол жеткізуге болады
1-қадам: API кілтіне тіркелу
cometapi.com сайтына кіріңіз. Егер әлі пайдаланушы емес болсаңыз, алдымен тіркеліңіз. Жеке аккаунтыңызға кіріп, CometAPI console бетіне өтіңіз. Интерфейске қол жеткізуге арналған API кілтін алыңыз. Жеке кабинеттің API token бөлімінде “Add Token” түймесін басып, token кілтін алыңыз: sk-xxxxx және жіберіңіз.
2-қадам: Gemini 3 Pro API-іне сұрау жіберу
API сұрауын жіберу үшін “gemini-3-pro” endpoint-ін таңдаңыз және сұрау денесін орнатыңыз. Сұрау әдісі мен сұрау денесі біздің вебсайттағы API құжатынан алынады. Ыңғайлы болу үшін вебсайтта Apifox тесті де бар. <YOUR_API_KEY> мәнін аккаунтыңыздағы нақты CometAPI кілтімен ауыстырыңыз. base url — Gemini Generating Content және Chat
Сұрағыңызды немесе тапсырмаңызды content өрісіне енгізіңіз — модель дәл соған жауап береді. Генерацияланған жауапты алу үшін API жауаптарын өңдеңіз.
3-қадам: Нәтижелерді алу және тексеру
Генерацияланған жауапты алу үшін API жауаптарын өңдеңіз. Өңделгеннен кейін API тапсырма мәртебесі мен шығыс деректерін қайтарады.