Gemini 3 Pro (Preview) — Google/DeepMind-тің Gemini 3 отбасындағы ең жаңа флагмандық мультимодальды пайымдау моделі. Ол олардың «осы уақытқа дейінгі ең ақылды моделі» ретінде позицияланған, терең пайымдау, агенттік жұмыс ағындары, жетілдірілген кодтау және ұзақ контексттегі мультимодальды түсіну (мәтін, кескіндер, аудио, видео, код және құрал интеграциялары) үшін әзірленген.
Негізгі мүмкіндіктер
- Модальдылықтар: мәтін, кескін, видео, аудио, PDF файлдары (және құралдардың құрылымдалған нәтижелері).
- Агенттік/құралдар: кіріктірілген функция шақыру, іздеуді құрал ретінде пайдалану, код орындау, URL контексті және көпқадамды агенттерді оркестрациялауды қолдау. Thought-signature механизмі шақырулар арасында көпқадамды ойлау тізбегін сақтайды.
- Кодтау және “vibe coding”: фронт-энд генерациясына, интерактивті UI генерациясына және агенттік кодтауға оңтайландырылған (Google хабарлаған тиісті лидербордтарда үздік көрсеткіштер). Бұл олардың осы уақытқа дейінгі ең мықты “vibe-coding” моделі ретінде ұсынылады.
- Жаңа әзірлеуші басқарулары:
thinking_level(low|high) — құн/кідіріс пен пайымдау тереңдігі арасындағы айырбасқа мүмкіндік береді, алmedia_resolutionәрбір кескін немесе видео кадры үшін мультимодальды айқындықты басқарады. Бұлар өнімділік, кідіріс және құн арасындағы тепе-теңдікті реттеуге көмектеседі.
Бенчмарк өнімділігі
- Gemini3Pro LMARE-де 1501 ұпаймен бірінші орынға ие болды, Grok-4.1-thinking-тің 1484 ұпайын басып озды және Claude Sonnet 4.5 пен Opus 4.1-ден де алда болды.
- Сондай-ақ WebDevArena бағдарламалау аренасында 1487 ұпаймен бірінші орынға шықты.
- Humanity’s Last Exam академиялық пайымдауда 37.5% (құралдарсыз); GPQA Diamond ғылымында 91.9%; ал MathArena Apex математика сайысында 23.4% көрсетіп, жаңа рекорд орнатты.
- Мультимодальды мүмкіндіктерде MMMU-Pro — 81%; ал Video-MMMU видео түсінуінде 87.6% нәтижеге жетті.
Техникалық мәліметтер мен архитектура
- “Thinking level” параметрі: Gemini 3
thinking_levelбасқаруын ұсынады, ол әзірлеушілерге ішкі көпқадамды пайымдау тереңдігін кідіріс/құнмен теңестіруге мүмкіндік береді. Модельthinking_levelмәнін ішкі көпқадамды пайымға арналған салыстырмалы мүмкіндік ретінде қарастырады, қатаң токен кепілдігі ретінде емес. Әдетте Pro үшін әдепкі —high. Бұл әзірлеушілерге көпқадамды жоспарлау және ой тізбегі тереңдігін баптау үшін арналған жаңа тікелей басқару. - Құрылымдалған шығулар және құралдар: Модель құрылымдалған JSON шығуларын қолдайды және кіріктірілген құралдармен (Google Search grounding, URL контексті, код орындау және т.б.) біріктіріле алады. Құрылымдалған шығу + құралдар мүмкіндіктерінің кейбірі
gemini-3-pro-previewүшін тек алдын ала қарауда. - Мультимодальды және агенттік интеграциялар: Gemini 3 Pro нақты түрде агенттік жұмыс ағындары үшін жасалған (құралдар + код/терминал/браузер бойынша бірнеше агент).
Шектеулер және белгілі ескертпелер
- Фактілік дәлдік мінсіз емес — галлюцинациялар әлі де мүмкін. Google-дың дәлдікке қатысты елеулі жақсартуларына қарамастан, жоғары тәуекелді жағдайларда (құқық, медицина, қаржы) тексерілген негіздеу және адамдық шолу әлі де қажет.
- Ұзақ контексттегі өнімділік тапсырмаға байланысты өзгеруі мүмкін. 1M енгізу терезесін қолдау — техникалық мүмкіндік, бірақ эмпирикалық тиімділік экстремалды ұзындықтарда кейбір бенчмарктерде төмендеуі мүмкін (кейбір ұзақ-контекст сынақтарында 1M-де нүктелік төмендеулер байқалды).
- Құн және кідіріс арасындағы айырбас. Үлкен контексттер және жоғары
thinking_levelесептеуді, кідірісті және құнды арттырады; бағалар токен көлеміне қарай деңгейленеді. Құнды басқару үшінthinking_levelжәне бөлу стратегияларын қолданыңыз. - Қауіпсіздік және мазмұн сүзгілері. Google қауіпсіздік саясаттары мен модерация қабаттарын қолдануды жалғастыруда; кейбір мазмұндар мен әрекеттер шектелген немесе бас тарту режимдерін іске қосады.
Gemini 3 Pro Preview-дың басқа жоғары деңгейлі модельдермен салыстырылуы
Жалпы деңгейдегі салыстыру (preview → сапалық):
Gemini 2.5 Pro-мен салыстырғанда: Пайымдау, агенттік құрал қолдану және мультимодальды интеграцияда қадамдық жақсартулар; әлдеқайда үлкен контекстті өңдеу және ұзақ мәтіндерді жақсырақ түсіну. DeepMind академиялық пайымдау, кодтау және мультимодальды тапсырмаларда тұрақты өсім көрсетеді.
GPT-5.1 және Claude Sonnet 4.5-пен салыстырғанда (берілген мәліметтер бойынша): Google/DeepMind-тің бенчмарк топтамасында Gemini 3 Pro бірнеше агенттік, мультимодальды және ұзақ-контекст метрикаларында алда деп көрсетіледі (Terminal-Bench, MMMU-Pro, AIME). Салыстырмалы нәтижелер тапсырмаға байланысты өзгереді.
Әдеттегі және жоғары құндылықтағы қолдану сценарийлері
- Үлкен құжат/кітаптарды қысқарту және Q&A: ұзақ контекст қолдауы оны заң, зерттеу және комплаенс командалары үшін тартымды етеді.
- Репо ауқымында кодты түсіну және генерациялау: кодтау құрал тізбектерімен интеграция және жақсартылған пайымдау үлкен код базаларын рефакторлау және автоматтандырылған код шолу жұмыс ағындарына көмектеседі.
- Көпмодальды өнім ассистенттері: кескін + мәтін + аудио жұмыс ағындары (скриншоттар, қоңырау үзінділері және құжаттарды қабылдайтын тұтынушы қолдауы).
- Медиа генерациясы және өңдеу (фото → видео): Gemini отбасының бұрынғы мүмкіндіктері енді Veo / Flow стиліндегі фото→видео қабілеттерін қамтиды; алдын ала қарау прототиптер мен медиа жұмыс ағындары үшін тереңірек мультимедиа генерациясын ұсынады.
Gemini 3 Pro API-не қалай қол жеткізуге болады
1-қадам: API кілтіне тіркелу
cometapi.com сайтына кіріңіз. Егер әлі пайдаланушы болмасаңыз, алдымен тіркеліңіз. CometAPI консоліне кіріңіз. Интерфейстің қол жеткізу құпия кілті — API key алыңыз. Жеке кабинеттегі API token бөлімінде “Add Token” түймесін басып, token кілтін алыңыз: sk-xxxxx және жіберіңіз.
2-қадам: Gemini 3 Pro API-не сұраулар жіберу
API сұрауын жіберу үшін “gemini-3-pro” endpoint-ын таңдаңыз және сұрау денесін орнатыңыз. Сұрау әдісі мен денесін біздің сайттағы API құжаттамасынан алыңыз. Қолайлылық үшін сайтымызда Apifox тесті де бар. <YOUR_API_KEY> мәнін аккаунтыңыздағы нақты CometAPI кілтімен ауыстырыңыз. Негізгі URL: Gemini Generating Content және Chat
Сұрау не өтінішіңізді content өрісіне енгізіңіз — модель осыған жауап береді. Жауап ретінде келген API нәтижесін өңдеп, генерацияланған жауапты алыңыз.
3-қадам: Нәтижелерді алу және тексеру
API жауаптарын өңдеп, генерацияланған нәтижені алыңыз. Өңдеуден кейін API тапсырма мәртебесі мен шығыс деректерін қайтарады.