Gemini 3 Pro (Preview) — новейшая флагманская мультимодальная модель рассуждений Google/DeepMind в семействе Gemini 3. Она позиционируется как их «самая интеллектуальная модель на сегодняшний день», предназначенная для глубоких рассуждений, агентных рабочих процессов, продвинутого программирования и мультимодального понимания с длинным контекстом (текст, изображения, аудио, видео, код и интеграции с инструментами).
Ключевые особенности
- Модальности: текст, изображения, видео, аудио, PDF (а также структурированные выходные данные инструментов).
- Агентность/инструменты: встроенный вызов функций, поиск как инструмент, выполнение кода, URL-контекст и поддержка оркестрации многошаговых агентов. Механизм thought-signature сохраняет многошаговые рассуждения между вызовами.
- Программирование и «vibe coding»: оптимизирована для генерации фронтенда, интерактивных UI и агентного программирования (она возглавляет соответствующие рейтинги, о которых сообщает Google). Продвигается как их самая сильная модель для «vibe-coding» на сегодняшний день.
- Новые элементы управления для разработчиков:
thinking_level(low|high) для компромисса между стоимостью/задержкой и глубиной рассуждений, а такжеmedia_resolutionдля управления качеством мультимодальной обработки для каждого изображения или кадра видео. Это помогает балансировать производительность, задержку и стоимость.
Производительность в бенчмарках
- Gemini3Pro заняла первое место в LMARE с результатом 1501, превзойдя Grok-4.1-thinking с 1484 баллами, а также опередив Claude Sonnet 4.5 и Opus 4.1.
- Она также заняла первое место в арене программирования WebDevArena с результатом 1487.
- В академическом тесте на рассуждение Humanity’s Last Exam она достигла 37.5% (без инструментов); в научном тесте GPQA Diamond — 91.9%; а в математическом соревновании MathArena Apex — 23.4%, установив новый рекорд.
- В мультимодальных возможностях MMMU-Pro достигла 81%; а в понимании видео Video-MMMU — 87.6%.
Технические детали и архитектура
- Параметр “Thinking level”: Gemini 3 предоставляет управление
thinking_level, которое позволяет разработчикам выбирать компромисс между глубиной внутренних рассуждений и задержкой/стоимостью. Модель рассматриваетthinking_levelкак относительное допущение для внутреннего многошагового рассуждения, а не как строгую гарантию числа токенов. По умолчанию для Pro обычно используетсяhigh. Это явный новый элемент управления для разработчиков, позволяющий настраивать многошаговое планирование и глубину chain-of-thought. - Структурированные выходные данные и инструменты: модель поддерживает структурированные JSON-ответы и может использоваться вместе со встроенными инструментами (Google Search grounding, URL-контекст, выполнение кода и т. д.). Некоторые функции structured-output+tools доступны только в preview для
gemini-3-pro-preview. - Мультимодальные и агентные интеграции: Gemini 3 Pro явно создана для агентных рабочих процессов (инструменты + несколько агентов поверх кода/терминалов/браузера).
Ограничения и известные особенности
- Фактическая точность не идеальна — галлюцинации по-прежнему возможны. Несмотря на заявленные Google значительные улучшения фактической точности, в критически важных сценариях (юридических, медицинских, финансовых) по-прежнему необходимы проверка по источникам и человеческий контроль.
- Качество работы с длинным контекстом зависит от задачи. Поддержка входного окна в 1M — это жёсткая техническая возможность, но эмпирическая эффективность на некоторых бенчмарках может снижаться при экстремальной длине (наблюдалось точечное падение результатов на 1M в некоторых тестах длинного контекста).
- Компромисс между стоимостью и задержкой. Большие контексты и более высокие значения
thinking_levelувеличивают вычислительные затраты, задержку и стоимость; ценовые уровни применяются в зависимости от объёма токенов. Используйтеthinking_levelи стратегии разбиения на части, чтобы управлять расходами. - Фильтры безопасности и контента. Google продолжает применять политики безопасности и уровни модерации; определённый контент и действия по-прежнему ограничены или будут вызывать режим отказа.
Как Gemini 3 Pro Preview сравнивается с другими топовыми моделями
Сравнение на высоком уровне (preview → qualitative):
По сравнению с Gemini 2.5 Pro: существенный скачок в рассуждении, агентном использовании инструментов и мультимодальной интеграции; значительно более крупный контекст и лучшее понимание длинных текстов. DeepMind демонстрирует стабильный рост по академическим рассуждениям, программированию и мультимодальным задачам.
По сравнению с GPT-5.1 и Claude Sonnet 4.5 (по опубликованным данным): в наборе бенчмарков Google/DeepMind Gemini 3 Pro представлена как лидер по ряду агентных, мультимодальных и long-context метрик (см. Terminal-Bench, MMMU-Pro, AIME). Сравнительные результаты зависят от конкретной задачи.
Типичные и наиболее ценные сценарии использования
- Суммаризация больших документов / книг и Q&A: поддержка длинного контекста делает модель привлекательной для юридических, исследовательских и комплаенс-команд.
- Понимание и генерация кода в масштабе репозитория: интеграция с инструментами программирования и улучшенные рассуждения помогают при рефакторинге больших кодовых баз и в автоматизированных процессах ревью кода.
- Мультимодальные продуктовые ассистенты: рабочие процессы с изображениями + текстом + аудио (например, клиентская поддержка, которая обрабатывает скриншоты, фрагменты звонков и документы).
- Генерация и редактирование медиа (фото → видео): более ранние возможности семейства Gemini теперь включают функции photo→video в стиле Veo / Flow; preview указывает на более глубокую мультимедийную генерацию для прототипов и медиа-рабочих процессов.
Как получить доступ к API Gemini 3 Pro
Шаг 1: Зарегистрируйтесь и получите API-ключ
Войдите на cometapi.com. Если вы ещё не являетесь нашим пользователем, сначала зарегистрируйтесь. Войдите в свою консоль CometAPI. Получите учётные данные доступа — API-ключ интерфейса. Нажмите “Add Token” в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте его.
Шаг 2: Отправьте запросы к API Gemini 3 Pro
Выберите endpoint “gemini-3-pro”, чтобы отправить API-запрос, и задайте тело запроса. Метод запроса и тело запроса можно получить из API-документации на нашем сайте. Для вашего удобства наш сайт также предоставляет тестирование через Apifox. Замените <YOUR_API_KEY> на ваш фактический ключ CometAPI из вашей учётной записи. Базовый URL: Gemini Generating Content и Chat
Вставьте свой вопрос или запрос в поле content — именно на него модель ответит. Обработайте API-ответ, чтобы получить сгенерированный результат.
Шаг 3: Получите и проверьте результаты
Обработайте API-ответ, чтобы получить сгенерированный результат. После обработки API возвращает статус задачи и выходные данные.