Gemini 3 Pro (Preview) — новейшая флагманская мультимодальная модель рассуждений от Google/DeepMind в семействе Gemini 3. Она позиционируется как их «самая интеллектуальная модель на сегодня», созданная для глубокого рассуждения, агентных рабочих процессов, продвинутого кодирования и мультимодального понимания с длинным контекстом (текст, изображения, аудио, видео, код и интеграции с инструментами).
Ключевые возможности
- Модальности: текст, изображения, видео, аудио, PDF (и структурированные выводы инструментов).
- Агентность/инструменты: встроенные вызовы функций, поиск как инструмент, выполнение кода, контекст URL и поддержка оркестрации многошаговых агентов. Механизм thought-signature сохраняет многошаговое рассуждение между вызовами.
- Кодинг и «vibe coding»: оптимизирована для генерации фронтенда, интерактивной генерации UI и агентного кодинга (возглавляет соответствующие рейтинги по данным Google). Продвигается как их самая сильная модель для «vibe‑coding».
- Новые настройки для разработчиков:
thinking_level(low|high) для баланса стоимости/задержки и глубины рассуждений, а такжеmedia_resolutionдля управления мультимодальной детализацией на изображение или кадр видео. Эти параметры помогают балансировать производительность, задержку и стоимость.
Результаты бенчмарков
- Gemini3Pro заняла первое место в LMARE с результатом 1501, опередив 1484 балла Grok-4.1-thinking, а также лидируя над Claude Sonnet 4.5 и Opus 4.1.
- Также первое место в программировании на арене WebDevArena с результатом 1487.
- В Humanity’s Last Exam (академическое рассуждение) — 37.5% (без инструментов); в GPQA Diamond (наука) — 91.9%; в MathArena Apex (математика) — 23.4%, установив новый рекорд.
- По мультимодальным возможностям: MMMU-Pro — 81%; по пониманию видео в Video‑MMMU — 87.6%.

Технические детали и архитектура
- Параметр «thinking level»: в Gemini 3 доступен контроль
thinking_level, позволяющий разработчикам менять глубину внутренних рассуждений в обмен на задержку/стоимость. Модель трактуетthinking_levelкак относительную «квоту» на внутреннее многошаговое рассуждение, а не как жесткую гарантию токенов. По умолчанию у Pro обычноhigh. Это явный новый регулятор для настройки многошагового планирования и глубины цепочки рассуждений. - Структурированные выводы и инструменты: модель поддерживает структурированные JSON‑выводы и может сочетаться со встроенными инструментами (привязка к результатам Google Search, контекст URL, выполнение кода и др.). Часть возможностей «structured‑output + tools» доступна только в режиме предварительного просмотра для
gemini-3-pro-preview. - Мультимодальные и агентные интеграции: Gemini 3 Pro специально создана для агентных сценариев (инструменты + несколько агентов поверх кода/терминалов/браузера).
- Принимает ввод: текст, изображения, видео, аудио и PDF; вывод — текст.
Ограничения и известные особенности
- Не идеальная фактичность — возможны галлюцинации. Несмотря на заявленные улучшения фактичности, в задачах высокой важности (юридические, медицинские, финансовые) все еще необходимы проверка с опорой на источники и участие человека.
- Производительность на длинном контексте зависит от задачи. Поддержка окна ввода 1M — «жесткая» возможность, но эмпирическая эффективность на экстремальных длинах может падать (наблюдались локальные снижения на 1M в некоторых тестах на длинный контекст).
- Компромиссы между стоимостью и задержкой. Большие контексты и более высокий
thinking_levelповышают вычислительные затраты, задержку и стоимость; цены зависят от объемов токенов. Используйтеthinking_levelи разбиение на части для управления расходами. - Безопасность и фильтры контента. Google продолжает применять политики безопасности и модерацию; определенный контент и действия ограничены или приведут к отказу.
Сравнение Gemini 3 Pro Preview с другими топ‑моделями
Общее сравнение (preview → качественно):
По сравнению с Gemini 2.5 Pro: скачкообразные улучшения в рассуждении, агентном использовании инструментов и мультимодальной интеграции; существенно лучшая работа с большим контекстом и понимание длинных форм. DeepMind демонстрирует устойчивый прогресс в академическом рассуждении, кодинге и мультимодальных задачах.
По сравнению с GPT-5.1 и Claude Sonnet 4.5 (как сообщается): на наборе бенчмарков Google/DeepMind Gemini 3 Pro представлена лидером по нескольким метрикам в области агентности, мультимодальности и длинного контекста (см. Terminal-Bench, MMMU-Pro, AIME). Сравнительные результаты зависят от задачи.
Типичные и высокоценные сценарии использования
- Суммаризация и вопросы-ответы по большим документам/книгам: поддержка длинного контекста делает модель привлекательной для юридических, исследовательских и комплаенс‑команд.
- Понимание и генерация кода в масштабе репозитория: интеграция с тулчейнами разработки и улучшенное рассуждение помогают в рефакторингах больших кодовых баз и автоматизации код‑ревью.
- Мультимодальные продуктовые ассистенты: связки изображение + текст + аудио (поддержка клиентов с обработкой скриншотов, фрагментов звонков и документов).
- Генерация и редактирование медиа (фото → видео): более ранние возможности семейства Gemini теперь включают photo→video в стиле Veo / Flow; режим предварительного просмотра намекает на более глубокую мультимедийную генерацию для прототипов и медиа‑процессов.
Как вызвать API gemini-3-pro-preview через CometAPI
Цены Gemini 3 Pro Preview в CometAPI, со скидкой 20% от официальной цены:
| Токены ввода | $1.60 |
| Токены вывода | $9.60 |
Необходимые шаги
- Войдите на cometapi.com. Если вы еще не наш пользователь, пожалуйста, зарегистрируйтесь.
- Войдите в свою консоль CometAPI.
- Получите ключ API для доступа к интерфейсу. Нажмите “Add Token” в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте.

Способ использования
- Выберите эндпоинт “
gemini-3-pro-preview” для отправки API‑запроса и задайте тело запроса. Метод и тело запроса берутся из нашей документации API на сайте. На сайте также доступен тест в Apifox для вашего удобства. - Замените <YOUR_API_KEY> на ваш реальный ключ CometAPI из аккаунта.
- Вставьте ваш вопрос или запрос в поле content — на него модель и ответит.
- . Обработайте ответ API, чтобы получить сгенерированный результат.
CometAPI предоставляет полностью совместимый REST API — для бесшовной миграции. Основные сведения для Chat:
- Base URL: v1/chat/completions
- Model Names:
gemini-3-pro-preview - Authentication:
Bearer YOUR_CometAPI_API_KEYheader - Content-Type:
application/json.
См. также GPT-5.1 API
