Предварительная версия API Gemini 3 Pro

Gemini 3 Pro (Preview) — новейшая флагманская мультимодальная модель рассуждений от Google/DeepMind в семействе Gemini 3. Она позиционируется как их «самая интеллектуальная модель на сегодня», созданная для глубокого рассуждения, агентных рабочих процессов, продвинутого кодирования и мультимодального понимания с длинным контекстом (текст, изображения, аудио, видео, код и интеграции с инструментами).

Ключевые возможности

Модальности: текст, изображения, видео, аудио, PDF (и структурированные выводы инструментов).
Агентность/инструменты: встроенные вызовы функций, поиск как инструмент, выполнение кода, контекст URL и поддержка оркестрации многошаговых агентов. Механизм thought-signature сохраняет многошаговое рассуждение между вызовами.
Кодинг и «vibe coding»: оптимизирована для генерации фронтенда, интерактивной генерации UI и агентного кодинга (возглавляет соответствующие рейтинги по данным Google). Продвигается как их самая сильная модель для «vibe‑coding».
Новые настройки для разработчиков: thinking_level (low|high) для баланса стоимости/задержки и глубины рассуждений, а также media_resolution для управления мультимодальной детализацией на изображение или кадр видео. Эти параметры помогают балансировать производительность, задержку и стоимость.

Результаты бенчмарков

Gemini3Pro заняла первое место в LMARE с результатом 1501, опередив 1484 балла Grok-4.1-thinking, а также лидируя над Claude Sonnet 4.5 и Opus 4.1.
Также первое место в программировании на арене WebDevArena с результатом 1487.
В Humanity’s Last Exam (академическое рассуждение) — 37.5% (без инструментов); в GPQA Diamond (наука) — 91.9%; в MathArena Apex (математика) — 23.4%, установив новый рекорд.
По мультимодальным возможностям: MMMU-Pro — 81%; по пониманию видео в Video‑MMMU — 87.6%.

Предварительная версия API Gemini 3 Pro

Технические детали и архитектура

Параметр «thinking level»: в Gemini 3 доступен контроль thinking_level, позволяющий разработчикам менять глубину внутренних рассуждений в обмен на задержку/стоимость. Модель трактует thinking_level как относительную «квоту» на внутреннее многошаговое рассуждение, а не как жесткую гарантию токенов. По умолчанию у Pro обычно high. Это явный новый регулятор для настройки многошагового планирования и глубины цепочки рассуждений.
Структурированные выводы и инструменты: модель поддерживает структурированные JSON‑выводы и может сочетаться со встроенными инструментами (привязка к результатам Google Search, контекст URL, выполнение кода и др.). Часть возможностей «structured‑output + tools» доступна только в режиме предварительного просмотра для gemini-3-pro-preview.
Мультимодальные и агентные интеграции: Gemini 3 Pro специально создана для агентных сценариев (инструменты + несколько агентов поверх кода/терминалов/браузера).
Принимает ввод: текст, изображения, видео, аудио и PDF; вывод — текст.

Ограничения и известные особенности

Не идеальная фактичность — возможны галлюцинации. Несмотря на заявленные улучшения фактичности, в задачах высокой важности (юридические, медицинские, финансовые) все еще необходимы проверка с опорой на источники и участие человека.
Производительность на длинном контексте зависит от задачи. Поддержка окна ввода 1M — «жесткая» возможность, но эмпирическая эффективность на экстремальных длинах может падать (наблюдались локальные снижения на 1M в некоторых тестах на длинный контекст).
Компромиссы между стоимостью и задержкой. Большие контексты и более высокий thinking_level повышают вычислительные затраты, задержку и стоимость; цены зависят от объемов токенов. Используйте thinking_level и разбиение на части для управления расходами.
Безопасность и фильтры контента. Google продолжает применять политики безопасности и модерацию; определенный контент и действия ограничены или приведут к отказу.

Сравнение Gemini 3 Pro Preview с другими топ‑моделями

Общее сравнение (preview → качественно):

По сравнению с Gemini 2.5 Pro: скачкообразные улучшения в рассуждении, агентном использовании инструментов и мультимодальной интеграции; существенно лучшая работа с большим контекстом и понимание длинных форм. DeepMind демонстрирует устойчивый прогресс в академическом рассуждении, кодинге и мультимодальных задачах.

По сравнению с GPT-5.1 и Claude Sonnet 4.5 (как сообщается): на наборе бенчмарков Google/DeepMind Gemini 3 Pro представлена лидером по нескольким метрикам в области агентности, мультимодальности и длинного контекста (см. Terminal-Bench, MMMU-Pro, AIME). Сравнительные результаты зависят от задачи.

Типичные и высокоценные сценарии использования

Суммаризация и вопросы-ответы по большим документам/книгам: поддержка длинного контекста делает модель привлекательной для юридических, исследовательских и комплаенс‑команд.
Понимание и генерация кода в масштабе репозитория: интеграция с тулчейнами разработки и улучшенное рассуждение помогают в рефакторингах больших кодовых баз и автоматизации код‑ревью.
Мультимодальные продуктовые ассистенты: связки изображение + текст + аудио (поддержка клиентов с обработкой скриншотов, фрагментов звонков и документов).
Генерация и редактирование медиа (фото → видео): более ранние возможности семейства Gemini теперь включают photo→video в стиле Veo / Flow; режим предварительного просмотра намекает на более глубокую мультимедийную генерацию для прототипов и медиа‑процессов.

Как вызвать API gemini-3-pro-preview через CometAPI

Цены Gemini 3 Pro Preview в CometAPI, со скидкой 20% от официальной цены:


Токены ввода	$1.60
Токены вывода	$9.60

Необходимые шаги

Войдите на cometapi.com. Если вы еще не наш пользователь, пожалуйста, зарегистрируйтесь.
Войдите в свою консоль CometAPI.
Получите ключ API для доступа к интерфейсу. Нажмите “Add Token” в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте.

Предварительная версия API Gemini 3 Pro

Способ использования

Выберите эндпоинт “gemini-3-pro-preview” для отправки API‑запроса и задайте тело запроса. Метод и тело запроса берутся из нашей документации API на сайте. На сайте также доступен тест в Apifox для вашего удобства.
Замените <YOUR_API_KEY> на ваш реальный ключ CometAPI из аккаунта.
Вставьте ваш вопрос или запрос в поле content — на него модель и ответит.
. Обработайте ответ API, чтобы получить сгенерированный результат.

CometAPI предоставляет полностью совместимый REST API — для бесшовной миграции. Основные сведения для Chat:

Base URL: v1/chat/completions
Model Names: gemini-3-pro-preview
Authentication: Bearer YOUR_CometAPI_API_KEY header
Content-Type: application/json .

См. также GPT-5.1 API

Ключевые возможности

Результаты бенчмарков

Технические детали и архитектура

Ограничения и известные особенности

Сравнение Gemini 3 Pro Preview с другими топ‑моделями

Типичные и высокоценные сценарии использования

Как вызвать API gemini-3-pro-preview через CometAPI

Цены Gemini 3 Pro Preview в CometAPI, со скидкой 20% от официальной цены:

Необходимые шаги

Способ использования

Готовы сократить затраты на AI-разработку на 20%?

Читать далее