Home/Models/Google/Gemini 3 Pro
G

Gemini 3 Pro

Ввод:$1.6/M
Вывод:$9.6/M
Контекст:200.0k
Максимальный вывод:200.0k
Gemini 3 Pro — это универсальная модель из семейства Gemini, доступная в режиме предварительного просмотра для оценки и прототипирования. Она поддерживает следование инструкциям, многошаговое рассуждение и задачи по работе с кодом и данными, обеспечивает структурированные ответы и вызов инструментов/функций для автоматизации рабочих процессов. Типичные сценарии использования включают чат-ассистентов, суммаризацию и перефразирование, ответы на вопросы с поддержкой ретривала, извлечение данных и базовую помощь в программировании в различных приложениях и сервисах. Ключевые технические особенности включают развёртывание на основе API, потоковые ответы, механизмы безопасности и готовность к интеграции, а также мультимодальные возможности в зависимости от конфигурации предварительного просмотра.
Новый
Коммерческое использование
Playground
Обзор
Функции
Цены
API
Версии

Gemini 3 Pro (Preview) — новейшая флагманская мультимодальная модель рассуждений Google/DeepMind в семействе Gemini 3. Она позиционируется как их «самая интеллектуальная модель на сегодняшний день», предназначенная для глубоких рассуждений, агентных рабочих процессов, продвинутого программирования и мультимодального понимания с длинным контекстом (текст, изображения, аудио, видео, код и интеграции с инструментами).

Ключевые особенности

  • Модальности: текст, изображения, видео, аудио, PDF (а также структурированные выходные данные инструментов).
  • Агентность/инструменты: встроенный вызов функций, поиск как инструмент, выполнение кода, URL-контекст и поддержка оркестрации многошаговых агентов. Механизм thought-signature сохраняет многошаговые рассуждения между вызовами.
  • Программирование и «vibe coding»: оптимизирована для генерации фронтенда, интерактивных UI и агентного программирования (она возглавляет соответствующие рейтинги, о которых сообщает Google). Продвигается как их самая сильная модель для «vibe-coding» на сегодняшний день.
  • Новые элементы управления для разработчиков: thinking_level (low|high) для компромисса между стоимостью/задержкой и глубиной рассуждений, а также media_resolution для управления качеством мультимодальной обработки для каждого изображения или кадра видео. Это помогает балансировать производительность, задержку и стоимость.

Производительность в бенчмарках

  • Gemini3Pro заняла первое место в LMARE с результатом 1501, превзойдя Grok-4.1-thinking с 1484 баллами, а также опередив Claude Sonnet 4.5 и Opus 4.1.
  • Она также заняла первое место в арене программирования WebDevArena с результатом 1487.
  • В академическом тесте на рассуждение Humanity’s Last Exam она достигла 37.5% (без инструментов); в научном тесте GPQA Diamond — 91.9%; а в математическом соревновании MathArena Apex — 23.4%, установив новый рекорд.
  • В мультимодальных возможностях MMMU-Pro достигла 81%; а в понимании видео Video-MMMU — 87.6%.

Технические детали и архитектура

  • Параметр “Thinking level”: Gemini 3 предоставляет управление thinking_level, которое позволяет разработчикам выбирать компромисс между глубиной внутренних рассуждений и задержкой/стоимостью. Модель рассматривает thinking_level как относительное допущение для внутреннего многошагового рассуждения, а не как строгую гарантию числа токенов. По умолчанию для Pro обычно используется high. Это явный новый элемент управления для разработчиков, позволяющий настраивать многошаговое планирование и глубину chain-of-thought.
  • Структурированные выходные данные и инструменты: модель поддерживает структурированные JSON-ответы и может использоваться вместе со встроенными инструментами (Google Search grounding, URL-контекст, выполнение кода и т. д.). Некоторые функции structured-output+tools доступны только в preview для gemini-3-pro-preview.
  • Мультимодальные и агентные интеграции: Gemini 3 Pro явно создана для агентных рабочих процессов (инструменты + несколько агентов поверх кода/терминалов/браузера).

Ограничения и известные особенности

  1. Фактическая точность не идеальна — галлюцинации по-прежнему возможны. Несмотря на заявленные Google значительные улучшения фактической точности, в критически важных сценариях (юридических, медицинских, финансовых) по-прежнему необходимы проверка по источникам и человеческий контроль.
  2. Качество работы с длинным контекстом зависит от задачи. Поддержка входного окна в 1M — это жёсткая техническая возможность, но эмпирическая эффективность на некоторых бенчмарках может снижаться при экстремальной длине (наблюдалось точечное падение результатов на 1M в некоторых тестах длинного контекста).
  3. Компромисс между стоимостью и задержкой. Большие контексты и более высокие значения thinking_level увеличивают вычислительные затраты, задержку и стоимость; ценовые уровни применяются в зависимости от объёма токенов. Используйте thinking_level и стратегии разбиения на части, чтобы управлять расходами.
  4. Фильтры безопасности и контента. Google продолжает применять политики безопасности и уровни модерации; определённый контент и действия по-прежнему ограничены или будут вызывать режим отказа.

Как Gemini 3 Pro Preview сравнивается с другими топовыми моделями

Сравнение на высоком уровне (preview → qualitative):

По сравнению с Gemini 2.5 Pro: существенный скачок в рассуждении, агентном использовании инструментов и мультимодальной интеграции; значительно более крупный контекст и лучшее понимание длинных текстов. DeepMind демонстрирует стабильный рост по академическим рассуждениям, программированию и мультимодальным задачам.

По сравнению с GPT-5.1 и Claude Sonnet 4.5 (по опубликованным данным): в наборе бенчмарков Google/DeepMind Gemini 3 Pro представлена как лидер по ряду агентных, мультимодальных и long-context метрик (см. Terminal-Bench, MMMU-Pro, AIME). Сравнительные результаты зависят от конкретной задачи.


Типичные и наиболее ценные сценарии использования

  • Суммаризация больших документов / книг и Q&A: поддержка длинного контекста делает модель привлекательной для юридических, исследовательских и комплаенс-команд.
  • Понимание и генерация кода в масштабе репозитория: интеграция с инструментами программирования и улучшенные рассуждения помогают при рефакторинге больших кодовых баз и в автоматизированных процессах ревью кода.
  • Мультимодальные продуктовые ассистенты: рабочие процессы с изображениями + текстом + аудио (например, клиентская поддержка, которая обрабатывает скриншоты, фрагменты звонков и документы).
  • Генерация и редактирование медиа (фото → видео): более ранние возможности семейства Gemini теперь включают функции photo→video в стиле Veo / Flow; preview указывает на более глубокую мультимедийную генерацию для прототипов и медиа-рабочих процессов.

Как получить доступ к API Gemini 3 Pro

Шаг 1: Зарегистрируйтесь и получите API-ключ

Войдите на cometapi.com. Если вы ещё не являетесь нашим пользователем, сначала зарегистрируйтесь. Войдите в свою консоль CometAPI. Получите учётные данные доступа — API-ключ интерфейса. Нажмите “Add Token” в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте его.

cometapi key

Шаг 2: Отправьте запросы к API Gemini 3 Pro

Выберите endpoint “gemini-3-pro”, чтобы отправить API-запрос, и задайте тело запроса. Метод запроса и тело запроса можно получить из API-документации на нашем сайте. Для вашего удобства наш сайт также предоставляет тестирование через Apifox. Замените <YOUR_API_KEY> на ваш фактический ключ CometAPI из вашей учётной записи. Базовый URL: Gemini Generating Content и Chat

Вставьте свой вопрос или запрос в поле content — именно на него модель ответит. Обработайте API-ответ, чтобы получить сгенерированный результат.

Шаг 3: Получите и проверьте результаты

Обработайте API-ответ, чтобы получить сгенерированный результат. После обработки API возвращает статус задачи и выходные данные.

ЧАВО

What is the context window and output limit for Gemini 3 Pro?

Gemini 3 Pro поддерживает входное контекстное окно на 1 миллион токенов и до 64,000 токенов вывода, что делает его идеальным для анализа целых кодовых баз или длинных документов.

How does the thinking_level parameter work in Gemini 3 Pro?

По умолчанию Gemini 3 Pro использует динамическое мышление. Установите thinking_level в значение 'low' для более быстрых ответов, когда сложное рассуждение не требуется, или 'high' (по умолчанию), чтобы максимизировать глубину рассуждений для сложных задач.

Does Gemini 3 Pro support Google Search grounding?

Да, Gemini 3 Pro поддерживает Google Search grounding, File Search, Code Execution и инструменты URL Context. Обратите внимание, что Google Maps grounding и Computer Use пока не поддерживаются в Gemini 3.

What makes Gemini 3 Pro different from Gemini 2.5 Pro?

Gemini 3 Pro предлагает поэтапные улучшения в агентных рабочих процессах и автономном программировании. Он использует сигнатуры рассуждений для контекста рассуждений между вызовами API и имеет отсечку знаний на январь 2025 года.

Can Gemini 3 Pro combine structured outputs with built-in tools?

Да, модели Gemini 3 позволяют комбинировать структурированные выходные данные (JSON schema) со встроенными инструментами, такими как Google Search, URL Context и Code Execution, в одном запросе.

Why should I keep temperature at 1.0 for Gemini 3 Pro?

Google настоятельно рекомендует оставлять значение температуры по умолчанию равным 1.0. Более низкие значения могут привести к неожиданным зацикливаниям или ухудшению качества на математических и задачах сложного рассуждения.

What are thought signatures and why are they important?

Сигнатуры рассуждений — это зашифрованные представления внутреннего процесса рассуждения модели. Для вызова функций они строго обязательны — отсутствие сигнатур приводит к ошибкам 400. Официальные SDK обрабатывают их автоматически.

Функции для Gemini 3 Pro

Идентификатор модели (предварительная версия): `gemini-3-pro-preview`. Типы входных данных: текст, изображение, видео, аудио, PDF. Выход: текст Контекст / лимиты токенов: вход ≈ 1 048 576 токенов; выход ≤ 65 536 токенов. Срез знаний: январь 2025 года (для более новой информации используется Search Grounding). Возможности (выборочно): вызов функций, выполнение кода, поиск по файлам, структурированные выходные данные, Search Grounding. Не поддерживается: генерация аудио, генерация изображений, Live API, сегментация изображений, Google Maps Grounding (некоторые функции отличаются от Gemini 2.5).

Цены для Gemini 3 Pro

Изучите конкурентоспособные цены на Gemini 3 Pro , разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как Gemini 3 Pro может улучшить ваши проекты, сохраняя при этом управляемые расходы.

gemini-3-pro (same price across variants shown)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-progemini-3-pro-preview$1.60$9.60
gemini-3-progemini-3-pro-preview-thinking$1.60$9.60
gemini-3-progemini-3-pro-all$1.60$9.60

Пример кода и API для Gemini 3 Pro

Gemini 3 Pro — новейшая флагманская мультимодальная модель рассуждений в семействе Gemini 3 от Google/DeepMind. Она позиционируется как их «самая интеллектуальная на сегодняшний день» модель, предназначенная для глубокого рассуждения, агентных рабочих процессов, продвинутого программирования и мультимодального понимания в длинном контексте (текст, изображения, аудио, видео, код и интеграции с инструментами).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Версии Gemini 3 Pro

Причина наличия нескольких снимков Gemini 3 Pro может включать такие потенциальные факторы, как: изменения в выходных данных после обновлений, требующие сохранения старых снимков для обеспечения согласованности; предоставление разработчикам переходного периода для адаптации и миграции; а также наличие разных снимков, соответствующих глобальным или региональным конечным точкам для оптимизации пользовательского опыта. Для получения подробной информации о различиях между версиями обратитесь к официальной документации.
Идентификатор моделиОписаниеДоступностьЗапрос
gemini-3-pro-allИспользуемая технология является неофициальной, и генерация нестабильна и т. д.✅Чат формат
gemini-3-proРекомендуется, указывает на последнюю модель❌Генерация контента Gemini
gemini-3-pro-previewОфициальная предварительная версия❌Генерация контента Gemini

Больше моделей