Home/Models/Google/Gemini 3 Pro
G

Gemini 3 Pro

Ввод:$1.6/M
Вывод:$9.6/M
Контекст:200.0k
Максимальный вывод:200.0k
Gemini 3 Pro — это универсальная модель из семейства Gemini, доступная в режиме предварительного просмотра для оценки и прототипирования. Она поддерживает следование инструкциям, многошаговое рассуждение и задачи по работе с кодом и данными, обеспечивает структурированные ответы и вызов инструментов/функций для автоматизации рабочих процессов. Типичные сценарии использования включают чат-ассистентов, суммаризацию и перефразирование, ответы на вопросы с поддержкой ретривала, извлечение данных и базовую помощь в программировании в различных приложениях и сервисах. Ключевые технические особенности включают развёртывание на основе API, потоковые ответы, механизмы безопасности и готовность к интеграции, а также мультимодальные возможности в зависимости от конфигурации предварительного просмотра.
Новый
Коммерческое использование
Playground
Обзор
Функции
Цены
API
Версии

Gemini 3 Pro (Preview) — новейшая флагманская мультимодальная модель рассуждения от Google/DeepMind в семействе Gemini 3. Она позиционируется как их «самая интеллектуальная модель на сегодняшний день», созданная для глубоких рассуждений, агентных рабочих процессов, продвинутого кодинга и мультимодального понимания с длинным контекстом (текст, изображения, аудио, видео, код и интеграции инструментов).

Ключевые возможности

  • Модальности: текст, изображение, видео, аудио, PDF (и структурированные выводы инструментов).
  • Агентность/инструменты: встроенные вызовы функций, поиск как инструмент, выполнение кода, контекст по URL и поддержка оркестрации многошаговых агентов. Механизм thought-signature сохраняет многошаговое рассуждение между вызовами.
  • Кодинг и «vibe coding»: оптимизирована для генерации фронтенда, создания интерактивных интерфейсов и агентного кодинга (возглавляет соответствующие рейтинги, по данным Google). Позиционируется как их самая сильная модель для «vibe‑coding» на сегодняшний день.
  • Новые параметры для разработчиков: thinking_level (low|high) — баланс стоимости/задержки и глубины рассуждения, и media_resolution — управление мультимодальной детализацией на уровне изображения или кадра видео. Они помогают балансировать производительность, задержку и стоимость.

Результаты на бенчмарках

  • Gemini3Pro занял первое место в LMARE с результатом 1501, опередив 1484 балла Grok-4.1-thinking, а также обойдя Claude Sonnet 4.5 и Opus 4.1.
  • Также первое место на арене программирования WebDevArena с результатом 1487.
  • В Humanity’s Last Exam по академическому рассуждению — 37.5% (без инструментов); в GPQA Diamond по науке — 91.9%; и в математическом соревновании MathArena Apex — 23.4%, установив новый рекорд.
  • В мультимодальных возможностях MMMU-Pro — 81%; а в понимании видео Video-MMMU — 87.6%.

изображение

Технические подробности и архитектура

  • Параметр «Thinking level»: Gemini 3 предоставляет управление thinking_level, позволяющее разработчикам балансировать глубину внутреннего рассуждения и задержку/стоимость. Модель рассматривает thinking_level как относительное разрешение на внутреннее многошаговое рассуждение, а не как строгую гарантию токенов. По умолчанию для Pro обычно high. Это явный новый контрол для настройки многошагового планирования и глубины chain-of-thought.
  • Структурированные выводы и инструменты: модель поддерживает структурированные JSON‑выводы и может сочетаться со встроенными инструментами (привязка к Google Search, контекст по URL, выполнение кода и т. д.). Некоторые возможности structured‑output+tools доступны только в режиме предварительного просмотра для gemini-3-pro-preview.
  • Мультимодальные и агентные интеграции: Gemini 3 Pro явно создана для агентных рабочих процессов (инструменты + несколько агентов поверх кода/терминалов/браузера).

Ограничения и известные оговорки

  1. Не идеальная фактологичность — галлюцинации остаются возможны. Несмотря на заявленные Google существенные улучшения фактологичности, проверка на основе источников и человеческая ревизия по‑прежнему необходимы в задачах с высокими рисками (право, медицина, финансы).
  2. Производительность на длинном контексте зависит от задачи. Поддержка входного окна 1M — реальная возможность, но эмпирическая эффективность может снижаться на некоторых бенчмарках при экстремальных длинах (наблюдались точечные падения на 1M в ряде тестов на длинном контексте).
  3. Компромиссы между стоимостью и задержкой. Большие контексты и повышенные настройки thinking_level увеличивают вычисления, задержку и стоимость; уровни ценообразования зависят от объёма токенов. Используйте thinking_level и стратегии разбиения на блоки для управления затратами.
  4. Безопасность и фильтры контента. Google продолжает применять политики безопасности и уровни модерации; определённый контент и действия остаются ограниченными или могут вызывать режимы отказа.

Как Gemini 3 Pro Preview сравнивается с другими топ‑моделями

Сравнение на высоком уровне (предпросмотр → качественно):

По сравнению с Gemini 2.5 Pro: скачкообразные улучшения в рассуждении, использовании агентных инструментов и мультимодальной интеграции; гораздо более масштабная обработка контекста и лучшее понимание длинных форматов. DeepMind демонстрирует устойчивые улучшения в академическом рассуждении, кодинге и мультимодальных задачах.

По сравнению с GPT-5.1 и Claude Sonnet 4.5 (по данным): согласно набору бенчмарков Google/DeepMind, Gemini 3 Pro представлена лидирующей по ряду метрик агентности, мультимодальности и длинного контекста (см. Terminal-Bench, MMMU-Pro, AIME). Сравнительные результаты зависят от задачи.


Типичные и наиболее ценные варианты использования

  • Реферат/суммаризация больших документов и книг, вопросы‑ответы: поддержка длинного контекста делает её привлекательной для юридических, исследовательских и комплаенс‑команд.
  • Понимание и генерация кода в масштабе репозитория: интеграция с инструментальными цепочками для разработки и улучшенное рассуждение помогают при рефакторинге крупных кодовых баз и автоматизации потоков обзора кода.
  • Мультимодальные продуктовые ассистенты: рабочие процессы изображение + текст + аудио (службы поддержки, обрабатывающие скриншоты, фрагменты звонков и документы).
  • Генерация и редактирование медиа (фото → видео): прежние возможности семейства Gemini теперь включают функции photo→video в стиле Veo / Flow; предварительный просмотр предполагает более глубокую мультимедийную генерацию для прототипов и медиа‑процессов.

ЧАВО

What is the context window and output limit for Gemini 3 Pro?

Gemini 3 Pro supports a 1 million token input context window with up to 64,000 tokens of output, making it ideal for analyzing entire codebases or lengthy documents.

How does the thinking_level parameter work in Gemini 3 Pro?

Gemini 3 Pro uses dynamic thinking by default. Set thinking_level to 'low' for faster responses when complex reasoning isn't needed, or 'high' (default) to maximize reasoning depth for complex tasks.

Does Gemini 3 Pro support Google Search grounding?

Yes, Gemini 3 Pro supports Google Search grounding, File Search, Code Execution, and URL Context tools. Note that Google Maps grounding and Computer Use are not yet supported in Gemini 3.

What makes Gemini 3 Pro different from Gemini 2.5 Pro?

Gemini 3 Pro offers stepwise improvements in agentic workflows and autonomous coding. It uses thought signatures for reasoning context across API calls, and has a knowledge cutoff of January 2025.

Can Gemini 3 Pro combine structured outputs with built-in tools?

Yes, Gemini 3 models allow combining structured outputs (JSON schema) with built-in tools like Google Search, URL Context, and Code Execution in the same request.

Why should I keep temperature at 1.0 for Gemini 3 Pro?

Google strongly recommends keeping temperature at the default 1.0. Lower values may cause unexpected looping or degraded performance on mathematical and complex reasoning tasks.

What are thought signatures and why are they important?

Thought signatures are encrypted representations of the model's internal reasoning. For function calling, they're strictly enforced—missing signatures return 400 errors. Official SDKs handle them automatically.

Функции для Gemini 3 Pro

* **Идентификатор модели (предварительная версия):** `gemini-3-pro-preview`. * **Типы входных данных:** Текст, Изображение, Видео, Аудио, PDF. Вывод: Текст * **Ограничения контекста/токенов:** Вход ≈ **1,048,576 tokens**; Выход ≤ **65,536 tokens**. * **Порог знаний:** **Январь 2025** (использует Search Grounding для более актуальной информации). * **Возможности (выбранные):** вызов функций, выполнение кода, поиск по файлам, структурированные выводы, Search Grounding. Не поддерживается: генерация аудио, генерация изображений, Live API, сегментация изображений, привязка к Google Maps (некоторые функции отличаются от Gemini 2.5).

Цены для Gemini 3 Pro

Изучите конкурентоспособные цены на Gemini 3 Pro , разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как Gemini 3 Pro может улучшить ваши проекты, сохраняя при этом управляемые расходы.

gemini-3-pro (same price across variants shown)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-progemini-3-pro-preview$1.60$9.60
gemini-3-progemini-3-pro-preview-thinking$1.60$9.60
gemini-3-progemini-3-pro-all$1.60$9.60

Пример кода и API для Gemini 3 Pro

Gemini 3 Pro — новейшая флагманская мультимодальная модель рассуждений от Google/DeepMind в семействе Gemini 3. Она позиционируется как их «самая интеллектуальная модель на сегодня», разработанная для глубокого рассуждения, агентных рабочих процессов, продвинутого программирования и мультимодального понимания с длинным контекстом (текст, изображения, аудио, видео, код и интеграции с инструментами).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Версии Gemini 3 Pro

Причина наличия нескольких снимков Gemini 3 Pro может включать такие потенциальные факторы, как: изменения в выходных данных после обновлений, требующие сохранения старых снимков для обеспечения согласованности; предоставление разработчикам переходного периода для адаптации и миграции; а также наличие разных снимков, соответствующих глобальным или региональным конечным точкам для оптимизации пользовательского опыта. Для получения подробной информации о различиях между версиями обратитесь к официальной документации.
ID моделиОписаниеДоступностьЗапрос
gemini-3-pro-allИспользуемая технология является неофициальной, генерация нестабильна и т. д.✅Чат формат
gemini-3-proРекомендуется, указывает на актуальную модель✅Gemini Создание контента
gemini-3-pro-previewОфициальная предварительная версия✅Gemini Создание контента

Больше моделей