Home/Models/Gemini 3 Pro Preview

Gemini 3 Pro Preview

Google
gemini-3-pro-preview
Ввод:$1.60/M
Вывод:$9.60/M
Контекст:200.0k
Максимальный вывод:200.0k
Gemini 3 Pro Preview — универсальная модель из семейства Gemini, доступная в режиме предварительного просмотра для оценки и прототипирования. Она поддерживает выполнение инструкций, многоходовое рассуждение, а также задачи с кодом и данными, обеспечивая структурированные ответы и вызов инструментов/функций для автоматизации рабочих процессов. Типичные сценарии использования включают чат-ассистентов, реферирование и переформулирование, ответы на вопросы с использованием поиска, извлечение данных и легкую помощь в программировании в разных приложениях и сервисах. К ключевым техническим особенностям относятся развертывание через API, потоковые ответы, механизмы безопасности и готовность к интеграции, при этом мультимодальные возможности зависят от конфигурации предварительного просмотра.
Обзор
Playground
Функции
Цены
API
Версии

Gemini 3 Pro (предварительная версия) — новейшая флагманская многомодальная модель рассуждений из семейства Gemini 3 от Google/DeepMind. Она позиционируется как «самая интеллектуальная модель на сегодняшний день», созданная для глубоких рассуждений, агентных процессов, продвинутого кодинга и долгого контекста в мультимодальном понимании (текст, изображения, аудио, видео, код и интеграции с инструментами).

Ключевые возможности

  • Модальности: текст, изображение, видео, аудио, PDF (и структурированные выходы инструментов).
  • Агентность/инструменты: встроенные вызовы функций, поиск как инструмент, выполнение кода, контекст URL и поддержка оркестрации многошаговых агентов. Механизм thought-signature сохраняет многошаговые рассуждения между вызовами.
  • Кодинг и «vibe coding»: оптимизирована для генерации фронтенда, интерактивной генерации UI и агентного программирования (по данным Google, возглавляет соответствующие рейтинги). Продвигается как их самая сильная на сегодня модель для «vibe‑coding».
  • Новые настройки для разработчиков: thinking_level (low|high) для выбора между стоимостью/задержкой и глубиной рассуждений, а также media_resolution для управления мультимодальной детализацией на кадр изображения или видео. Это помогает балансировать производительность, задержку и стоимость.

Результаты в бенчмарках

  • Gemini3Pro заняла первое место в LMARE с результатом 1501, превзойдя 1484 балла у Grok-4.1-thinking, а также опередив Claude Sonnet 4.5 и Opus 4.1.
  • Также заняла первое место в программинг-арене WebDevArena с результатом 1487.
  • В Humanity’s Last Exam по академическим рассуждениям — 37.5% (без инструментов); в GPQA Diamond по науке — 91.9%; в математическом соревновании MathArena Apex — 23.4%, установив новый рекорд.
  • В мультимодальных возможностях: по MMMU-Pro — 81%; по Video-MMMU (понимание видео) — 87.6%.

изображение

Технические детали и архитектура

  • Параметр «уровень мышления»: в Gemini 3 доступен контроль thinking_level, который позволяет разработчикам выбирать глубину внутреннего многошагового рассуждения в обмен на задержку/стоимость. Модель трактует thinking_level как относительное разрешение на внутренние многошаговые рассуждения, а не как строгую гарантию по токенам. По умолчанию для Pro обычно стоит high. Это явный новый рычаг для настройки глубины многошагового планирования и «цепочки рассуждений».
  • Структурированные выходы и инструменты: модель поддерживает структурированные JSON-выводы и может сочетаться со встроенными инструментами (привязка к Google Search, контекст URL, выполнение кода и т. д.). Некоторые функции сочетания структурированных выводов с инструментами доступны только в режиме предварительной версии для gemini-3-pro-preview.
  • Мультимодальные и агентные интеграции: Gemini 3 Pro напрямую ориентирована на агентные процессы (инструменты + несколько агентов поверх кода/терминалов/браузера).

Ограничения и известные нюансы

  1. Фактичность не идеальна — возможны галлюцинации. Несмотря на заявленные улучшения, в ответственных областях (право, медицина, финансы) необходима верификация и человеческая проверка.
  2. Производительность на длинных контекстах зависит от задачи. Поддержка окна ввода 1M — это твёрдая возможность, но эмпирическая эффективность может снижаться на некоторых бенчмарках при экстремальной длине (отмечены точечные снижения на 1M в ряде долгоконтекстных тестов).
  3. Компромиссы по стоимости и задержке. Большие контексты и повышенный thinking_level увеличивают вычисления, задержку и стоимость; действуют ценовые уровни в зависимости от объёмов токенов. Используйте thinking_level и стратегии разбиения на части для управления затратами.
  4. Безопасность и фильтры контента. Google продолжает применять политики безопасности и слои модерации; определённый контент и действия останутся ограниченными или приведут к отказам.

Сравнение Gemini 3 Pro Preview с другими топ-моделями

Общее сравнение (предварительно → качественно):

Против Gemini 2.5 Pro: скачкообразные улучшения в рассуждениях, использовании инструментов и мультимодальной интеграции; существенно более длинный контекст и лучшее понимание длинных форм. DeepMind демонстрирует устойчивый рост в академических рассуждениях, кодинге и мультимодальных задачах.

Против GPT-5.1 и Claude Sonnet 4.5 (по данным): на наборах бенчмарков Google/DeepMind Gemini 3 Pro представляется лидирующей по ряду показателей агентности, мультимодальности и длинного контекста (см. Terminal-Bench, MMMU-Pro, AIME). Сравнительные результаты зависят от задачи.


Типичные и высокоценные сценарии использования

  • Суммаризация больших документов/книг и вопросы-ответы: поддержка длинного контекста делает модель привлекательной для юристов, исследовательских и комплаенс-команд.
  • Понимание и генерация кода на масштабе репозитория: интеграция с инструментальными цепочками для кодинга и улучшенные рассуждения помогают в рефакторинге больших кодовых баз и автоматизации ревью.
  • Мультимодальные продуктовые ассистенты: workflows с изображениями + текстом + аудио (поддержка клиентов с использованием скриншотов, фрагментов звонков и документов).
  • Генерация и редактирование медиа (фото → видео): прежние возможности семейства Gemini теперь включают Veo / Flow‑стиль фото→видео; предварительная версия указывает на более глубокую мультимедийную генерацию для прототипов и медиапроцессов.

Playground для Gemini 3 Pro Preview

Изучите Playground Gemini 3 Pro Preview — интерактивную среду для тестирования моделей и выполнения запросов в реальном времени. Попробуйте промпты, настройте параметры и итерируйте мгновенно, чтобы ускорить разработку и проверить варианты использования.

Функции для Gemini 3 Pro Preview

* **Идентификатор модели (предварительная версия):** `gemini-3-pro-preview`. * **Типы ввода:** Текст, Изображение, Видео, Аудио, PDF. Вывод: Текст * **Ограничения контекста / токенов:** Ввод ≈ **1,048,576 токенов**; Вывод ≤ **65,536 токенов**. * **Дата отсечения знаний:** **январь 2025** (использует Search Grounding для более актуальной информации). * **Возможности (выбранные):** вызов функций, выполнение кода, поиск по файлам, структурированный вывод, search grounding. Не поддерживаются: генерация аудио, генерация изображений, live API, сегментация изображений, Google Maps grounding (некоторые функции отличаются от Gemini 2.5).
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

Цены для Gemini 3 Pro Preview

Изучите конкурентоспособные цены на Gemini 3 Pro Preview, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как Gemini 3 Pro Preview может улучшить ваши проекты, сохраняя при этом управляемые расходы.
Цена Comet (USD / M Tokens)Официальная цена (USD / M Tokens)
Ввод:$1.60/M
Вывод:$9.60/M
Ввод:$2.00/M
Вывод:$12.00/M

Пример кода и API для Gemini 3 Pro Preview

Gemini 3 Pro — новейшая флагманская мультимодальная модель для рассуждений компании Google/DeepMind из семейства Gemini 3. Она позиционируется как их "самая интеллектуальная модель на сегодняшний день", предназначенная для глубоких рассуждений, агентных рабочих процессов, продвинутого программирования и мультимодального понимания с длинным контекстом (текст, изображения, аудио, видео, код и интеграции с инструментами).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Версии Gemini 3 Pro Preview

Причина наличия нескольких снимков Gemini 3 Pro Preview может включать такие потенциальные факторы, как: изменения в выходных данных после обновлений, требующие сохранения старых снимков для обеспечения согласованности; предоставление разработчикам переходного периода для адаптации и миграции; а также наличие разных снимков, соответствующих глобальным или региональным конечным точкам для оптимизации пользовательского опыта. Для получения подробной информации о различиях между версиями обратитесь к официальной документации.