Gemini 3 Pro (предварительный просмотр) — новейшая флагманская модель мультимодального мышления от Google/DeepMind в семействе Gemini 3. Она позиционируется как «самая интеллектуальная модель на сегодняшний день», предназначенная для глубокого мышления, агентных рабочих процессов, продвинутого программирования и понимания мультимодальных данных в широком контексте (текст, изображения, аудио, видео, код и интеграция инструментов).
Ключевые характеристики
- Условия: Текст, изображения, видео, аудио, PDF-файлы (и структурированные выходные данные инструментов).
- Агент/инструментарий: Встроенный вызов функций, поиск как инструмент, выполнение кода, контекст URL и поддержка организации многошаговых агентов. Механизм подписи мыслей сохраняет многошаговые рассуждения между вызовами.
- Кодирование и «виброкодирование»: оптимизирован для генерации фронтенда, интерактивного пользовательского интерфейса и агентного кодирования (занимает лидирующие позиции в рейтингах Google). Позиционируется как самая мощная на сегодняшний день модель «vibe-code».
- Новые элементы управления разработчика:
thinking_level(низкий|высокий) для баланса между стоимостью/задержкой и глубиной рассуждений, иmedia_resolutionКонтролирует мультимодальную точность каждого изображения или видеокадра. Это помогает сбалансировать производительность, задержку и стоимость.
Контрольная производительность
- Gemini3Pro занял первое место в LMARE, набрав 1501 балл, превзойдя Grok-4.1-thinking с его 1484 баллами, а также опередив Claude Sonnet 4.5 и Opus 4.1.
- Он также занял первое место на арене программирования WebDevArena, набрав 1487 баллов.
- На экзамене по академическому рассуждению «Последний экзамен человечества» он набрал 37.5% (без инструментов); на экзамене GPQA Diamond Science — 91.9%; а на математическом конкурсе MathArena Apex — 23.4%, установив новый рекорд.
- В области мультимодальных возможностей MMMU-Pro достиг 81%, а в области понимания видео Video-MMMU — 87.6%.

Технические детали и архитектура
- Параметр «Уровень мышления»: «Джемини-3» раскрывает
thinking_levelУправление, позволяющее разработчикам выбирать между глубиной внутреннего анализа и задержкой/стоимостью. Модель обрабатываетthinking_levelкак относительная возможность для внутренних многошаговых рассуждений, а не строгая символическая гарантия. Значение по умолчанию обычноhighдля Pro. Это новый инструмент управления, позволяющий разработчикам настраивать многошаговое планирование и глубину цепочки идей. - Структурированные результаты и инструменты: Модель поддерживает структурированные выходные данные JSON и может комбинироваться со встроенными инструментами (поиск Google, контекст URL, выполнение кода и т.д.). Некоторые функции структурированного вывода и инструментов доступны только в режиме предварительного просмотра.
gemini-3-pro-preview. - Мультимодальные и агентские интеграции: Gemini 3 Pro специально создан для агентных рабочих процессов (инструменты + несколько агентов в коде/терминалах/браузере).
- Принимает текстовые, графические, видео, аудио и PDF-файлы; выводит текстовые данные.
Ограничения и известные предостережения
- Неполная достоверность — возможны галлюцинации. Несмотря на заявленные Google существенные улучшения в области фактологии, обоснованная проверка и человеческий фактор по-прежнему необходимы в ситуациях с высокими ставками (юридических, медицинских, финансовых).
- Эффективность долгосрочного контекста варьируется в зависимости от задачи. Поддержка входного окна размером 1 МБ — сложная задача, но эмпирическая эффективность может падать в некоторых тестах при экстремальных значениях длины (наблюдались точечные снижения при 1 МБ в некоторых тестах с длинным контекстом).
- Компромиссы между стоимостью и задержкой. Большие контексты и выше
thinking_levelНастройки увеличивают вычислительные мощности, задержку и стоимость; уровни ценообразования зависят от объёма токенов. Использоватьthinking_levelи стратегии дробления для управления затратами. - Фильтры безопасности и контента. Google продолжает применять политики безопасности и уровни модерации; определенный контент и действия остаются ограниченными или вызывают режимы отказа.
Чем Gemini 3 Pro Preview отличается от других топовых моделей
Высокоуровневое сравнение (предварительный просмотр → качественное):
Против Gemini 2.5 Pro: Значительные улучшения в рассуждениях, использовании агентных инструментов и мультимодальной интеграции; гораздо более широкая обработка контекста и лучшее понимание сложных текстов. DeepMind демонстрирует стабильный рост в академических рассуждениях, программировании и мультимодальных задачах.
Против GPT-5.1 и Claude Sonnet 4.5 (как сообщалось): В бенчмарках Google/DeepMind Gemini 3 Pro представлен как лидер по нескольким агентным, мультимодальным и контекстно-ориентированным показателям (см. Terminal-Bench, MMMU-Pro, AIME). Сравнительные результаты различаются в зависимости от задачи.
Типичные и наиболее ценные варианты использования
- Краткое изложение большого документа/книги и вопросы и ответы: Поддержка длительного контекста делает его привлекательным для юридических, исследовательских групп и групп по обеспечению соответствия.
- Понимание и генерация кода в масштабе репозитория: Интеграция с цепочками инструментов кодирования и улучшенное обоснование помогают проводить рефакторинг крупных кодовых баз и автоматизировать рабочие процессы проверки кода.
- Мультимодальные продуктовые помощники: рабочие процессы «изображение + текст + аудио» (поддержка клиентов, которая обрабатывает снимки экрана, фрагменты вызовов и документы).
- Генерация и редактирование медиа (фото → видео): Более ранние функции семейства Gemini теперь включают возможности фото→видео в стиле Veo/Flow; предварительная версия предлагает более глубокую генерацию мультимедиа для прототипов и рабочих процессов с использованием мультимедиа.
Как вызвать API gemini-3-pro-preview из CometAPI
Предварительная цена Gemini 3 Pro в CometAPI, скидка 20% на официальную цену:
| Входные токены | $1.60 |
| Выходные токены | $9.60 |
Необходимые шаги
- Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
- Войдите в свой Консоль CometAPI.
- Получите ключ API-интерфейса для доступа к учетным данным. Нажмите «Добавить токен» в API-токене в персональном центре, получите ключ токена: sk-xxxxx и отправьте.

Используйте метод
- Выберите "
gemini-3-pro-preview” конечная точка для отправки запроса API и установки тела запроса. Метод запроса и тело запроса получены из нашего веб-сайта API doc. Наш веб-сайт также предоставляет тест Apifox для вашего удобства. - Заменять с вашим реальным ключом CometAPI из вашей учетной записи.
- Введите свой вопрос или запрос в поле «Контент» — на него ответит модель.
- . Обработайте ответ API, чтобы получить сгенерированный ответ.
CometAPI предоставляет полностью совместимый REST API для беспроблемной миграции. Ключевые детали для чата:
- Базовый URL: https://api.cometapi.com/v1/chat/completions
- Название модели:
gemini-3-pro-preview - Аутентификация:
Bearer YOUR_CometAPI_API_KEYзаголовок - Тип содержимого:
application/json.
Смотрите также API GPT-5.1


