API предварительного просмотра Gemini 3 Pro

CometAPI
AnnaDec 10, 2025
API предварительного просмотра Gemini 3 Pro

Gemini 3 Pro (предварительный просмотр) — новейшая флагманская модель мультимодального мышления от Google/DeepMind в семействе Gemini 3. Она позиционируется как «самая интеллектуальная модель на сегодняшний день», предназначенная для глубокого мышления, агентных рабочих процессов, продвинутого программирования и понимания мультимодальных данных в широком контексте (текст, изображения, аудио, видео, код и интеграция инструментов).

Ключевые характеристики

  • Условия: Текст, изображения, видео, аудио, PDF-файлы (и структурированные выходные данные инструментов).
  • Агент/инструментарий: Встроенный вызов функций, поиск как инструмент, выполнение кода, контекст URL и поддержка организации многошаговых агентов. Механизм подписи мыслей сохраняет многошаговые рассуждения между вызовами.
  • Кодирование и «виброкодирование»: оптимизирован для генерации фронтенда, интерактивного пользовательского интерфейса и агентного кодирования (занимает лидирующие позиции в рейтингах Google). Позиционируется как самая мощная на сегодняшний день модель «vibe-code».
  • Новые элементы управления разработчика: thinking_level (низкий|высокий) для баланса между стоимостью/задержкой и глубиной рассуждений, и media_resolution Контролирует мультимодальную точность каждого изображения или видеокадра. Это помогает сбалансировать производительность, задержку и стоимость.

Контрольная производительность

  • Gemini3Pro занял первое место в LMARE, набрав 1501 балл, превзойдя Grok-4.1-thinking с его 1484 баллами, а также опередив Claude Sonnet 4.5 и Opus 4.1.
  • Он также занял первое место на арене программирования WebDevArena, набрав 1487 баллов.
  • На экзамене по академическому рассуждению «Последний экзамен человечества» он набрал 37.5% (без инструментов); на экзамене GPQA Diamond Science — 91.9%; а на математическом конкурсе MathArena Apex — 23.4%, установив новый рекорд.
  • В области мультимодальных возможностей MMMU-Pro достиг 81%, а в области понимания видео Video-MMMU — 87.6%.

API предварительного просмотра Gemini 3 Pro

Технические детали и архитектура

  • Параметр «Уровень мышления»: «Джемини-3» раскрывает thinking_level Управление, позволяющее разработчикам выбирать между глубиной внутреннего анализа и задержкой/стоимостью. Модель обрабатывает thinking_level как относительная возможность для внутренних многошаговых рассуждений, а не строгая символическая гарантия. Значение по умолчанию обычно high для Pro. Это новый инструмент управления, позволяющий разработчикам настраивать многошаговое планирование и глубину цепочки идей.
  • Структурированные результаты и инструменты: Модель поддерживает структурированные выходные данные JSON и может комбинироваться со встроенными инструментами (поиск Google, контекст URL, выполнение кода и т.д.). Некоторые функции структурированного вывода и инструментов доступны только в режиме предварительного просмотра. gemini-3-pro-preview.
  • Мультимодальные и агентские интеграции: Gemini 3 Pro специально создан для агентных рабочих процессов (инструменты + несколько агентов в коде/терминалах/браузере).
  • Принимает текстовые, графические, видео, аудио и PDF-файлы; выводит текстовые данные.

Ограничения и известные предостережения

  1. Неполная достоверность — возможны галлюцинации. Несмотря на заявленные Google существенные улучшения в области фактологии, обоснованная проверка и человеческий фактор по-прежнему необходимы в ситуациях с высокими ставками (юридических, медицинских, финансовых).
  2. Эффективность долгосрочного контекста варьируется в зависимости от задачи. Поддержка входного окна размером 1 МБ — сложная задача, но эмпирическая эффективность может падать в некоторых тестах при экстремальных значениях длины (наблюдались точечные снижения при 1 МБ в некоторых тестах с длинным контекстом).
  3. Компромиссы между стоимостью и задержкой. Большие контексты и выше thinking_level Настройки увеличивают вычислительные мощности, задержку и стоимость; уровни ценообразования зависят от объёма токенов. Использовать thinking_level и стратегии дробления для управления затратами.
  4. Фильтры безопасности и контента. Google продолжает применять политики безопасности и уровни модерации; определенный контент и действия остаются ограниченными или вызывают режимы отказа.

Чем Gemini 3 Pro Preview отличается от других топовых моделей

Высокоуровневое сравнение (предварительный просмотр → качественное):

Против Gemini 2.5 Pro: Значительные улучшения в рассуждениях, использовании агентных инструментов и мультимодальной интеграции; гораздо более широкая обработка контекста и лучшее понимание сложных текстов. DeepMind демонстрирует стабильный рост в академических рассуждениях, программировании и мультимодальных задачах.

Против GPT-5.1 и Claude Sonnet 4.5 (как сообщалось): В бенчмарках Google/DeepMind Gemini 3 Pro представлен как лидер по нескольким агентным, мультимодальным и контекстно-ориентированным показателям (см. Terminal-Bench, MMMU-Pro, AIME). Сравнительные результаты различаются в зависимости от задачи.


Типичные и наиболее ценные варианты использования

  • Краткое изложение большого документа/книги и вопросы и ответы: Поддержка длительного контекста делает его привлекательным для юридических, исследовательских групп и групп по обеспечению соответствия.
  • Понимание и генерация кода в масштабе репозитория: Интеграция с цепочками инструментов кодирования и улучшенное обоснование помогают проводить рефакторинг крупных кодовых баз и автоматизировать рабочие процессы проверки кода.
  • Мультимодальные продуктовые помощники: рабочие процессы «изображение + текст + аудио» (поддержка клиентов, которая обрабатывает снимки экрана, фрагменты вызовов и документы).
  • Генерация и редактирование медиа (фото → видео): Более ранние функции семейства Gemini теперь включают возможности фото→видео в стиле Veo/Flow; предварительная версия предлагает более глубокую генерацию мультимедиа для прототипов и рабочих процессов с использованием мультимедиа.

Как вызвать API gemini-3-pro-preview из CometAPI

Предварительная цена Gemini 3 Pro в CometAPI, скидка 20% на официальную цену:

Входные токены$1.60
Выходные токены$9.60

Необходимые шаги

  • Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
  • Войдите в свой Консоль CometAPI.
  • Получите ключ API-интерфейса для доступа к учетным данным. Нажмите «Добавить токен» в API-токене в персональном центре, получите ключ токена: sk-xxxxx и отправьте.

API предварительного просмотра Gemini 3 Pro

Используйте метод

  1. Выберите "gemini-3-pro-preview” конечная точка для отправки запроса API и установки тела запроса. Метод запроса и тело запроса получены из нашего веб-сайта API doc. Наш веб-сайт также предоставляет тест Apifox для вашего удобства.
  2. Заменять с вашим реальным ключом CometAPI из вашей учетной записи.
  3. Введите свой вопрос или запрос в поле «Контент» — на него ответит модель.
  4. . Обработайте ответ API, чтобы получить сгенерированный ответ.

CometAPI предоставляет полностью совместимый REST API для беспроблемной миграции. Ключевые детали для чата:

  • Базовый URL: https://api.cometapi.com/v1/chat/completions
  • Название модели: gemini-3-pro-preview
  • Аутентификация: Bearer YOUR_CometAPI_API_KEY заголовок
  • Тип содержимого: application/json .

Смотрите также API GPT-5.1

SHARE THIS BLOG

Читать далее

500+ моделей в одном API

Скидка до 20%