Предварительная версия API Gemini 3 Pro

CometAPI
AnnaNov 17, 2025
Предварительная версия API Gemini 3 Pro

Gemini 3 Pro (Preview) — новейшая флагманская мультимодальная модель рассуждений от Google/DeepMind в семействе Gemini 3. Она позиционируется как их «самая интеллектуальная модель на сегодня», созданная для глубокого рассуждения, агентных рабочих процессов, продвинутого кодирования и мультимодального понимания с длинным контекстом (текст, изображения, аудио, видео, код и интеграции с инструментами).

Ключевые возможности

  • Модальности: текст, изображения, видео, аудио, PDF (и структурированные выводы инструментов).
  • Агентность/инструменты: встроенные вызовы функций, поиск как инструмент, выполнение кода, контекст URL и поддержка оркестрации многошаговых агентов. Механизм thought-signature сохраняет многошаговое рассуждение между вызовами.
  • Кодинг и «vibe coding»: оптимизирована для генерации фронтенда, интерактивной генерации UI и агентного кодинга (возглавляет соответствующие рейтинги по данным Google). Продвигается как их самая сильная модель для «vibe‑coding».
  • Новые настройки для разработчиков: thinking_level (low|high) для баланса стоимости/задержки и глубины рассуждений, а также media_resolution для управления мультимодальной детализацией на изображение или кадр видео. Эти параметры помогают балансировать производительность, задержку и стоимость.

Результаты бенчмарков

  • Gemini3Pro заняла первое место в LMARE с результатом 1501, опередив 1484 балла Grok-4.1-thinking, а также лидируя над Claude Sonnet 4.5 и Opus 4.1.
  • Также первое место в программировании на арене WebDevArena с результатом 1487.
  • В Humanity’s Last Exam (академическое рассуждение) — 37.5% (без инструментов); в GPQA Diamond (наука) — 91.9%; в MathArena Apex (математика) — 23.4%, установив новый рекорд.
  • По мультимодальным возможностям: MMMU-Pro — 81%; по пониманию видео в Video‑MMMU — 87.6%.

Предварительная версия API Gemini 3 Pro

Технические детали и архитектура

  • Параметр «thinking level»: в Gemini 3 доступен контроль thinking_level, позволяющий разработчикам менять глубину внутренних рассуждений в обмен на задержку/стоимость. Модель трактует thinking_level как относительную «квоту» на внутреннее многошаговое рассуждение, а не как жесткую гарантию токенов. По умолчанию у Pro обычно high. Это явный новый регулятор для настройки многошагового планирования и глубины цепочки рассуждений.
  • Структурированные выводы и инструменты: модель поддерживает структурированные JSON‑выводы и может сочетаться со встроенными инструментами (привязка к результатам Google Search, контекст URL, выполнение кода и др.). Часть возможностей «structured‑output + tools» доступна только в режиме предварительного просмотра для gemini-3-pro-preview.
  • Мультимодальные и агентные интеграции: Gemini 3 Pro специально создана для агентных сценариев (инструменты + несколько агентов поверх кода/терминалов/браузера).
  • Принимает ввод: текст, изображения, видео, аудио и PDF; вывод — текст.

Ограничения и известные особенности

  1. Не идеальная фактичность — возможны галлюцинации. Несмотря на заявленные улучшения фактичности, в задачах высокой важности (юридические, медицинские, финансовые) все еще необходимы проверка с опорой на источники и участие человека.
  2. Производительность на длинном контексте зависит от задачи. Поддержка окна ввода 1M — «жесткая» возможность, но эмпирическая эффективность на экстремальных длинах может падать (наблюдались локальные снижения на 1M в некоторых тестах на длинный контекст).
  3. Компромиссы между стоимостью и задержкой. Большие контексты и более высокий thinking_level повышают вычислительные затраты, задержку и стоимость; цены зависят от объемов токенов. Используйте thinking_level и разбиение на части для управления расходами.
  4. Безопасность и фильтры контента. Google продолжает применять политики безопасности и модерацию; определенный контент и действия ограничены или приведут к отказу.

Сравнение Gemini 3 Pro Preview с другими топ‑моделями

Общее сравнение (preview → качественно):

По сравнению с Gemini 2.5 Pro: скачкообразные улучшения в рассуждении, агентном использовании инструментов и мультимодальной интеграции; существенно лучшая работа с большим контекстом и понимание длинных форм. DeepMind демонстрирует устойчивый прогресс в академическом рассуждении, кодинге и мультимодальных задачах.

По сравнению с GPT-5.1 и Claude Sonnet 4.5 (как сообщается): на наборе бенчмарков Google/DeepMind Gemini 3 Pro представлена лидером по нескольким метрикам в области агентности, мультимодальности и длинного контекста (см. Terminal-Bench, MMMU-Pro, AIME). Сравнительные результаты зависят от задачи.


Типичные и высокоценные сценарии использования

  • Суммаризация и вопросы-ответы по большим документам/книгам: поддержка длинного контекста делает модель привлекательной для юридических, исследовательских и комплаенс‑команд.
  • Понимание и генерация кода в масштабе репозитория: интеграция с тулчейнами разработки и улучшенное рассуждение помогают в рефакторингах больших кодовых баз и автоматизации код‑ревью.
  • Мультимодальные продуктовые ассистенты: связки изображение + текст + аудио (поддержка клиентов с обработкой скриншотов, фрагментов звонков и документов).
  • Генерация и редактирование медиа (фото → видео): более ранние возможности семейства Gemini теперь включают photo→video в стиле Veo / Flow; режим предварительного просмотра намекает на более глубокую мультимедийную генерацию для прототипов и медиа‑процессов.

Как вызвать API gemini-3-pro-preview через CometAPI

Цены Gemini 3 Pro Preview в CometAPI, со скидкой 20% от официальной цены:

Токены ввода$1.60
Токены вывода$9.60

Необходимые шаги

  • Войдите на cometapi.com. Если вы еще не наш пользователь, пожалуйста, зарегистрируйтесь.
  • Войдите в свою консоль CometAPI.
  • Получите ключ API для доступа к интерфейсу. Нажмите “Add Token” в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте.

Предварительная версия API Gemini 3 Pro

Способ использования

  1. Выберите эндпоинт “gemini-3-pro-preview” для отправки API‑запроса и задайте тело запроса. Метод и тело запроса берутся из нашей документации API на сайте. На сайте также доступен тест в Apifox для вашего удобства.
  2. Замените <YOUR_API_KEY> на ваш реальный ключ CometAPI из аккаунта.
  3. Вставьте ваш вопрос или запрос в поле content — на него модель и ответит.
  4. . Обработайте ответ API, чтобы получить сгенерированный результат.

CometAPI предоставляет полностью совместимый REST API — для бесшовной миграции. Основные сведения для Chat:

  • Base URL: v1/chat/completions
  • Model Names: gemini-3-pro-preview
  • Authentication: Bearer YOUR_CometAPI_API_KEY header
  • Content-Type: application/json .

См. также GPT-5.1 API

Готовы сократить затраты на AI-разработку на 20%?

Начните бесплатно за несколько минут. Пробные кредиты включены. Карта не нужна.

Читать далее