Gemini 3 Pro и Claude 4.5 Sonnet для программирования: что лучше в 2025 году

CometAPI
AnnaNov 23, 2025
Gemini 3 Pro и Claude 4.5 Sonnet для программирования: что лучше в 2025 году

И Gemini 3 Pro (Google/DeepMind), и Claude Sonnet 4.5 (Anthropic) — флагманские модели 2025 года, оптимизированные для агентных, долгосрочных, инструментально-ориентированных рабочих процессов — и обе делают серьёзный акцент на программировании. Заявленные сильные стороны расходятся: Google позиционирует Gemini 3 Pro как универсальный мультимодальный рассуждатель, который также отлично проявляет себя в агентном программировании, тогда как Anthropic позиционирует Sonnet 4.5 как лучшую в мире модель для программирования/агентов с особенно высокой успешностью правок/инструментов и длительно работающими агентами.

Короткий ответ заранее: обе модели — топ-уровня для задач программной инженерии в конце 2025 года. Claude Sonnet 4.5 немного опережает по некоторым метрикам чистых инженерных бенчмарков, в то время как Google Gemini 3 Pro (Preview) — более широкая, мультимодальная, агентная мощная платформа — особенно когда важны визуальный контекст, использование инструментов, длинный контекст и глубокие агентные рабочие процессы.

Я сейчас использую обе модели, и в среде разработки у каждой из них есть свои преимущества. Ниже я сравню их в этой статье.

Gemini 3 Pro доступна только подписчикам Google AI Ultra и платным пользователям Gemini API. Однако есть хорошие новости: CometAPI, как универсальная платформа ИИ, интегрировал Gemini 3 Pro, и вы можете попробовать её бесплатно.

Что такое Gemini 3 Pro Preview и каковы её ключевые возможности?

Обзор

Gemini 3 Pro (изначально доступная как gemini-3-pro-preview) — новейшая «передовая» LLM Google/DeepMind из семейства Gemini 3. Она позиционируется как высоко-рассуждающая мультимодальная модель, оптимизированная для агентных рабочих процессов (то есть для моделей, которые могут использовать инструменты, оркестрировать субагентов и взаимодействовать с внешними ресурсами). Акцент — на более сильном рассуждении, мультимодальности (изображения, кадры видео, PDF) и явных API-контролях глубины внутреннего «мышления».

Ключевые особенности (для разработчиков)

  • Агентное использование инструментов: встроенные вызовы функций и инструменты (выполнение кода, веб-«приземление», контекст файлов и URL, использование терминала/инструментов).
  • Поддержка Thinking / Chain-of-Thought: примитивы «мышления» для многошагового планирования и сигнатуры внутреннего мышления, делающие многошаговое рассуждение более явным.
  • Мультимодальный ввод/вывод: текст, изображения, аудио, видео и структурированные выходы с обработкой длинного контекста.
  • Инструмент выполнения кода и интеграции с IDE: размещённый инструмент выполнения кода и интеграции с IDE и новой агентной IDE Google Antigravity для совместной автономной разработки кода. Antigravity сейчас в публичном превью.
  • Контроль уровня расширенного мышления (параметр thinking_level), позволяющий обменивать задержку на более глубокое внутреннее рассуждение. Значение high по умолчанию для Gemini 3 Pro.
  • Гранулированные мультимодальные настройки (media_resolution) для балансировки детализации изображений/видео и стоимости — полезно, когда нужно прочитать мелкий текст на скриншотах или анализировать кадры.

Где Gemini 3 Pro особенно хороша в программировании

  • Агентная разработка: оркестрация многошаговых задач между редактором/терминалом/браузером. Система артефактов Antigravity + инструменты Gemini делают её отличной для более крупных фич и автоматизации.
  • Визуальный контекст + код: исправление UI-багов по скриншотам, генерация тестовых стендов для UI или преобразование дизайн-изображений в код благодаря сильному пониманию «изображение→код».

Что такое Claude Sonnet 4.5 и каковы его основные особенности?

Claude Sonnet 4.5 — релиз Anthropic 2025 года, который компания продвигает как свою сильнейшую модель для программирования, агентных рабочих процессов и «использования компьютеров» (управление инструментами, браузерами, терминалами, таблицами и т. п.). Акцент — на улучшенных возможностях редактирования, успехе работы с инструментами, расширенном мышлении, согласованности долгосрочных агентов (демонстрации 30+ часов автономного выполнения задач) и более низкой частоте ошибок редактирования кода по сравнению с предыдущими поколениями. Anthropic называет Sonnet 4.5 своей «лучшей моделью для программирования» с крупными приростами в надёжности правок и согласованности долгосрочных задач.

Ключевые возможности (для разработчиков)

  • Высокая точность программирования на реальных инженерных бенчмарках: Anthropic сообщает о рекордных показателях на SWE-bench Verified и заявляет о больших улучшениях в частоте ошибок редактирования и успехе агентной работы с инструментами.
  • Агентность и «использование компьютеров»: Sonnet 4.5 создан для работы с несколькими инструментами (bash, редактирование файлов, браузерная автоматизация) и оркестрации субагентов через Claude Agent SDK. Anthropic подчёркивает «30+ часов» непрерывной многошаговой работы во внутренних оценках.
  • Большие окна контекста: по умолчанию 200k токенов для большинства клиентов, с 1M-токенным контекстом в бете для организаций более высокого уровня (та же способность 1M, что Gemini предлагает в превью).
  • Инструмент выполнения кода и File API: инструменты в продукте и API позволяют безопасно выполнять код, создавать/редактировать файлы и запускать циклы тестирования.

Где Sonnet 4.5 особенно хорош в программировании

  • Чистые инженерные бенчмарки и структурированные задачи по коду (генерация модульных тестов, рефакторинг репозиториев), где важны алгоритмическая строгость модели и устойчивость на длинных горизонтах.
  • CLI с фокусом на коде и потоки «помощника по коду», такие как Claude Code, где из коробки обеспечены тесная интеграция с терминалом и сканирование репозитория.

Краткая сравнительная таблица

АспектGemini 3 Pro (Preview)Claude Sonnet 4.5
Модель / статус релизаgemini-3-pro-preview — передовая модель Google / DeepMind (превью). Релиз ноябрь 2025 (превью).claude-sonnet-4-5 — передовая модель класса Sonnet от Anthropic (GA / объявлен 29 сентября 2025).
Целевое позиционирование (программирование и агенты)Универсальная передовая модель с упором на рассуждение + мультимодальность + агентные рабочие процессы; позиционируется как топ-модель Google для программирования/агентов.Специализирована для программирования, долгосрочных агентных сценариев и «использования компьютеров» (лучшая Anthropic для программирования и сложных агентов).
Ключевые функции для разработчиковКонтроль thinking_level для более глубокого внутреннего рассуждения; встроенные интеграции инструментов Google (Search grounding, выполнение кода, контекст файлов/URL); отдельный вариант для текст+изображений.Agent SDK, интеграция с VS Code (Claude Code), инструменты работы с файлами и выполнения кода, улучшения для долгосрочных агентов (явно тестировался на многочасовые прогоны). Акцент на итеративных циклах правка/запуск/тест и чекпойнтах.
Окно контекста (ввод / вывод)1,000,000 токенов ввода / 64k токенов вывода для gemini-3-pro-preview1,000,000 токенов ввода / 64k токенов вывода
Цены (базовые опубликованные)$2 / $12 за 1M токенов (ввод / вывод) для тира <200k; более высокие ставки для >200k (в доках указано $4 / $18 для >200k).Опубликованная базовая цена Anthropic: $3 / $15 за 1M токенов (ввод / вывод) для Sonnet 4.5;
Мультимодальные возможности (визуал/видео/аудио)Полная мультимодальность: текст, изображения, аудио, видеокадры с настраиваемыми параметрами разрешения изображений/видео; выделенная gemini-3-pro-image-preview. Сильный акцент на OCR/извлечение визуальных данных для UI/скриншотов.Поддерживает входы текст+изображение и использует зрение в поддержке рабочих процессов кодинга; основной акцент — агентная интеграция (использование визуального контекста внутри агентных потоков, а не паритет с генерацией изображений).
Долгосрочная агентная производительность и устойчивостьПримитивы «мышления» для явного многошагового внутреннего рассуждения; сильная математика/рассуждение и глубокое мультимодальное понимание. Хорош при разложении сложных алгоритмических задач. Лучший выбор для тяжёлого одноответного рассуждения + мультимодального анализа.Anthropic подчёркивает долгосрочную агентную согласованность — в внутренних тестах Sonnet 4.5 поддерживал согласованную многошаговую работу с инструментами 30+ часов и улучшил стабильность непрерывных агентов по сравнению с прежними моделями. Хорош для устойчивой автоматизации и CI-агентов.
Качество вывода для программирования (правки, тесты, надёжность)Очень сильное одношаговое рассуждение + генерация кода; встроенные инструменты запуска кода через инфраструктуру Google; высокие показатели на алгоритмических бенчмарках по заявлениям вендора. Практическое преимущество при смешении визуальных спецификаций и кода.Спроектирован для итеративных циклов правка→запуск→тест; Sonnet 4.5 подчёркивает повышенную надёжность «патчинга» (parallel attempts / rejection sampling и скоринг для выбора устойчивых патчей) и инструментарий, поддерживающий итеративные потоки разработчика (чекпойнты, тесты).

Как сравниваются их архитектуры и базовые возможности?

Архитектура и замысел (высокоуровнево)

Gemini 3 Pro: представлена как мультимодальная универсальная база с явной инженерией под «мышление» и использование инструментов: упор на глубокое рассуждение, понимание видео/аудио и агентную оркестрацию через встроенные вызовы функций и окружения выполнения кода. Google позиционирует Gemini 3 Pro как «самую интеллектуальную» в семействе, оптимизированную для широкого круга задач за пределами кода (хотя агентное программирование — приоритет).

Claude Sonnet 4.5: специально оптимизирован для агентных рабочих процессов и кода: Anthropic подчёркивает следование инструкциям, надёжность инструментов, умение править/исправлять и управление состоянием на длинном горизонте. Инженерный фокус — минимизировать разрушительные или галлюцинирующие правки и обеспечить устойчивые взаимодействия с реальными компьютерами.

Вывод: Gemini 3 Pro подаётся как сильнейший «генералист», продвинутый в мультимодальном рассуждении и агентной интеграции; Sonnet 4.5 — как «специалист» для программирования и агентного использования инструментов с усиленными гарантиями правок/исправлений.

Инструменты и интеграции

  • Gemini: встроенный набор инструментов Google, включая Search grounding, поиск по файлам, выполнение кода и параметры изображений/видео; параметр thinking_level для управления компромиссом между внутренними вычислениями и задержкой. Глубокая интеграция в инфраструктуру Google упрощает жизнь командам на Google Cloud.
  • Claude: надёжный Agent SDK и акцент на стабильные долгие вычисления (для Sonnet показано 30+ часов согласованной работы). Anthropic также предоставляет выполнение кода, File API и новый UX «checkpoints» в Claude Code и расширении VS Code — возможности, существенно улучшающие итеративные рабочие процессы.

Что говорят технические характеристики и бенчмарки?

Gemini 3 Pro против Claude 4.5 Sonnet

Бенчмарки слегка различаются в зависимости от оценщика и конфигурации (одна попытка против нескольких, доступ к инструментам, настройки расширенного мышления). Ниже — анализ бенчмарк-данных по способности к программированию:

SWE-bench Verified (реальные тесты по программной инженерии)

Claude Sonnet 4.5 (по данным Anthropic): 77.2% (бюджет мышления 200k; 78.2% в конфигурации 1M). Anthropic также сообщает 82.0% при высоких вычислениях с использованием параллельных попыток/отбора по отклонению.

Gemini 3 Pro (по данным DeepMind / смежным лидербордам): ~76.2% одна попытка на SWE-bench (таблица вендора). Публичные лидерборды варьируются (Gemini и Sonnet по очереди лидируют с небольшим отрывом).

Terminal-Bench и агентные задачи

Gemini 3 Pro: показатели терминальных/агентных бенчмарков (таблица вендора) демонстрируют сильную производительность (например, Terminal-Bench 54.2% в таблице вендора), сопоставимую с агентными сильными сторонами Sonnet.

Sonnet 4.5: отличился в оркестрации агентных инструментов (Anthropic сообщает существенные приросты на OSWorld и терминальных бенчмарках и подчёркивает более длительную непрерывную работу).

Вывод: обе модели очень близки на современных бенчмарках понимания и генерации кода; Sonnet 4.5 имеет небольшое преимущество на некоторых верификационных наборах по софтверной инженерии (по опубликованным данным Anthropic), тогда как Gemini 3 Pro чрезвычайно конкурентоспособна и часто лидирует на мультимодальных и некоторых конкурсных код-бенчмарках. Всегда проверяйте точную конфигурацию оценки (доступ к инструментам, размер контекста, бюджеты мышления), поскольку эти настройки существенно влияют на результаты.

Как сравниваются их мультимодальные возможности?

Визуал и работа с изображениями

  • Gemini 3 Pro: тонкие мультимодальные настройки с media_resolution для изображений/видео (низкий/средний/высокий бюджет токенов на изображение/кадр), генерация/редактирование изображений (отдельная модель-превью), явные рекомендации для OCR/визуальных деталей. Это делает Gemini особенно сильной, когда задачи по коду требуют чтения скриншотов, макетов UI или видеокадров.
  • Claude Sonnet 4.5: поддерживает мультимодальность текст+изображение, а продуктовые интеграции Anthropic (приложения Claude) предоставляют визуальные рабочие процессы; фокус в Sonnet 4.5 — интеграция визуального контекста в агентные сценарии, а не паритет с генерацией изображений.

Когда мультимодальность важна для программирования

Если ваш рабочий процесс сильно опирается на скриншоты UI, дизайн-спеки в изображениях или видео-директивы, которые модель должна проанализировать, чтобы сгенерировать или изменить код, то выделенные настройки разрешения изображений и вариант генерации изображений в Gemini дают практическое преимущество. Если ваш конвейер — это агентная автоматизация (клики, запуск команд, редактирование файлов через инструменты), у Claude первоклассные Agent SDK и инструменты выполнения кода.

Продвинутое рассуждение и долгосрочное планирование — что лучше?

Sonnet 4.5: выносливость и выравнивание

Sonnet 4.5 способен поддерживать согласованную работу свыше 30 часов на сложных многостадийных задачах (планирование, исследования, подготовка юридических документов, долгосрочные задачи по коду). Эта выносливость плюс акцент Anthropic на выравнивании делает Sonnet привлекательным выбором для сквозной автоматизации, где модели нужно отслеживать цели и поддерживать безопасное поведение.

Gemini 3 Pro: глубокое рассуждение + оркестрация агентов

Gemini 3 Pro предлагает вариант «Deep Think» и более богатые API внутреннего мышления для многошагового планирования, в сочетании с агентной IDE от Google. На практике это означает, что Gemini может и планировать, и выполнять агентные шаги через инструменты (редактор, shell, web). Если ваша автоматизация требует доступа к внешним инструментам с созданием артефактов, интегрированный агентный инструментарий Gemini (Antigravity) — сильный плюс. Примечание: Deep Think обменивает задержку на глубину.

Сравнение долгосрочного планирования: Vending-Bench 2

В симуляционном тесте «Vending-Bench 2» Gemini 3 превзошла Claude 4.5, управляя виртуальной компанией в течение целого года и оставаясь прибыльной. В краткосрочных тестах данные Gemini 3 Pro и Claude 4 Sonnet были схожи, но по мере увеличения сроков тестирования разница становилась более выраженной.

Gemini 3 Pro и Claude 4.5 Sonnet для программирования: что лучше в 2025 году

Практическая разница

  • Для одноразовых задач с глубоким рассуждением (сложная отладка алгоритмов, глубокие логические доказательства в коде) thinking_level и вариант Deep Think у Gemini обещают большую глубину в одном ответе.
  • Для длительной, инструментально-ориентированной автоматизации (персистентные агенты, выполняющие множество команд, пишущие тесты, итеративно исправляющие и управляющие состоянием) у Claude Sonnet 4.5 акцент на долгосрочность и Agent SDK — сильные дифференциаторы.

Как сравниваются доступ к API и цены для разработчиков?

Gemini 3 Pro (Google) — доступ и цены

  • Доступ: превью Gemini 3 Pro доступно через Google AI Studio и Vertex AI (Model Garden). SDK: google-genai для Python/JS/Go и др., плюс слои совместимости с OpenAI для облегчения миграции, REST-эндпоинты и вызов функций / инструменты выполнения кода. Antigravity предоставляет IDE-поверхность, использующую в превью Gemini 3 Pro.
  • Цена: цены превью в документации Google: $2 / $12 за 1M токенов (ввод / вывод) для тира <200k; более высокие ставки для >200k (в примерах в доках — $4 / $18 для >200k).

Claude Sonnet 4.5 — доступ и цены

  • API и SDK: Anthropic предоставляет Claude API, Claude Agent SDK для построения агентных рабочих процессов, File API и инструменты выполнения кода (нативное расширение для VS Code, улучшения Claude Code и функция «checkpoint»).
  • Цена: окно контекста по умолчанию 200k токенов, 1M-токенное — в бете для enterprise; цены $3 / $15 за 1M токенов (соответственно ввод/вывод).

Как разработчику, выбирать модель стоит по потребностям и характеристикам, а не только по минимальной цене. Если задачу могут решать обе, решайте по контексту.

Если вы хотите использовать две модели одновременно, рекомендую CometAPI, который предоставляет и Gemini 3 Pro Preview API, и Claude Sonnet 4.5 API по цене в 20% от официальной.

Gemini 3 Pro PreviewGPT-5.1
Входные токены$1.60$2.4.00
Выходные токены$9.60$12.00

Итоги

Gemini 3 Pro (Preview) и Claude Sonnet 4.5 — обе передовые опции для помощников по программированию в конце 2025 года. Sonnet 4.5 немного опережает Gemini в конкретных верификационных бенчмарках по софтверной инженерии и по выносливости на длинных горизонтах, в то время как Gemini 3 Pro предлагает более сильное мультимодальное понимание и глубокие агентные инструменты, способные исполнять действия в редакторе/терминале/браузере. Правильный выбор зависит от того, что для вас первично: чистое рассуждение о коде и верификация (Sonnet) или мультимодальная, агентная, инструментально усиленная разработка (Gemini). Для корпоративных внедрений многие команды разумно выбирают гибридный подход, используя сильнейшую модель для каждой стадии конвейера разработки.

Разработчики могут получить доступ к Gemini 3 Pro Preview API и Claude Sonnet 4.5 API через CometAPI. Чтобы начать, изучите возможности моделей на CometAPI в Playground и обратитесь к руководству по API для подробных инструкций. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагает цену значительно ниже официальной, чтобы облегчить интеграцию.

Готовы начать?→ Бесплатный пробный доступ к моделям Gemini 3 Pro и GPT-5.1!

Если вы хотите получать больше советов, гидов и новостей об ИИ, подпишитесь на нас в VK, X и Discord!

Готовы сократить затраты на AI-разработку на 20%?

Начните бесплатно за несколько минут. Пробные кредиты включены. Карта не нужна.

Читать далее