И Gemini 3 Pro (Google/DeepMind), и Claude Sonnet 4.5 (Anthropic) — флагманские модели эпохи 2025 года, оптимизированные под агентные, долгосрочные, инструментально-ориентированные рабочие процессы — и обе делают серьёзный упор на программирование. Заявленные сильные стороны расходятся: Google позиционирует Gemini 3 Pro как универсального мультимодального мыслителя, который также блестяще справляется с агентным кодингом, тогда как Anthropic называет Sonnet 4.5 лучшей в мире моделью для coding/agent со особенно высокой надёжностью правок/инструментов и длительными автономными агентами.
Короткий ответ заранее: обе модели — топ-уровня для задач разработки ПО в конце 2025 года. Claude Sonnet 4.5 немного опережает на некоторых чисто инженерных бенчмарках, тогда как Google Gemini 3 Pro (Preview) — более широкая, мультимодальная, агентная мощь — особенно когда важны визуальный контекст, использование инструментов, длинный контекст и глубокие агентные рабочие процессы.
Я сейчас использую обе модели, и у каждой есть свои преимущества в среде разработки. Ниже я сравню их в этой статье.
Gemini 3 Pro доступна только подписчикам Google AI Ultra и платным пользователям Gemini API. Однако хорошая новость в том, że CometAPI, как универсальная AI-платформа, интегрировала Gemini 3 Pro, и вы можете попробовать её бесплатно.
Что такое Gemini 3 Pro Preview и каковы её ключевые возможности?
Обзор
Gemini 3 Pro (изначально доступна как gemini-3-pro-preview) — последняя «передовая» LLM от Google/DeepMind в семействе Gemini 3. Её позиционируют как высоко-рассуждающую, мультимодальную модель, оптимизированную под агентные рабочие процессы (то есть модели, способные использовать инструменты, оркестрировать субагентов и взаимодействовать с внешними ресурсами). Акцент — на более сильном рассуждении, мультимодальности (изображения, видеокадры, PDF) и явных API-контролях глубины внутреннего «мышления».
Ключевые пункты (для разработчиков)
- Агентное использование инструментов: встроенный вызов функций и инструменты (выполнение кода, привязка к вебу, контекст файлов и URL, использование терминала/инструментов).
- Поддержка Thinking / Chain-of-Thought: примитивы «мышления» для многошагового планирования и внутренние сигнатуры мыслительного процесса, делающие многошаговое рассуждение более явным.
- Мультимодальный ввод/вывод: текст, изображения, аудио, видео и структурированные ответы с обработкой длинного контекста.
- Инструмент выполнения кода и интеграции с IDE: хостинговый инструмент выполнения кода и интеграции в IDE и новую агентную IDE Google Antigravity для совместной автономной разработки. Antigravity сейчас в публичном превью.
- Контроли расширенного мышления (параметр
thinking_level), позволяющие обменивать задержку на более глубокое внутреннее рассуждение. По умолчанию для Gemini 3 Pro —high. - Тонкие мультимодальные настройки (
media_resolution) для балансировки качества изображений/видео и стоимости — полезно, когда нужно читать мелкий текст на скриншотах или анализировать кадры.
Где Gemini 3 Pro особенно сильна в программировании
- Агентная разработка: оркестровка многошаговых задач в редакторе/терминале/браузере. Система артефактов Antigravity + инструменты Gemini делают её отличной для больших фич и автоматизации.
- Связка «визуальное + код»: исправление UI-багов по скриншотам, генерация тестовых обвязок для UI или преобразование дизайн-изображений в код благодаря сильному пониманию «image-to-code».
Что такое Claude Sonnet 4.5 и каковы его основные возможности?
Claude Sonnet 4.5 — релиз 2025 года от Anthropic, который компания продвигает как свою самую сильную модель для программирования, агентных рабочих процессов и «использования компьютеров» (управление инструментами, браузерами, терминалами, таблицами и т. п.). Акцент — на улучшенной способности к правкам, успехе в использовании инструментов, расширенном мышлении, согласованности долгоживущих агентов (демонстрировалась автономная работа задач более 30 часов) и снижении ошибок при редактировании кода по сравнению с предыдущими поколениями. Anthropic называет Sonnet 4.5 своей «лучшей моделью для программирования» с крупными улучшениями надёжности правок и согласованности в задачах с длинным горизонтом.
Ключевые возможности (для разработчиков)
- Высокая точность кодинга на реальных инженерных бенчмарках: Anthropic сообщает о state-of-the-art результатах на SWE-bench Verified и значительных улучшениях в частоте ошибок правок и успешности агентной работы с инструментами.
- Агентность и «использование компьютера»: Sonnet 4.5 спроектирована для запуска множества инструментов (bash, редактирование файлов, автоматизация браузера) и оркестровки субагентов через Claude Agent SDK. Anthropic подчёркивает «30+ часов» непрерывной многошаговой работы во внутренних оценках.
- Большие окна контекста: по умолчанию 200k токенов для большинства клиентов, и 1M токенов доступно в бета-режиме для более высоких тарифов (та же возможность 1M, что Gemini предлагает в превью).
- Инструмент выполнения кода и файловые API: инструменты в продукте и через API позволяют безопасно выполнять код, создавать/редактировать файлы и запускать циклы тестирования.
Где Sonnet 4.5 особенно силён для программирования
- Чистые инженерные бенчмарки и структурированные кодовые задачи (генерация модульных тестов, рефакторинг всего репозитория), где важны алгоритмическая строгость и стабильность на длинном горизонте.
- CLI, ориентированные на код, и сценарии «code assistant», такие как Claude Code, где из коробки обеспечивается плотная интеграция с терминалом и сканирование репозитория.
Краткая сравнительная таблица
| Аспект | Gemini 3 Pro (Preview) | Claude Sonnet 4.5 |
|---|---|---|
| Модель / статус выпуска | gemini-3-pro-preview — передовая модель Google / DeepMind (превью). Выпущена в ноябре 2025 (превью). | claude-sonnet-4-5 — передовая модель класса Sonnet от Anthropic (GA / объявлен 29 сентября 2025). |
| Целевое позиционирование (кодинг и агенты) | Универсальная передовая модель с упором на рассуждение + мультимодальность + агентные рабочие процессы; позиционируется как топ-модель Google для программирования/агентов. | Специализирована для программирования, долгосрочной агентной работы и «использования компьютера» (лучшая у Anthropic для кодинга и сложных агентов). |
| Ключевые возможности для разработчиков | Контроль thinking_level для более глубокого внутреннего рассуждения; встроенные интеграции Google-инструментов (привязка к Поиску, выполнение кода, контекст файлов/URL); отдельный вариант для связки текст+изображение. | Agent SDK, интеграция с VS Code (Claude Code), инструменты для файлов и выполнения кода, улучшения для долгосрочной работы агентов (явно тестировались многочасовые сессии). Акцент на итеративные циклы правка/запуск/тест и контрольные точки. |
| Окно контекста (ввод / вывод) | 1,000,000 токенов на вход / 64k токенов на выход для gemini-3-pro-preview | 1,000,000 токенов на вход / 64k токенов на выход |
| Цены (публик. базовый уровень) | $2 / $12 за 1M токенов (ввод / вывод) для тира <200k; более высокие ставки для >200k ( show $4 / $18 для >200k). | Опубликованный базовый уровень Anthropic: $3 / $15 за 1M токенов (ввод / вывод) для Sonnet 4.5; |
| Мультимодальность (vision/video/audio) | Полная поддержка мультимодальности: текст, изображения, аудио, видеокадры с настраиваемыми параметрами качества изображений/видео; отдельная gemini-3-pro-image-preview. Сильный акцент на OCR/визуальное извлечение для UI/скриншотов в кодинге. | Поддерживает ввод текст+изображение и использует vision для поддержания рабочих процессов кодинга; основной упор — агентная интеграция (использование визуального контекста внутри агентных сценариев, а не паритет генерации изображений). |
| Производительность агентности на длинном горизонте и устойчивость | Примитивы «мышления» для явного многошагового внутреннего рассуждения; сильная математика/рассуждение и глубокое мультимодальное мышление. Хорошо декомпозирует сложные алгоритмические задачи. Лучший выбор для тяжёлого одноответного рассуждения + мультимодального анализа. | Anthropic подчёркивает согласованность на длинном горизонте — внутренние тесты, где Sonnet 4.5 поддерживал согласованное использование инструментов 30+ часов, и улучшенная стабильность непрерывных агентов. Хорошо подходит для устойчивой автоматизации и агентных рабочих процессов в стиле CI. |
| Качество вывода для кодинга (правки, тесты, надёжность) | Очень сильное одношаговое рассуждение + генерация кода; встроенные инструменты запуска кода через Google-инфраструктуру; высокие результаты на алгоритмических бенчмарках по заявлению вендора. Практическое преимущество при смешанных рабочих процессах «визуальные спецификации + код». | Спроектирован для итеративных циклов правка→запуск→тест; Sonnet 4.5 подчёркивает улучшенную надёжность «патчей» (параллельные попытки / отбор с отклонением для выбора устойчивых патчей) и инструменты, поддерживающие итеративные сценарии разработчика (контрольные точки, тесты). |
Чем отличаются их архитектуры и ключевые возможности?
Архитектура и замысел (на высоком уровне)
Gemini 3 Pro: представлена как мультимодальная универсальная базовая модель с явной инженерией под «мышление» и использование инструментов: упор на глубокое рассуждение, понимание видео/аудио и агентную оркестрацию через встроенный вызов функций и окружения выполнения кода. Google описывает Gemini 3 Pro как «самую интеллектуальную» в семействе, оптимизированную для широких задач за пределами кода (хотя агентное программирование — в приоритете).
Claude Sonnet 4.5: специально оптимизирован для агентных рабочих процессов и кода: Anthropic подчёркивает следование инструкциям, надёжность инструментов, мастерство в правках/исправлениях и управление состоянием на длинном горизонте. Инженерная цель — минимизировать разрушительные или галлюцинированные правки и обеспечить надёжные реальные компьютерные взаимодействия.
Вывод: Gemini 3 Pro подаётся как топовый универсал, продвинутый в мультимодальном рассуждении и агентной интеграции; Sonnet 4.5 — как специалист по кодингу и агентному использованию инструментов с усиленными гарантиями правок/исправлений.
Инструменты и интеграции
- Gemini: встроенный набор инструментов Google, включая привязку к Поиску, файловый поиск, выполнение кода и первоклассные параметры для изображений/видео; параметр
thinking_levelдля контроля компромисса вычислений/задержки во внутреннем мышлении. Глубокая интеграция с инфраструктурой Google удобна для команд на Google Cloud. - Claude: мощный Agent SDK и акцент на стабильных длительных вычислениях (сообщается о 30+ часах согласованной работы). Anthropic также предоставляет выполнение кода, файловые API и новый UX «контрольных точек» в Claude Code и расширении для VS Code — функции, существенно улучшающие итеративные рабочие процессы разработки.
Что говорят спецификации и бенчмарки?

Бенчмарки слегка различаются в зависимости от методики и конфигурации (одна попытка против нескольких попыток, доступ к инструментам, настройки расширенного мышления). Ниже — анализ данных бенчмарков по способности к программированию:
SWE-bench Verified (тесты реальной разработки ПО)
Claude Sonnet 4.5 (по данным Anthropic): 77.2% (бюджет мышления 200k; 78.2% в конфигурации 1M). Anthropic также сообщает о 82.0% при высоких вычислениях с использованием параллельных попыток/отбора с отклонением.
Gemini 3 Pro (по отчётам DeepMind / родственным лидербордам): ~76.2% в одну попытку на SWE-bench (таблица вендора). Публичные лидерборды различаются (Gemini и Sonnet поочерёдно лидируют с небольшим отрывом).
Terminal-Bench и агентные задачи
Gemini 3 Pro: показатели на терминальных/агентных бенчмарках (таблица вендора) демонстрируют сильную производительность (например, Terminal-Bench 54.2% в таблице вендора), конкурентоспособную по сравнению с агентными сильными сторонами Sonnet.
Sonnet 4.5: превосходит в оркестрации инструментов для агентности (Anthropic сообщает о существенных приростах на OSWorld и терминальных бенчмарках и подчёркивает более длительную непрерывную работу задач).
Вывод: обе модели очень близки на современных бенчмарках понимания/генерации кода; Sonnet 4.5 имеет небольшое преимущество на некоторых верификационных суитах (по опубликованным цифрам Anthropic), тогда как Gemini 3 Pro крайне конкурентоспособна и часто лидирует в мультимодальности и некоторых «соревновательных» кодинговых таблицах. Всегда валидируйте с точной конфигурацией оценки (доступ к инструментам, размер контекста, бюджеты «мышления»), так как эти параметры существенно влияют на результаты.
Как сравниваются их мультимодальные возможности?
Vision и работа с изображениями
- Gemini 3 Pro: детальные мультимодальные контролы через
media_resolutionдля изображений/видео (низкий/средний/высокий бюджет токенов на изображение/кадр), генерация/редактирование изображений (отдельная preview-модель), и явные рекомендации для OCR/визуальных деталей. Это делает Gemini особенно сильной, когда задачи кодинга требуют чтения скриншотов, UI-макетов или видеокадров. - Claude Sonnet 4.5: поддерживает ввод текст+изображение, и продуктовые интеграции Anthropic (приложения Claude) предоставляют визуальные рабочие процессы; фокус в Sonnet 4.5 — интеграция визуального контекста в агентные сценарии, а не паритет с генерацией изображений.
Когда мультимодальность важна для кодинга
Если ваш рабочий процесс сильно опирается на скриншоты UI, дизайн-спеки в изображениях или видео-демонстрации, которые модель должна анализировать для генерации/изменения кода, то у Gemini практическое преимущество благодаря управлению разрешением изображений и варианту модели для изображений. Если ваш конвейер — автоматизация, управляемая агентом (клики по интерфейсу, выполнение команд, редактирование файлов в разных инструментах), у Claude сильны Agent SDK и инструменты выполнения кода.
Продвинутое рассуждение и долгосрочное планирование — что лучше?
Sonnet 4.5: выносливость и выравнивание
Sonnet 4.5 способен поддерживать согласованную работу свыше 30 часов в сложных многостадийных задачах (планирование, исследования, подготовка судебных документов, длительные задачи по коду). Эта выносливость плюс акцент Anthropic на выравнивании делают Sonnet привлекательным выбором для end-to-end автоматизации, где модель должна держать цели в фокусе и сохранять безопасное поведение.
Gemini 3 Pro: глубокое рассуждение + агентная оркестрация
Gemini 3 Pro представляет вариант «Deep Think» и более богатые API для внутреннего многошагового планирования, вкупе с агентной IDE от Google. На практике это означает, что Gemini может и планировать, и выполнять агентные шаги через инструменты (редактор, shell, веб). Если ваша автоматизация требует внешних инструментов с созданием артефактов, интегрированный агентный инструментарий Gemini (Antigravity) — сильное преимущество. Примечание: Deep Think обменивает задержку на глубину.
Сравнение долгосрочного планирования: Vending-Bench 2
В симуляции «Vending-Bench 2» Gemini 3 превзошла Claude 4.5, управляя виртуальной компанией целый год и оставаясь прибыльной. В краткосрочных тестах данные Gemini 3 Pro и Claude 4 Sonnet были схожи, но разница становилась более выраженной на длинных периодах тестирования.

Практическая разница
- Для одношаговых задач с глубоким рассуждением (сложная алгоритмическая отладка, глубокие логические доказательства, встроенные в код)
thinking_levelи Deep Think у Gemini обещают большую глубину одного ответа. - Для длительной, инструментально-управляемой автоматизации (персистентные агенты, выполняющие множество команд, пишущие тесты, итерации и управление состоянием) долгосрочный фокус и Agent SDK у Claude Sonnet 4.5 — сильные дифференциаторы.
Как сравниваются доступ к API и цены для разработчиков?
Gemini 3 Pro (Google) — доступ и цены
- Доступ: превью Gemini 3 Pro доступно через Google AI Studio и Vertex AI (model garden). SDK включают google-genai для Python/JS/Go/и т. д., плюс слои совместимости с OpenAI для упрощения миграции, с REST-эндпоинтами и вызовом функций / инструментами выполнения кода. Antigravity предоставляет IDE-интерфейс, использующий Gemini 3 Pro в превью.
- Цена: цены превью, указанные в документации Google: $2 / $12 за 1M токенов (ввод / вывод) для тира <200k; выше ставки для >200k (примеры в доках показывают $4 / $18 для >200k).
Claude Sonnet 4.5 — доступ и цены
- APIs и SDK: Anthropic предоставляет Claude API, Claude Agent SDK для построения агентных рабочих процессов, файловые API и инструменты выполнения кода (нативное расширение для VS Code, улучшения Claude Code и функция «контрольных точек»).
- Цена: 200k-токенов окно контекста по умолчанию, 1M-токенов контекст в бете для enterprise; цены $3 / $15 за 1M токенов (соответственно ввод/вывод)
Как разработчику, вам стоит выбирать модель по потребностям и её характеристикам, а не только по цене. Если задачу могут решить обе модели, решайте исходя из контекста.
Если вы хотите использовать две модели одновременно, рекомендую CometAPI, которая предоставляет и Gemini 3 Pro Preview API, и Claude Sonnet 4.5 API, и стоит 20% от официальной цены.
| Gemini 3 Pro Preview | GPT-5.1 | |
| Входные токены | $1.60 | $2.4.00 |
| Выходные токены | $9.60 | $12.00 |
Итоги
Gemini 3 Pro (Preview) и Claude Sonnet 4.5 — обе передового уровня для ассистентов программирования в конце 2025 года. Sonnet 4.5 опережает Gemini в конкретных верификационных бенчмарках и по выносливости на длинном горизонте, тогда как Gemini 3 Pro предлагает более сильное мультимодальное понимание и глубокие агентные инструменты, способные работать в средах редактора/терминала/браузера. Правильный выбор зависит от того, что важнее: чистое рассуждение по коду и верификация (Sonnet) или мультимодальная, агентная, инструментально-усиленная разработка (Gemini). Для внедрений уровня предприятия многие команды разумно выберут гибридный подход, используя ту модель, что сильнее на конкретном этапе конвейера разработки.
Разработчики могут получить доступ к Gemini 3 Pro Preview API и Claude Sonnet 4.5 API через CometAPI. Для начала изучите возможности моделей CometAPI в Playground и обратитесь к руководству по API для подробных инструкций. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагают цену, значительно ниже официальной, чтобы помочь вам с интеграцией.
Готовы начать?→ Бесплатная пробная версия моделей Gemini 3 pro и GPT-5.1 !
Если хотите больше советов, гайдов и новостей об ИИ, подпишитесь на нас в VK, X и Discord!
