Что такое «глубокое мышление» в Близнецах 3? Всё, что вам нужно знать

CometAPI
AnnaNov 20, 2025
Что такое «глубокое мышление» в Близнецах 3? Всё, что вам нужно знать

Близнецы 3 Глубокое мышление — это новый специализированный режим рассуждений в новейшем семействе базовых моделей Google/DeepMind — Gemini 3, разработанный для решения сложных, многошаговых и многомодальных задач, требующих больше времени и внутреннего «обдумывания». Он позиционируется как версия Gemini, которая выводит современные рассуждения и агентное решение задач на новый уровень по сравнению с предыдущими версиями.

Что именно представляет собой Gemini 3 Deep Think?

Определение и позиционирование

Gemini 3 Deep Think — это не отдельное семейство моделей в смысле совершенно иной архитектуры нейронной сети, выпущенной независимо, — это расширенный режим рассуждения в серии Gemini 3, которую Google описывает как «ещё более широкое расширение границ интеллекта». Deep Think явно представлен как режим, который вы выбираете, когда вам нужно, чтобы модель прорабатывала более глубокие цепочки мыслей, рассматривала несколько гипотез и оценивала альтернативы перед ответом, что фактически позволяет системе жертвовать задержкой ради более качественных и продуманных результатов. Google позиционирует Deep Think как версию, оптимизированную для самых сложных, новых и многошаговых задач рассуждения (и изначально она доступна только для тестирования безопасности и подписчиков Google AI Ultra).

Чем Deep Think отличается от стандартного Gemini 3 Pro

Концептуально Gemini 3 Pro нацелен на сбалансированный опыт с низкой задержкой, подходящий для общего использования агентами и интеграции с разработчиками (например, для интеграции с новой IDE Antigravity и Vertex AI). Deep Think относится к тому же семейству, но настроен на:

  1. Рассуждение — декодирование и интернализация цепочки мыслей. Google описывает Gemini 3 как использующую улучшенный внутренний «мыслительный» процесс, позволяющий модели более надёжно выполнять многошаговое планирование и внутреннее обдумывание. Deep Think, по-видимому, интенсифицирует этот процесс, выделяя больше внутренних вычислительных ресурсов, удлиняя цепочки внутреннего обдумывания и применяя более строгие эвристики проверки при генерации. Эти изменения направлены на сокращение количества нестабильных одношаговых ответов и повышение эффективности решения новых задач.
  2. Расширенный диапазон выводов (инструменты + моделирование). Deep Think оптимизирован для использования инструментов симуляции (симулированных браузеров, калькуляторов, исполнителей кода или внешних API), что позволяет рассматривать агентный рабочий процесс как часть цикла рассуждений модели. Это означает, что модель может планировать, выдвигать гипотезы, тестировать (с помощью симулированных инструментов) и корректировать результаты — форма внутреннего экспериментирования, полезная для сложных запросов на программирование, математические вычисления или исследования.
  3. Более высокий компромисс между вычислительной мощностью и задержкой. Чтобы получить более глубокие рассуждения, Deep Think работает в режиме вывода с более высокой стоимостью и задержкой, чем Pro. Google исторически предлагала такие компромиссы с помощью премиальных «экспертных» режимов в своих моделях; Deep Think следует этой схеме, отдавая приоритет качеству и надежности.

Как работает Gemini 3 Deep Think?

Чтобы понять «как», необходимо отделить режим продукта (Deep Think) от базового семейства моделей (Gemini 3). Deep Think — это не отдельный, автономный файл модели, который вы загружаете, а скорее конфигурация — уровень обученных возможностей и стек вывода, — которая открывает доступ к большему количеству вычислений, внутренним процедурам рассуждений и специализированным моделям декодирования, отдавая приоритет глубине и корректности над задержкой или стоимостью.

Более тесная интеграция инструментов

Deep Think использует те же примитивы вызова агентных инструментов и изоляции, что и Gemini 3 Pro, но с более консервативными политиками и дополнительными этапами проверки для каждого вызова инструмента (важно для безопасности исследовательских рабочих процессов).

Компромиссы и стратегия вывода Deep Think

Deep Think однозначно описывается как торговля задержка для глубина: он выполняет больше вычислений на запрос (более длительное внутреннее обдумывание или более тщательный поиск возможных путей рассуждения) и использует вспомогательные механизмы, такие как выборочное выполнение кода или многошаговая верификация, для решения новых задач. Это делает его более эффективным на «пограничных» тестах (новых, креативных или многоэтапных задачах), но потенциально более медленным и затратным в производстве.

Цепочка мыслей, блокноты и итеративное уточнение

Подход Deep Think основан на механизмах, успешно применяемых исследовательским сообществом и компаниями: рассуждения в стиле цепочки мыслей, внутренние блокноты и поэтапные рассуждения, где подзадачи решаются и проверяются перед интеграцией. Модель использует методы декомпозиции задач, проверки промежуточных этапов и преобразования решений в надёжные конечные результаты.

Каких показателей производительности достигает Gemini 3 Deep Think?

Компания Google опубликовала множество контрольных показателей, иллюстрирующих масштаб преимуществ, заявленных для Gemini 3, и в частности для конфигурации Deep Think. Наиболее убедительные публичные заявления относительно Gemini 3 Deep Think:

  • ARC-AGI (абстрактное визуальное мышление, варианты выполнения кода): Сообщается, что Gemini 3 Pro достигает ~31.1%, в то время как Gemini 3 Deep Think достигает ~45.1% на ARC-AGI-2 — резкий скачок в тесте, который ранее не мог похвастаться высокой производительностью.
  • GPQA Diamond (расширенные ответы на вопросы): Gemini 3 Pro показал результат около ~91.9%, в то время как Deep Think набрал около ~93.8% в опубликованных результатах. Это высокие показатели производительности, которые позволяют Gemini 3 занимать лидирующие позиции или занимать близкие позиции в нескольких рейтингах на момент запуска.
  • Последний экзамен человечества (испытание без инструментов): В материалах Google сообщается, что Gemini 3 Deep Think демонстрирует существенно более высокую производительность без использования инструментов (Google приводит показатель ~41.0%), превосходя Gemini 3 Pro при выполнении самых требовательных заданий в стиле экзамена.

Почему эти цифры важны. Эти результаты не одинаковы для всех задач: они наиболее заметны в задачах, требующих многошагового рассуждения, решения абстрактных визуальных задач и ситуаций, где модель должна хранить и обрабатывать большие объёмы контекста. Это соответствует функциональному замыслу Deep Think: продемонстрировать надёжные рассуждения более высокого порядка, а не просто лучшее предсказание поверхностного текста.

Gemini 3 Deep Think против Gemini 2.5 pro

Где Deep Think превосходит Gemini 2.x

Рассуждение и решение проблемы: Наиболее заметный прогресс наблюдается в тестах на рассуждение и задачах, требующих расширенных внутренних логических цепочек. Gemini 3 Deep Think показал значительно более высокие результаты в ARC-AGI, Humanity's Last Exam и других наборах тестов на рассуждение по сравнению с Gemini 2.5 Pro. Этот скачок, по-видимому, связан как с алгоритмическим (различные методы обучения/тонкой настройки), так и с операционным (обдумывание во время вывода в Deep Think).

Близнецы Глубокое Мышление

Мультимодальное понимание: Gemini 3 расширяет поддержку более богатых мультимодальных входных данных — видеоанализа, слияния рукописного и голосового ввода, а также более детального анализа изображений и текста, — а Deep Think расширяет эти возможности для задач, требующих смешивания различных типов медиа. Если Gemini 2.x хорошо справлялся с мультимодальными задачами, то Gemini 3 Deep Think представлен как более точный и контекстно-зависимый инструмент.

Использование агентов и инструментов: Акцент в Gemini 3 на агентных рабочих процессах (создание агентов, работающих в редакторах, терминалах, браузерах и вызовах API) знаменует собой качественное изменение. Deep Think, расширяя возможности внутреннего моделирования и оркестровки инструментов, обеспечивает более эффективное планирование и верификацию при взаимодействии с внешними инструментами — возможность, которая только зарождалась в предыдущих поколениях Gemini. Antigravity IDE от Google — это конкретный пример ранней интеграции, демонстрирующий это.

Эргономика кодирования и разработки: В Gemini 3 Pro уже улучшены функции однократного кодирования и «вибрационного кодирования» (высокоуровневая спецификация → генерация шаблонных приложений). Deep Think расширяет возможности модели в планировании крупных проектов, генерации более связного многофайлового кода и отладки в различных контекстах. Предварительные бенчмарки и отзывы партнёров демонстрируют явный рост производительности разработчиков по сравнению с версией 2.x.

Архитектурные и поведенческие различия (H3)

Практических причин преимуществ по сравнению с Gemini 2.x множество, и они взаимно усиливают друг друга:

  1. Улучшения магистральной сети MoE и экспертная настройка маршрутизации, что обеспечивает более эффективную специализацию и масштабирование.
  2. Унифицированный мультимодальный стек что лучше объединяет кросс-модальные рассуждения (важно для визуальных подзадач ARC-AGI).
  3. Операционные режимы, такие как Deep Think которые намеренно расширяют внутреннее обдумывание и проверку гипотез, жертвуя вычислительной мощностью/задержкой ради точности.

Практические результаты для пользователей

Для разработчиков и исследователей это означает:

  • Расширенные возможности автоматизации более важных рабочих процессов (например, синтез научной литературы, проектирование архитектуры, расширенная отладка), с которыми предыдущие поколения Gemini имели ограниченный успех.
  • Меньше галлюцинаций и больше обоснованных пошаговых цепочек рассуждений в сложных ситуациях.
  • Более высокая производительность при выполнении задач, требующих анализа длинных документов, кодовых баз или смешанных медиа.

Как получить доступ к Gemini 3 Deep Think

Вариант A — Потребительский/опытный пользователь: приложение Gemini + Google AI

Согласно официальному заявлению Google, Gemini 3 Deep Think — это пока недоступно для широкого круга пользователей на этапе общего выпуска. Сначала он будет доступен тестировщикам безопасности, а затем — подписчикам уровня «Ультра».

Гугл ИИ Ультра: 249.99 долларов США в месяц (в США) для уровня Ultra, который включает «Deep Think, Gemini Agent (только для США, только для английского языка) и самые высокие лимиты».

Где подписаться: Оформите подписку через приложение Gemini / Google One / страницу тарифных планов Google AI для вашего региона. В консоли подписки отображается, включен ли Deep Think для вашей учётной записи.

Вариант B — Маршрут разработчика/предприятия: API

Для разработчиков, которым нужен доступ к API: API Gemini 3 уже доступен в предварительной версии «Pro». Если вам нужна версия «Deep think», используйте её вариант API. Доступ к API оплачивается по факту использования и тарифицируется за миллион токенов ввода/вывода.

Хорошие новости — CometAPI теперь интегрирован API предварительного просмотра Gemini 3 Pro, а также доступ к последней версии ChatGPT 5.1. Цена API ниже официальной:

Модельgemini-3-pro-previewgemini-3-pro-preview-thinking
Входные токены$1.60$1.60
Выходные токены$9.60$9.60

Готовы к работе?→ Зарегистрируйтесь в CometAPI сегодня !

Если вы хотите узнать больше советов, руководств и новостей об искусственном интеллекте, подпишитесь на нас VKX и Discord!

Заключение

Gemini 3 Deep Think представляет собой преднамеренную и прагматичную попытку коммерциализации более глубокий машинное рассуждение: идея о том, что некоторые задачи можно решить с помощью внутреннего поэтапного обдумывания и использования интегрированных инструментов, а не одноразовых ответов.

SHARE THIS BLOG

Читать далее

500+ моделей в одном API

Скидка до 20%