Что такое DeepSeek V3.2 и какие изменения произошли в официальной версии?

CometAPI
AnnaNov 30, 2025
Что такое DeepSeek V3.2 и какие изменения произошли в официальной версии?

DeepSeek выпустил ДипСик V3.2 как преемник линейки V3.x и сопутствующего DeepSeek-V3.2-Speciale Версия, которую компания позиционирует как высокопроизводительную версию, ориентированную на рассуждения и предназначенную для использования агентами/инструментами. Версия 3.2 основана на экспериментальной работе (V3.2-Exp) и предлагает более высокий уровень рассуждений, версию Speciale, оптимизированную для достижения «золотого» уровня производительности в математике/соревновательном программировании, а также то, что DeepSeek описывает как первую в своем роде двухрежимную систему «мышление + инструмент», которая тесно интегрирует внутренние пошаговые рассуждения с вызовом внешних инструментов и рабочими процессами агентов.

Что такое DeepSeek V3.2 и чем отличается V3.2-Speciale?

DeepSeek-V3.2 — официальный преемник экспериментальной версии DeepSeek V3.2-Exp. DeepSeek описывает её как Семейство моделей «сначала рассуждение» создано для агентов, т. е. модели, настроенные не только на естественное качество разговора, но и специально на многошаговый вывод, вызов инструментов и надежную цепочку рассуждений при работе в средах, которые включают внешние инструменты (API, выполнение кода, соединители данных).

Что такое DeepSeek-V3.2 (базовый)

  • Позиционируется как преемник экспериментальной линейки V3.2-Exp; предназначен для широкой доступности через приложение/веб/API DeepSeek.
  • Сохраняет баланс между эффективностью вычислений и надежностью рассуждений для агентских задач.

Что такое DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale — это вариант, который DeepSeek позиционирует как «Специальную версию» с расширенными возможностями, оптимизированную для рассуждений соревновательного уровня, продвинутой математики и производительности агентов. Он позиционируется как вариант с расширенными возможностями, который «раздвигает границы возможностей рассуждений». В настоящее время DeepSeek представляет Speciale как модель, работающую только на API с временной маршрутизацией доступа; предварительные тесты показывают, что она способна конкурировать с высококлассными закрытыми моделями в тестах рассуждений и программирования.

Что такое DeepSeek V3.2 и какие изменения произошли в официальной версии?

Какие родословные и инженерные решения привели к появлению версии 3.2?

V3.2 продолжает линию итеративной разработки DeepSeek, представленную в 2025 году: V3 → V3.1 (Terminus) → V3.2-Exp (экспериментальный этап) → V3.2 → V3.2-Speciale. Экспериментальная версия V3.2-Exp была представлена DeepSeek Sparse Attention (DSA) — мелкозернистый механизм разреженного внимания, направленный на снижение затрат памяти и вычислительных затрат для очень длинных контекстов с сохранением качества вывода. Это исследование DSA и работа по снижению затрат послужили технической основой для официального семейства V3.2.

Что нового в официальной версии DeepSeek 3.2?

1) Улучшение способности к рассуждению — как улучшается способность к рассуждению?

DeepSeek продает V3.2 как «сначала рассуждение». Это означает, что архитектура и тонкая настройка направлены на надежное выполнение многошагового вывода, поддержание внутренних цепочек мыслей и поддержку видов структурированного обсуждения, необходимых агентам для правильного использования внешних инструментов.

Конкретно, улучшения включают в себя:

  • Обучение и RLHF (или аналогичные процедуры выравнивания) настроены на поощрение явного пошагового решения проблем и стабильных промежуточных состояний (полезно для математических рассуждений, многошаговой генерации кода и логических задач).
  • Архитектурные решения и решения на основе функции потерь позволяют сохранять более длинные контекстные окна и точно ссылаться на более ранние этапы рассуждений в модели.
  • Практические режимы (см. «двойной режим» ниже), которые позволяют одной и той же модели работать либо в более быстром режиме «чата», либо в режиме осознанного «мышления», когда она намеренно прорабатывает промежуточные шаги, прежде чем действовать.

Тесты, приведенные в обзоре релиза, демонстрируют заметный прогресс в математических тестах и ​​тестах на рассуждение; независимые предварительные тесты сообщества также показывают впечатляющие результаты в тестах на конкурентных оценочных наборах.

Что такое DeepSeek V3.2 и какие изменения произошли в официальной версии?

2) Прорывные характеристики в специальной версии — насколько лучше?

DeepSeek-V3.2-Speciale Заявлено, что Speciale обеспечивает более высокую точность рассуждений и оркестровку агентов по сравнению со стандартной версией V3.2. Поставщик позиционирует Speciale как уровень производительности, ориентированный на высокие нагрузки, связанные с рассуждениями, и сложные задачи для агентов; в настоящее время он доступен только через API и предлагается как временная конечная точка с более высокой производительностью (DeepSeek указал, что первоначально доступность Speciale будет ограничена). Версия Speciale интегрирует предыдущую математическую модель DeepSeek-Math-V2; она может самостоятельно доказывать математические теоремы и проверять логические рассуждения; она достигла выдающихся результатов в нескольких соревнованиях мирового уровня:

  • 🥇 Золотая медаль ММО (Международной математической олимпиады)
  • 🥇 Золотая медаль Китайской математической олимпиады (CMO)
  • 🥈 ICPC (Международный чемпионат по программированию) Второе место (соревнование людей)
  • 🥉 IOI (Международная олимпиада по информатике) Десятое место (Человеческий конкурс)
эталонный тестGPT-5 ВысокийБлизнецы-3.0 ПроКими-К2 МышлениеDeepSeek-V3.2 МышлениеDeepSeek-V3.2 Speciale
АИМЭ 202594.6 (13к)95.0 (15к)94.5 (24к)93.1 (16к)96.0 (23к)
HMMT 2025 февраля88.3 (16к)97.5 (16к)89.4 (31к)92.5 (19к)99.2 (27к)
HMMT ноябрь 2025 г.89.2 (20к)93.3 (15к)89.2 (29к)90.2 (18к)94.4 (25к)
IMOAnswerBench76.0 (31к)83.3 (18к)78.6 (37к)78.3 (27к)84.5 (45к)
LiveCodeBench84.5 (13к)90.7 (13к)82.6 (29к)83.3 (16к)88.7 (27к)
CodeForces2537 (29к)2708 (22к)-2386 (42к)2701 (77к)
GPQA-Бриллиант85.7 (8к)91.9 (8к)84.5 (12к)82.4 (7к)85.7 (16к)
HLE26.3 (15к)37.7 (15к)23.9 (24к)25.1 (21к)30.6 (35к)

3) Первая в истории реализация двухрежимной системы «мышление + инструмент»

Одно из наиболее интересных с практической точки зрения утверждений в версии 3.2 – это двухрежимный рабочий процесс который разделяет (и позволяет вам выбирать между) быстрым разговорным режимом и более медленным, сознательным «мыслительным» режимом, который тесно интегрируется с использованием инструментов.

  • Режим «Чат/быстрый»: Разработан для чата с низкой задержкой, ориентированного на пользователя, с краткими ответами и меньшим количеством внутренних рассуждений — подходит для неформальной помощи, коротких вопросов и ответов, а также приложений, чувствительных к скорости.
  • Режим «Мышление/рассуждение»: Оптимизирована для строгой цепочки рассуждений, пошагового планирования и координации внешних инструментов (API, запросов к базе данных, выполнения кода). При работе в режиме мышления модель генерирует более явные промежуточные шаги, которые можно анализировать или использовать для обеспечения безопасных и корректных вызовов инструментов в агентных системах.

Этот шаблон (двухрежимная архитектура) присутствовал в более ранних экспериментальных ветвях, и DeepSeek интегрировал его глубже в версии 3.2 и Speciale — Speciale в настоящее время поддерживает исключительно режим мышления (отсюда и ограничение доступа к API). Возможность переключения между скоростью и обдуманностью ценна для инженеров, поскольку позволяет разработчикам выбирать оптимальный баланс между задержкой и надёжностью при создании агентов, взаимодействующих с реальными системами.

Чем это примечательно: Многие современные системы предлагают либо мощную модель цепочки мыслей (для объяснения рассуждений), либо отдельный уровень оркестровки агента/инструмента. Структура DeepSeek предполагает более тесную связь — модель может «думать», а затем детерминированно вызывать инструменты, используя ответы инструментов для формирования последующих мыслей, — что более удобно для разработчиков, создающих автономных агентов.

Где взять DeepSeek v3.2

Короткий ответ — вы можете получить DeepSeek v3.2 несколькими способами в зависимости от того, что вам нужно:

  • Официальный сайт/приложение (использовать онлайн) — попробуйте веб-интерфейс DeepSeek или мобильное приложение для интерактивного использования V3.2.
  • Доступ к API — DeepSeek предоставляет доступ к версии 3.2 через свой API (документация включает названия моделей, базовые URL и цены). Зарегистрируйтесь, чтобы получить ключ API и вызвать конечную точку версии 3.2.
  • Загружаемые/открытые веса (Hugging Face) — модель (варианты V3.2 / V3.2-Exp) опубликована на Hugging Face и доступна для скачивания (в открытом доступе). huggingface-hub or transformers чтобы вытащить файлы.
  • CometAPI — Платформа агрегации API ИИ предоставляет конечные точки V3.2-Exp. Цена ниже официальной.

Несколько практических замечаний:

  • Если вы хотите, веса для локального запуска, перейдите на страницу модели Hugging Face (примите все условия лицензии/доступа там) и используйте huggingface-cli or transformers для загрузки; в репозитории GitHub обычно указаны точные команды.
  • Если вы хотите, использование в производстве через API, следуйте документации API нужной вам платформы, например, Cometapi, для имен конечных точек и правильного base_url для варианта V3.2.

DeepSeek-V3.2-Speciale:

  • Открыто только для исследовательских целей, поддерживает диалог «Режим мышления», но не поддерживает вызовы инструментов.
  • Максимальный выход может достигать 128 тыс. токенов (сверхдлинная цепочка мышления).
  • В настоящее время тестирование бесплатное и продлится до 15 декабря 2025 года.

Заключение

DeepSeek-V3.2 представляет собой значительный шаг в развитии моделей, ориентированных на рассуждения. Сочетание улучшенных многошаговых рассуждений, специализированных высокопроизводительных версий (Speciale) и интеграции «мышление + инструмент» с использованием производственных процессов заслуживает внимания всех, кто разрабатывает продвинутые агенты, помощников по программированию или исследовательские рабочие процессы, где рассуждения должны чередоваться с внешними действиями.

Разработчики могут получить доступ к DeepSeek V3.2 через CometAPI. Для начала изучите возможности моделирования CometAPI в Детская Площадка и проконсультируйтесь с API-руководство для получения подробных инструкций. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. сetAPI предложить цену намного ниже официальной, чтобы помочь вам интегрироваться.

Готовы к работе?→ Зарегистрируйтесь в CometAPI сегодня !

Если вы хотите узнать больше советов, руководств и новостей об искусственном интеллекте, подпишитесь на нас VKX и Discord!

Читать далее

500+ моделей в одном API

Скидка до 20%