Alibaba AI представляет Qwen3-Max: модель Qwen с триллионом параметров и поддержкой CometAPI

Команда Qwen компании Alibaba выпустила Qwen3-Max-Preview (Инструкция) — самая большая модель компании на сегодняшний день, с более 1 триллиона параметров — и сразу же стал доступен через Qwen Chat, Alibaba Cloud Model Studio (API) и сторонние торговые площадки, такие как CometAPI. Предварительная версия ориентирована на рассуждения, кодирование и работу с большими документами, сочетая экстремальный масштаб с очень большим контекстным окном и кэшированием контекста для поддержания низкой задержки во время длительных сеансов.

Основные технические моменты

Огромное количество параметров (более триллиона): Переход к модели с более чем триллионом параметров призван повысить производительность обучения по сложным шаблонам (многошаговый анализ, синтез кода, глубокое понимание документов). Первые бенчмарки, опубликованные Qwen, демонстрируют улучшенные результаты в области анализа, кодирования и наборов бенчмарков по сравнению с предыдущими топовыми моделями Qwen.
Сверхдлинный контекст и кэширование: The 262k токенов Окно позволяет командам обрабатывать целые длинные отчёты, многофайловые кодовые базы или длинные истории чатов за один проход. Поддержка кэширования контекста сокращает количество повторных вычислений для повторяющегося контекста и может снизить задержку и затраты для длительных сеансов.
Многоязычность + мастерство кодирования: В семействе Qwen3 особое внимание уделяется двуязычной (китайский/английский) и широкой многоязычной поддержке, а также более надежному кодированию и структурированной обработке выходных данных — это полезно для помощников по кодированию, автоматизированного создания отчетов и крупномасштабной текстовой аналитики.
Создан для скорости и качества. Пользователи предварительной версии описывают «молниеносную» скорость отклика и улучшенное выполнение инструкций и логическое мышление по сравнению с предыдущими версиями Qwen3. Alibaba позиционирует эту модель как высокопроизводительный флагман для сценариев производственного уровня, агентских задач и разработки.

Наличие и доступ

Плата за использование Alibaba Cloud многоуровневый, на основе токенов Цены на Qwen3-Max-Preview (отдельные входные и выходные тарифы). Тарификация производится за миллион токенов и применяется к фактическому количеству токенов, потребленных после использования любой бесплатной квоты.

Опубликованная предварительная цена Alibaba (в долларах США) варьируется по запросу. вход Объем токенов (те же уровни определяют, какие ставки за единицу применяются):

0–32 тыс. входных токенов: 0.861 долл. США / 1 млн входных токенов и $3.441 1 / XNUMX млн выходных токенов.
32K–128K входных токенов: 1.434 долл. США / 1 млн входных токенов и $5.735 1 / XNUMX млн выходных токенов.
128K–252K входных токенов: 2.151 долл. США / 1 млн входных токенов и $8.602 1 / XNUMX млн выходных токенов.

CometAPI предоставляет официальную скидку 20%, чтобы помочь пользователям вызывать API, подробности см. Qwen3-Max-Preview:


Входные токены	$0.24
Выходные токены	$2.42

Qwen3-Max расширяет семейство Qwen3 (которое в предыдущих сборках использовало гибридные архитектуры, такие как варианты «Mixture-of-Experts» и несколько уровней активных параметров). Предыдущие версии Qwen3 от Alibaba были сосредоточены как на «мышлении» (пошаговом рассуждении), так и на «инструкциях»; Qwen3-Max позиционируется как новый топовый вариант с инструкцией в этой линейке, демонстрируя, что он превосходит предыдущий самый эффективный продукт компании, Qwen3-235B-A22B-2507, и что модель с параметрами 1T лидирует в ряде тестов.

В SuperGPQA, AIME25, LiveCodeBench v6, Arena-Hard v2 и LiveBench (20241125) Qwen3-Max-Preview стабильно опережает Claude Opus 4, Kimi K2 и Deepseek-V3.1.

Alibaba AI представляет Qwen3-Max: модель Qwen с триллионом параметров и поддержкой CometAPI

Как получить доступ и использовать Qwen3-Max (практическое руководство)

1) Попробуйте в браузере (Qwen Chat)

Войти Qwen Чат (официальный веб-интерфейс/чат Qwen) и выберите Qwen3-Max-Preview (Инструктирующая) модель отображается в окне выбора модели. Это самый быстрый способ визуально оценить разговорные и обучающие задачи.

2) Доступ через Alibaba Cloud (Model Studio / Cloud API)

Войти в Alibaba Cloud → Модельная студия / Модельное обслуживаниеСоздайте экземпляр вывода или выберите конечную точку размещенной модели для qwen3-max-preview (или помеченная предварительная версия).
Выполните аутентификацию, используя свой ключ доступа к облаку Alibaba Cloud Access Key/роли оперативной памяти, и вызовите конечную точку вывода с помощью запроса POST, содержащего вашу подсказку и любые параметры генерации (температуру, максимальное количество токенов и т. д.).

3) Использовать через сторонние хосты/агрегаторы

Согласно информации, предварительная версия доступна через CometAPI и другие API-агрегаторы, которые позволяют разработчикам вызывать несколько размещённых моделей с помощью одного API-ключа. Это упрощает тестирование между поставщиками, но требует проверки задержки, региональной доступности и политик обработки данных для каждого хоста.

Первые шаги

CometAPI — это унифицированная платформа API, которая объединяет более 500 моделей ИИ от ведущих поставщиков, таких как серия GPT OpenAI, Gemini от Google, Claude от Anthropic, Midjourney, Suno и других, в единый, удобный для разработчиков интерфейс. Предлагая последовательную аутентификацию, форматирование запросов и обработку ответов, CometAPI значительно упрощает интеграцию возможностей ИИ в ваши приложения. Независимо от того, создаете ли вы чат-ботов, генераторы изображений, композиторов музыки или конвейеры аналитики на основе данных, CometAPI позволяет вам выполнять итерации быстрее, контролировать расходы и оставаться независимыми от поставщика — и все это при использовании последних достижений в экосистеме ИИ.

Заключение

Qwen3-Max-Preview ставит Alibaba в один ряд с организациями, поставляющими клиентам модели объёмом в триллионы долларов. Сочетание чрезвычайной длины контекста и API, совместимого с OpenAI, снижает барьер интеграции для предприятий, которым требуется анализ длинных документов, автоматизация кода или оркестровка агентов. Стоимость и стабильность предварительного просмотра являются основными факторами, которые следует учитывать при внедрении: организациям следует провести пилотные испытания с кэшированием, потоковой передачей и пакетными вызовами для управления задержками и ценообразованием.