29 апреля 2025 — Alibaba Group запустила Qwen 3, последнюю версию своей флагманской модели искусственного интеллекта, в которой реализованы расширенные возможности гибридного мышления, призванные повысить адаптивность и эффективность разработчиков приложений и программного обеспечения.
Модели Qwen3 доступны (или скоро будут доступны) для загрузки по открытой лицензии на таких платформах, как Hugging Face и GitHub. Эти модели имеют размер от 0.6 млрд до 235 млрд параметров, причем более крупные модели обычно демонстрируют превосходные способности решения проблем благодаря своим обширным наборам параметров.
Основные характеристики и преимущества Qwen 3
Qwen3 поддерживает 119 языков и был обучен на обширном наборе данных, содержащем около 36 триллионов токенов. Токены представляют собой основные единицы данных, обрабатываемые моделями; обычно 1 миллион токенов равен примерно 750,000 XNUMX слов. Учебные материалы включали учебники, пары вопрос-ответ, фрагменты кода и данные, сгенерированные ИИ.
По сравнению со своим предшественником Qwen2, Qwen3 демонстрирует значительно улучшенную производительность. Хотя модели Qwen3 не могут превзойти топовые модели, такие как o3 и o4-mini от OpenAI, они все равно обеспечивают конкурентоспособные возможности.
В частности, самая большая модель Qwen3, Qwen-3-235B-A22B, показывает превосходство над o3-mini от OpenAI и Gemini 2.5 Pro от Google на таких платформах, как Codeforces, известных своими соревнованиями по программированию. Эта модель также превосходит сложные математические оценки, такие как AIME и BFCL. Однако на данный момент Qwen-3-235B-A22B не выпущен для публичного использования.

Самая крупная общедоступная модель Qwen3, Qwen3-32B, остается конкурентоспособной по сравнению с различными фирменными и открытыми моделями ИИ, превосходя OpenAI o1 в нескольких тестах, включая тест кодирования LiveCodeBench. Alibaba утверждает, что Qwen3 «превосходит» возможности вызова инструментов и эффективно следует инструкциям и воспроизводит определенные форматы данных. Qwen3 также доступен через облачных провайдеров, таких как Fireworks AI и Hyperbolic.
Alibaba описывает модели Qwen3 как «гибридные», указывая на их способность заниматься глубокими рассуждениями для сложных проблем или быстро обрабатывать более простые запросы. Эта универсальная способность к рассуждениям, родственная моделям o3 OpenAI, позволяет им самостоятельно проверять факты, хотя и с увеличенной задержкой.
Стратегический контекст
Выпуск Qwen 3 произошел на фоне усиления конкуренции в секторе искусственного интеллекта в Китае, вызванного громким успехом местного стартапа DeepSeek в начале этого года. Высокопроизводительные и экономически эффективные модели искусственного интеллекта DeepSeek побудили крупных игроков, таких как Baidu, активизировать свои усилия в области искусственного интеллекта, представив передовые модели, такие как Ernie 4.5 Turbo и оптимизированный для рассуждений Ernie X1 Turbo.
Qwen 3 от Alibaba продолжает соперничать с DeepSeek, ранее представив Qwen 2.5-Max вскоре после прорыва DeepSeek. Стремительное нововведение подчеркивает усиливающуюся гонку вооружений ИИ среди китайских технологических гигантов.
Глобальные последствия Qwen 3
Серия Qwen от Alibaba сыграла важную роль в стратегическом повороте компании в сторону ИИ, шаге, который оживил компанию после регуляторных проблем и давления рынка в последние годы. Под руководством генерального директора Эдди Ву Alibaba консолидировала свое видение ИИ, перераспределив ресурсы и распродав нестратегические активы, чтобы сосредоточиться на разработке ИИ.
Запуск Qwen 3 не только демонстрирует приверженность Alibaba инновациям в области ИИ, но и подчеркивает более широкую тенденцию, когда китайские технологические гиганты соперничают за доминирование в секторе ИИ. Поскольку ИИ становится все более неотъемлемой частью различных отраслей, разработки в области ИИ в Китае готовы иметь глобальные последствия.
Первые шаги
Разработчики могут получить доступ Квен 3 API через CometAPI. Для начала изучите возможности модели на игровой площадке и обратитесь к API-руководство для получения подробных инструкций. Обратите внимание, что некоторым разработчикам может потребоваться проверить свою организацию перед использованием модели.
