Alibaba представляет модель искусственного интеллекта Qwen 3, обостряя гонку вооружений в сфере искусственного интеллекта в Китае

29 апреля 2025 — Alibaba Group запустила Qwen 3, последнюю версию своей флагманской модели искусственного интеллекта, в которой реализованы расширенные возможности гибридного мышления, призванные повысить адаптивность и эффективность разработчиков приложений и программного обеспечения.

Модели Qwen3 доступны (или скоро будут доступны) для загрузки по открытой лицензии на таких платформах, как Hugging Face и GitHub. Эти модели имеют размер от 0.6 млрд до 235 млрд параметров, причем более крупные модели обычно демонстрируют превосходные способности решения проблем благодаря своим обширным наборам параметров.

Основные характеристики и преимущества Qwen 3

Qwen3 поддерживает 119 языков и был обучен на обширном наборе данных, содержащем около 36 триллионов токенов. Токены представляют собой основные единицы данных, обрабатываемые моделями; обычно 1 миллион токенов равен примерно 750,000 XNUMX слов. Учебные материалы включали учебники, пары вопрос-ответ, фрагменты кода и данные, сгенерированные ИИ.

По сравнению со своим предшественником Qwen2, Qwen3 демонстрирует значительно улучшенную производительность. Хотя модели Qwen3 не могут превзойти топовые модели, такие как o3 и o4-mini от OpenAI, они все равно обеспечивают конкурентоспособные возможности.

В частности, самая большая модель Qwen3, Qwen-3-235B-A22B, показывает превосходство над o3-mini от OpenAI и Gemini 2.5 Pro от Google на таких платформах, как Codeforces, известных своими соревнованиями по программированию. Эта модель также превосходит сложные математические оценки, такие как AIME и BFCL. Однако на данный момент Qwen-3-235B-A22B не выпущен для публичного использования.

Квен3

Самая крупная общедоступная модель Qwen3, Qwen3-32B, остается конкурентоспособной по сравнению с различными фирменными и открытыми моделями ИИ, превосходя OpenAI o1 в нескольких тестах, включая тест кодирования LiveCodeBench. Alibaba утверждает, что Qwen3 «превосходит» возможности вызова инструментов и эффективно следует инструкциям и воспроизводит определенные форматы данных. Qwen3 также доступен через облачных провайдеров, таких как Fireworks AI и Hyperbolic.

Alibaba описывает модели Qwen3 как «гибридные», указывая на их способность заниматься глубокими рассуждениями для сложных проблем или быстро обрабатывать более простые запросы. Эта универсальная способность к рассуждениям, родственная моделям o3 OpenAI, позволяет им самостоятельно проверять факты, хотя и с увеличенной задержкой.

Стратегический контекст

Выпуск Qwen 3 произошел на фоне усиления конкуренции в секторе искусственного интеллекта в Китае, вызванного громким успехом местного стартапа DeepSeek в начале этого года. Высокопроизводительные и экономически эффективные модели искусственного интеллекта DeepSeek побудили крупных игроков, таких как Baidu, активизировать свои усилия в области искусственного интеллекта, представив передовые модели, такие как Ernie 4.5 Turbo и оптимизированный для рассуждений Ernie X1 Turbo.

Qwen 3 от Alibaba продолжает соперничать с DeepSeek, ранее представив Qwen 2.5-Max вскоре после прорыва DeepSeek. Стремительное нововведение подчеркивает усиливающуюся гонку вооружений ИИ среди китайских технологических гигантов.

Глобальные последствия Qwen 3

Серия Qwen от Alibaba сыграла важную роль в стратегическом повороте компании в сторону ИИ, шаге, который оживил компанию после регуляторных проблем и давления рынка в последние годы. Под руководством генерального директора Эдди Ву Alibaba консолидировала свое видение ИИ, перераспределив ресурсы и распродав нестратегические активы, чтобы сосредоточиться на разработке ИИ.

Запуск Qwen 3 не только демонстрирует приверженность Alibaba инновациям в области ИИ, но и подчеркивает более широкую тенденцию, когда китайские технологические гиганты соперничают за доминирование в секторе ИИ. Поскольку ИИ становится все более неотъемлемой частью различных отраслей, разработки в области ИИ в Китае готовы иметь глобальные последствия.

Первые шаги

Разработчики могут получить доступ Квен 3 API через CometAPI. Для начала изучите возможности модели на игровой площадке и обратитесь к API-руководство для получения подробных инструкций. Обратите внимание, что некоторым разработчикам может потребоваться проверить свою организацию перед использованием модели.

Основные характеристики и преимущества Qwen 3

Стратегический контекст

Глобальные последствия Qwen 3

Первые шаги

Читать далее

500+ моделей в одном API