Qwen3: Что это такое и как использовать

CometAPI
AnnaApr 29, 2025
Qwen3: Что это такое и как использовать

В апреле 2025 года Alibaba Cloud запустила Qwen3, последнюю версию в серии больших языковых моделей (LLM) Qwen. Как значительный прогресс в области искусственного интеллекта, Qwen3 демонстрирует выдающиеся возможности в понимании языка, рассуждениях, мультимодальной обработке и вычислительной эффективности. Модель поддерживает 119 языков, обучена на наборе данных из 36 триллионов токенов и предлагает различные размеры моделей от 0.6 миллиарда до 235 миллиардов параметров. В этой статье подробно рассматривается определение Qwen3, его функции, методы использования, подходы к доступу, сравнения с другими моделями и его потенциальное влияние на область ИИ, что призвано служить всеобъемлющим справочником для разработчиков, исследователей и предприятий.

Что такое Квен3?

Qwen3 — это серия больших языковых моделей, разработанных для понимания и генерации текста, похожего на человеческий, подходящего для различных сценариев от повседневного общения до сложных задач рассуждения. Это третье поколение в серии Qwen, разработанной Alibaba Cloud, после выпуска Qwen в 2023 году и Qwen2 в 2024 году, которые представили улучшения в производительности и функциональности.

Краткая история серии Qwen

Серия Qwen началась в апреле 2023 года с выпуска модели Qwen, изначально названной «Tongyi Qianwen», основанной на архитектуре Meta AI Llama. После получения одобрения китайского правительства в сентябре 2023 года Qwen был официально выпущен для публики. В декабре 2023 года модели Qwen 72B и 1.8B были сделаны с открытым исходным кодом, за чем последовал запуск Qwen2 в июне 2024 года, который принял архитектуру Mixture of Experts (MoE). Qwen3, представленный в апреле 2025 года, включает в себя возможности гибридного рассуждения и многомодальные функции, что делает его самой продвинутой версией в серии.

Особенности Qwen3

Qwen3 предлагает ряд инновационных функций, которые выделяют его на мировом рынке моделей ИИ:

Мультиязычная поддержка

Qwen3 поддерживает 119 языков, охватывая основные мировые языковые системы. Это делает его идеальным выбором для кросс-культурных и многоязычных приложений, таких как международная поддержка клиентов и генерация многоязычного контента.

Данные крупномасштабного обучения

Набор данных для обучения Qwen3 состоит из почти 36 триллионов токенов, что эквивалентно примерно 270 миллиардам слов. Он включает широкий спектр контента, например, учебники, пары вопросов и ответов, фрагменты кода и контент, сгенерированный ИИ, в основном на китайском и английском языках. Такой масштаб обеспечивает его превосходную производительность в понимании и генерации языка.

Различные размеры моделей

Qwen3 предлагает различные размеры моделей от 0.6 млрд до 235 млрд параметров:

  • Малые модели (0.6Б, 1.7Б): Подходит для легких приложений, способных работать на таких устройствах, как смартфоны.
  • Средние модели (4B, 8B, 14B, 32B): Баланс производительности и потребностей в ресурсах, применимый к большинству сценариев разработки.
  • Большие модели (235B): Обеспечьте высочайшую производительность для задач корпоративного уровня.
Название моделиРазмер параметраОкно контекста (токены)Применение
Квен3-0.6Б0.6 млрд32,768Мобильные устройства, легкие приложения
Квен3-1.7Б1.7 млрд32,768Встроенные системы, быстрое рассуждение
Квен3-4Б4 млрд131,072Малые и средние проекты, исследования
Квен3-8Б8 млрд131,072Общие приложения, разработка
Квен3-32Б32 млрд131,072Высокопроизводительные задачи, корпоративные приложения
Qwen3-235B-A22B235 млрд131,072Высочайшая производительность, сложные рассуждения (недоступно для общественности)

Возможности гибридного мышления

Qwen3 представляет функцию «гибридного рассуждения», которая позволяет модели рассуждать шаг за шагом, прежде чем давать ответы на сложные вопросы. Эта возможность особенно заметна в логических рассуждениях, математических задачах и задачах программирования. Пользователи могут включать или отключать этот режим с помощью настроек (например, enable_thinking=True).

Модели смешанных экспертов (MoE)

Qwen3 включает модели Mixture of Experts, такие как Qwen3-30B-A3B (30 миллиардов параметров, 3 миллиарда активных) и Qwen3-235B-A22B (235 миллиардов параметров, 22 миллиарда активных). Эти модели ускоряют вывод, активируя только подмножество параметров, сохраняя при этом высокую производительность, что делает их хорошо подходящими для крупномасштабного развертывания.

Расширенные лимиты токенов

Некоторые модели Qwen3 поддерживают контекстные окна до 131,072 4 токенов (модели 2B и выше), что значительно больше, чем 32,768 XNUMX токенов QwenXNUMX. Это улучшение позволяет модели обрабатывать более длинные диалоги и более сложные задачи по генерации текста.

Квен3

Тесты Qwen 3

Модель демонстрирует эффективность в генерации кода, отладке и решении математических задач, что делает ее ценным инструментом для разработки программного обеспечения и анализа данных.

Qwen3: Что это такое и как использовать

Как использовать Qwen3

Приложения

Универсальность Qwen3 делает его пригодным для различных сценариев:

  • Чат-боты и виртуальные помощники: Предоставляйте естественные, контекстно-зависимые ответы для служб поддержки клиентов и приложений личного помощника.
  • Генерация контента: Создавайте статьи, истории, код и другой творческий или технический контент.
  • Анализ данных: Помощь в интерпретации и обобщении больших наборов данных для исследований и бизнес-аналитики.
  • Образовательные инструменты: Помогите студентам с домашними заданиями, объяснениями и индивидуальным обучением.
  • Научное исследование: Поддержка обзора литературы, выдвижения гипотез и решения научных проблем.

Интеграция проекта

Разработчики могут интегрировать Qwen3 в свои проекты, используя следующие фреймворки и инструменты:

  • Трансформаторы: Требует transformers>=4.51.0. Пример фрагмента кода:
  from transformers import AutoModelForCausalLM, AutoTokenizer
  model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen3-8B")
  tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen3-8B")
  inputs = tokenizer("Hello, how can I assist you?", return_tensors="pt")
  outputs = model.generate(**inputs, enable_thinking=True)
  print(tokenizer.decode(outputs))

Пользователи могут включить режим рассуждений с помощью enable_thinking=True или управлять им с помощью /think и /nothink.

  • llama.cpp: Требует llama.cpp>=b5092. Пример командной строки:
  ./llama-cli -hf Qwen/Qwen3-8B-GGUF:Q8_0 --jinja --color -ngl 99 -fa -sm row --temp 0.6 --top-k 20 --top-p 0.95 --min-p 0 -c 40960 -n 32768 --no-context-shift
  • Оллама: Требует Ollama v0.6.6 или выше. Выполните команду:
  ollama run qwen3:8b

Поддерживает такие параметры, как num_ctx 40960 и num_predict 32768.

  • Варианты развертывания:
  • SGLang: Требует sglang>=0.4.6.post1. Команда запуска: python -m sglang.launch_server --model-path Qwen/Qwen3-8B --port 30000 --reasoning-parser qwen3
  • вЛЛМ: Требует vllm>=0.8.5. Подать команду: vllm serve Qwen/Qwen3-8B --port 8000 --enable-reasoning --reasoning-parser deepseek_r1
  • MindIE: Поддерживает Ascend NPU; подробности см. на сайте Modelers.

Использование инструмента

Qwen-Agent поддерживает взаимодействие Qwen3 с внешними инструментами и API, подходящими для задач, требующих динамического доступа к данным. Эта функция также поддерживается SGLang, vLLM, Transformers, llama.cpp и Ollama.

Тонкая настройка

Qwen3 можно настраивать с помощью таких фреймворков, как Axolotl, UnSloth, Swift и Llama-Factory, поддерживающих такие методы, как контролируемая тонкая настройка (SFT), прямая оптимизация предпочтений (DPO) и групповая надежная оптимизация предпочтений (GRPO).

Заключение

Qwen3 представляет собой прорыв в области больших языковых моделей, предлагая улучшенную функциональность, универсальность и доступность. Благодаря многоязычной поддержке, гибридному рассуждению и специализированным версиям для задач зрения, математики и звука Qwen3 позиционирует себя как ключевого игрока в области ИИ. Его конкурентоспособные показатели в таких бенчмарках, как Codeforces, AIME и BFCL, а также его доступность с открытым исходным кодом делают его идеальным выбором для разработчиков, исследователей и предприятий. По мере развития технологий ИИ Qwen3 знаменует собой важный шаг на пути к созданию интеллектуальных систем, способных понимать, рассуждать и взаимодействовать с миром все более сложными способами.

Первые шаги

Разработчики могут получить доступ Квен 3 API через CometAPI. Для начала изучите возможности модели на игровой площадке и обратитесь к API-руководство для получения подробных инструкций. Обратите внимание, что некоторым разработчикам может потребоваться проверить свою организацию перед использованием модели.

Читать далее

500+ моделей в одном API

Скидка до 20%