API Qwen 3

CometAPI
AnnaApr 28, 2025
API Qwen 3

Qwen 3 API — это совместимый с OpenAI интерфейс, разработанный Alibaba Cloud, позволяющий разработчикам интегрировать расширенные большие языковые модели Qwen 3, доступные как в плотной, так и в смешанной (MoE) архитектуре, в свои приложения для таких задач, как генерация текста, рассуждения и многоязыковая поддержка.


Обзор Qwen 3

Главные преимущества

  • Возможности гибридного мышления: Qwen 3 объединяет как традиционные функции искусственного интеллекта, так и расширенные динамические рассуждения, повышая адаптивность и эффективность для разработчиков.
  • Масштабируемость: Семейство моделей включает как плотные (от 0.6 до 32 Б параметров), так и разреженные модели (30 Б с 3 Б активированными параметрами, 235 Б с 22 Б активированными параметрами), что позволяет использовать их в широком спектре приложений.
  • Окно расширенного контекста: Большинство моделей Qwen 3 поддерживают окно контекста токенов размером 128 КБ, что упрощает обработку длинных документов и сложных задач.
  • Мультимодальная поддержка: Модели Qwen 3 способны обрабатывать текст, изображения, аудио- и видеоданные, что делает их пригодными для различных приложений, включая голосовое взаимодействие в реальном времени и визуальный анализ данных.
  • Доступность открытого исходного кода: Все модели Qwen 3 лицензированы по лицензии Apache 2.0 и доступны на таких платформах, как Hugging Face и ModelScope.

Техническая Архитектура

Варианты модели

Qwen 3 охватывает ряд моделей для решения различных вычислительных задач:

  • Плотные модели: Доступны размеры 0.6B, 1.7B, 4B, 8B, 14B и 32B.
  • Разреженные модели: Включите модель 30B с активированными параметрами 3B и модель 235B с активированными параметрами 22B.

Архитектура обеспечивает эффективное развертывание на различных аппаратных конфигурациях: от мобильных устройств до высокопроизводительных серверов.

Контекстное понимание

Благодаря контекстному окну размером 128 3 токенов модели Qwen XNUMX могут поддерживать согласованность в ходе расширенных взаимодействий, что делает их подходящими для задач, требующих глубокого контекстного понимания, таких как генерация развернутого контента и решение сложных проблем.

Эволюция серии Qwen

От Qwen до Qwen 3

Серия Qwen претерпела значительную эволюцию:

  • Qwen: Представлены как базовые предварительно обученные языковые модели, демонстрирующие превосходную производительность при выполнении различных задач.
  • Квен-Чат: Модели чата, настроенные с использованием методов выравнивания человеком, демонстрирующие расширенные возможности использования инструментов и планирования.
  • Квен2: Расширен набор моделей с помощью моделей языка, настроенных на инструкции, с диапазонами параметров от 0.5 до 72 млрд. Флагманская модель Qwen2-72B продемонстрировала замечательную производительность в различных тестах.
  • Квен2.5: Представлены такие модели, как Qwen2.5-Omni, способные обрабатывать текст, изображения, видео и аудио, а также генерировать как текстовые, так и аудиовыходы.
  • Квен 3: Последняя версия, включающая возможности гибридного мышления и повышенную эффективность, знаменует собой значительный прогресс в серии.

Тестовая производительность

Значительно превосходя предыдущие модели, такие как QwQ и Qwen2.5, Qwen3 обеспечивает превосходные возможности математики, кодирования, здравого смысла, творческого письма и интерактивного диалога. Вариант Qwen3-30B-A3B включает 30.5 млрд параметров (3.3 млрд активированных), 48 слоев, 128 экспертов (8 активированных на задачу) и поддерживает до 131 тыс. контекстов токенов с YaRN, устанавливая новый стандарт среди моделей с открытым исходным кодом.

  • AIME25: Qwen3 набрал 81.5 балла, установив новый рекорд для ПО с открытым исходным кодом.
  • LiveCodeBench: Qwen3 набрал более 70 очков, что даже лучше, чем Grok3.
  • АренаХард: Qwen3 превзошел OpenAl-o1 и DeepSeek-FR1, набрав 95.6 очков.

Пример кода

Разработчики могут взаимодействовать с моделями Qwen 3, используя следующий фрагмент кода Python:

from transformers import AutoTokenizer, AutoModelForCausalLM

# Load tokenizer and model

tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-3-14B")
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-3-14B")

# Encode input prompt

input_text = "Explain the significance of hybrid reasoning in AI models."
input_ids = tokenizer.encode(input_text, return_tensors="pt")

# Generate response

output = model.generate(input_ids, max_length=200)
response = tokenizer.decode(output, skip_special_tokens=True)

print(response)

В этом примере показано, как загрузить модель Qwen 3 и сгенерировать ответ на заданный запрос с помощью библиотеки Hugging Face Transformers.

Заключение

Qwen 3 представляет собой значительную веху в развитии ИИ Alibaba, предлагая улучшенные возможности рассуждения, масштабируемость и мультимодальную поддержку. Его доступность с открытым исходным кодом по лицензии Apache 2.0 поощряет широкое внедрение и дальнейшие инновации в сообществе ИИ. Поскольку ландшафт ИИ продолжает развиваться, Qwen 3 позиционирует Alibaba как грозного игрока как на внутренней, так и на глобальной арене.


Как позвонить Qwen 3 API от CometAPI

Qwen 3 Цены на API в CometAPI:

Версия моделиQwen3 235B A22BQwen: Qwen3 30B A3BQwen3 8B
Цена в CometAPIВходные токены: 1.6 долл. США / млн токеновВходные токены: $0.4/ млн токеновВходные токены: 0.32 долл. США / млн токенов
Выходные токены: $4.8 / млн токеновВыходные токены: $1.2 / млн токеновВыходные токены: $0.96 / млн токенов
название моделиqwen3-235b-a22bqwen3-30b-a3bqwen3-8b
иллюстрироватьЭто флагманская модель серии Qwen3 с 235 миллиардами параметров, использующая архитектуру Mixture of Experts (MoE).qwen3-30b-a3b: Благодаря 30 миллиардам параметров он обеспечивает баланс между производительностью и требованиями к ресурсам, подходит для приложений корпоративного уровня.Облегченная модель с 800 миллионами параметров, разработанная специально для сред с ограниченными ресурсами (например, мобильных устройств или серверов с низкой конфигурацией).

Необходимые шаги

  • Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
  • Получите ключ API-интерфейса для доступа к учетным данным. Нажмите «Добавить токен» в API-токене в персональном центре, получите ключ токена: sk-xxxxx и отправьте.
  • Получите URL этого сайта: https://api.cometapi.com/

Методы использования

  1. Выберите "qwen3-235b-a22b""qwen3-30b-a3b""qwen3-8b” конечная точка для отправки запроса API и установки тела запроса. Метод запроса и тело запроса получены из нашего веб-сайта API doc. Наш веб-сайт также предоставляет тест Apifox для вашего удобства.
  2. Заменять с вашим реальным ключом CometAPI из вашей учетной записи.
  3. Введите свой вопрос или запрос в поле «Контент» — на него ответит модель.
  4. . Обработайте ответ API, чтобы получить сгенерированный ответ.

Информацию о моделях, запущенных в Comet API, см. https://api.cometapi.com/new-model.

Информацию о ценах моделей в Comet API см. https://api.cometapi.com/pricing.

См. также API Qwen 2.5 Макс

Читать далее

500+ моделей в одном API

Скидка до 20%