Qwen 3 API — это совместимый с OpenAI интерфейс, разработанный Alibaba Cloud, позволяющий разработчикам интегрировать расширенные большие языковые модели Qwen 3, доступные как в плотной, так и в смешанной (MoE) архитектуре, в свои приложения для таких задач, как генерация текста, рассуждения и многоязыковая поддержка.
Обзор Qwen 3
Главные преимущества
- Возможности гибридного мышления: Qwen 3 объединяет как традиционные функции искусственного интеллекта, так и расширенные динамические рассуждения, повышая адаптивность и эффективность для разработчиков.
- Масштабируемость: Семейство моделей включает как плотные (от 0.6 до 32 Б параметров), так и разреженные модели (30 Б с 3 Б активированными параметрами, 235 Б с 22 Б активированными параметрами), что позволяет использовать их в широком спектре приложений.
- Окно расширенного контекста: Большинство моделей Qwen 3 поддерживают окно контекста токенов размером 128 КБ, что упрощает обработку длинных документов и сложных задач.
- Мультимодальная поддержка: Модели Qwen 3 способны обрабатывать текст, изображения, аудио- и видеоданные, что делает их пригодными для различных приложений, включая голосовое взаимодействие в реальном времени и визуальный анализ данных.
- Доступность открытого исходного кода: Все модели Qwen 3 лицензированы по лицензии Apache 2.0 и доступны на таких платформах, как Hugging Face и ModelScope.
Техническая Архитектура
Варианты модели
Qwen 3 охватывает ряд моделей для решения различных вычислительных задач:
- Плотные модели: Доступны размеры 0.6B, 1.7B, 4B, 8B, 14B и 32B.
- Разреженные модели: Включите модель 30B с активированными параметрами 3B и модель 235B с активированными параметрами 22B.
Архитектура обеспечивает эффективное развертывание на различных аппаратных конфигурациях: от мобильных устройств до высокопроизводительных серверов.
Контекстное понимание
Благодаря контекстному окну размером 128 3 токенов модели Qwen XNUMX могут поддерживать согласованность в ходе расширенных взаимодействий, что делает их подходящими для задач, требующих глубокого контекстного понимания, таких как генерация развернутого контента и решение сложных проблем.
Эволюция серии Qwen
От Qwen до Qwen 3
Серия Qwen претерпела значительную эволюцию:
- Qwen: Представлены как базовые предварительно обученные языковые модели, демонстрирующие превосходную производительность при выполнении различных задач.
- Квен-Чат: Модели чата, настроенные с использованием методов выравнивания человеком, демонстрирующие расширенные возможности использования инструментов и планирования.
- Квен2: Расширен набор моделей с помощью моделей языка, настроенных на инструкции, с диапазонами параметров от 0.5 до 72 млрд. Флагманская модель Qwen2-72B продемонстрировала замечательную производительность в различных тестах.
- Квен2.5: Представлены такие модели, как Qwen2.5-Omni, способные обрабатывать текст, изображения, видео и аудио, а также генерировать как текстовые, так и аудиовыходы.
- Квен 3: Последняя версия, включающая возможности гибридного мышления и повышенную эффективность, знаменует собой значительный прогресс в серии.
Тестовая производительность
Значительно превосходя предыдущие модели, такие как QwQ и Qwen2.5, Qwen3 обеспечивает превосходные возможности математики, кодирования, здравого смысла, творческого письма и интерактивного диалога. Вариант Qwen3-30B-A3B включает 30.5 млрд параметров (3.3 млрд активированных), 48 слоев, 128 экспертов (8 активированных на задачу) и поддерживает до 131 тыс. контекстов токенов с YaRN, устанавливая новый стандарт среди моделей с открытым исходным кодом.
- AIME25: Qwen3 набрал 81.5 балла, установив новый рекорд для ПО с открытым исходным кодом.
- LiveCodeBench: Qwen3 набрал более 70 очков, что даже лучше, чем Grok3.
- АренаХард: Qwen3 превзошел OpenAl-o1 и DeepSeek-FR1, набрав 95.6 очков.
Пример кода
Разработчики могут взаимодействовать с моделями Qwen 3, используя следующий фрагмент кода Python:
from transformers import AutoTokenizer, AutoModelForCausalLM
# Load tokenizer and model
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-3-14B")
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-3-14B")
# Encode input prompt
input_text = "Explain the significance of hybrid reasoning in AI models."
input_ids = tokenizer.encode(input_text, return_tensors="pt")
# Generate response
output = model.generate(input_ids, max_length=200)
response = tokenizer.decode(output, skip_special_tokens=True)
print(response)
В этом примере показано, как загрузить модель Qwen 3 и сгенерировать ответ на заданный запрос с помощью библиотеки Hugging Face Transformers.
Заключение
Qwen 3 представляет собой значительную веху в развитии ИИ Alibaba, предлагая улучшенные возможности рассуждения, масштабируемость и мультимодальную поддержку. Его доступность с открытым исходным кодом по лицензии Apache 2.0 поощряет широкое внедрение и дальнейшие инновации в сообществе ИИ. Поскольку ландшафт ИИ продолжает развиваться, Qwen 3 позиционирует Alibaba как грозного игрока как на внутренней, так и на глобальной арене.
Как позвонить Qwen 3 API от CometAPI
Qwen 3 Цены на API в CometAPI:
| Версия модели | Qwen3 235B A22B | Qwen: Qwen3 30B A3B | Qwen3 8B |
| Цена в CometAPI | Входные токены: 1.6 долл. США / млн токенов | Входные токены: $0.4/ млн токенов | Входные токены: 0.32 долл. США / млн токенов |
| Выходные токены: $4.8 / млн токенов | Выходные токены: $1.2 / млн токенов | Выходные токены: $0.96 / млн токенов | |
| название модели | qwen3-235b-a22b | qwen3-30b-a3b | qwen3-8b |
| иллюстрировать | Это флагманская модель серии Qwen3 с 235 миллиардами параметров, использующая архитектуру Mixture of Experts (MoE). | qwen3-30b-a3b: Благодаря 30 миллиардам параметров он обеспечивает баланс между производительностью и требованиями к ресурсам, подходит для приложений корпоративного уровня. | Облегченная модель с 800 миллионами параметров, разработанная специально для сред с ограниченными ресурсами (например, мобильных устройств или серверов с низкой конфигурацией). |
Необходимые шаги
- Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
- Получите ключ API-интерфейса для доступа к учетным данным. Нажмите «Добавить токен» в API-токене в персональном центре, получите ключ токена: sk-xxxxx и отправьте.
- Получите URL этого сайта: https://api.cometapi.com/
Методы использования
- Выберите "
qwen3-235b-a22b""qwen3-30b-a3b""qwen3-8b” конечная точка для отправки запроса API и установки тела запроса. Метод запроса и тело запроса получены из нашего веб-сайта API doc. Наш веб-сайт также предоставляет тест Apifox для вашего удобства. - Заменять с вашим реальным ключом CometAPI из вашей учетной записи.
- Введите свой вопрос или запрос в поле «Контент» — на него ответит модель.
- . Обработайте ответ API, чтобы получить сгенерированный ответ.
Информацию о моделях, запущенных в Comet API, см. https://api.cometapi.com/new-model.
Информацию о ценах моделей в Comet API см. https://api.cometapi.com/pricing.
См. также API Qwen 2.5 Макс
