A API Qwen 3 é uma interface compatível com OpenAI desenvolvida pela Alibaba Cloud, permitindo que desenvolvedores integrem modelos avançados de linguagem Qwen 3 — disponíveis em arquiteturas densas e de mistura de especialistas (MoE) — em seus aplicativos para tarefas como geração de texto, raciocínio e suporte multilíngue.
Visão geral do Qwen 3
Principais funcionalidades
- Capacidades de raciocínio híbrido: O Qwen 3 integra funções convencionais de IA e raciocínio dinâmico avançado, melhorando a adaptabilidade e a eficiência para desenvolvedores.
- Global: A família de modelos inclui modelos densos (parâmetros de 0.6B a 32B) e esparsos (30B com parâmetros ativados de 3B, 235B com parâmetros ativados de 22B), atendendo a uma ampla gama de aplicações.
- Janela de contexto estendida: A maioria dos modelos Qwen 3 oferece suporte a uma janela de contexto de token de 128K, facilitando o processamento de documentos longos e tarefas complexas.
- Suporte multimodal:Os modelos Qwen 3 são capazes de processar entradas de texto, imagens, áudio e vídeo, tornando-os adequados para diversas aplicações, incluindo interações de voz em tempo real e análise de dados visuais.
- Acessibilidade de código aberto: Todos os modelos Qwen 3 são licenciados sob a licença Apache 2.0 e estão disponíveis em plataformas como Hugging Face e ModelScope.
Arquitetura Técnica
Variantes do modelo
O Qwen 3 abrange uma variedade de modelos para atender a diferentes necessidades computacionais:
- Modelos Densos: Disponível em tamanhos de parâmetros 0.6B, 1.7B, 4B, 8B, 14B e 32B.
- Modelos Esparsos: Inclui um modelo 30B com parâmetros ativados 3B e um modelo 235B com parâmetros ativados 22B.
A arquitetura permite uma implantação eficiente em diferentes configurações de hardware, de dispositivos móveis a servidores de alto desempenho.
Compreensão Contextual
Com uma janela de contexto de 128K tokens, os modelos Qwen 3 podem manter a coerência em interações prolongadas, tornando-os adequados para tarefas que exigem profundo entendimento contextual, como geração de conteúdo longo e resolução de problemas complexos.
Evolução da série Qwen
De Qwen para Qwen 3
A série Qwen passou por uma evolução significativa:
- Qwen: Introduzido como modelos básicos de linguagem pré-treinados, demonstrando desempenho superior em diversas tarefas.
- Qwen-Chat: Modelos de bate-papo aprimorados com técnicas de alinhamento humano, demonstrando recursos avançados de planejamento e uso de ferramentas.
- Qwen2: Expandimos o conjunto de modelos com modelos de linguagem ajustados por instruções, com intervalos de parâmetros de 0.5 a 72 bilhões. O modelo principal, Qwen2-72B, apresentou desempenho notável em diversos benchmarks.
- Qwen2.5: Foram introduzidos modelos como o Qwen2.5-Omni, capaz de processar texto, imagens, vídeos e áudio, além de gerar saídas de texto e áudio.
- Qwen 3: A mais recente iteração, incorporando recursos de raciocínio híbrido e eficiência aprimorada, marcando um avanço significativo na série.
Desempenho de referência
Com desempenho significativamente superior ao de modelos anteriores como QwQ e Qwen2.5, o Qwen3 oferece recursos superiores de matemática, codificação, raciocínio lógico, escrita criativa e diálogo interativo. A variante Qwen3-30B-A3B inclui 30.5 bilhões de parâmetros (3.3 bilhões ativados), 48 camadas, 128 especialistas (8 ativados por tarefa) e suporta até 131 mil contextos de token com YaRN, estabelecendo um novo padrão entre os modelos de código aberto.
- AIME25: Qwen3 marcou 81.5 pontos, estabelecendo um novo recorde de código aberto.
- LiveCodeBench: Qwen3 marcou mais de 70 pontos, ainda melhor que Grok3.
- ArenaHard: Qwen3 superou OpenAl-o1 e DeepSeek-FR1 com 95.6 pontos.
Exemplo de Código
Os desenvolvedores podem interagir com os modelos Qwen 3 usando o seguinte trecho de código Python:
from transformers import AutoTokenizer, AutoModelForCausalLM
# Load tokenizer and model
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-3-14B")
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-3-14B")
# Encode input prompt
input_text = "Explain the significance of hybrid reasoning in AI models."
input_ids = tokenizer.encode(input_text, return_tensors="pt")
# Generate response
output = model.generate(input_ids, max_length=200)
response = tokenizer.decode(output, skip_special_tokens=True)
print(response)
Este exemplo demonstra como carregar um modelo Qwen 3 e gerar uma resposta a um determinado prompt usando a biblioteca Hugging Face Transformers.
Conclusão
O Qwen 3 representa um marco significativo no desenvolvimento da IA da Alibaba, oferecendo recursos aprimorados de raciocínio, escalabilidade e suporte multimodal. Sua disponibilidade de código aberto sob a licença Apache 2.0 incentiva a ampla adoção e a inovação contínua na comunidade de IA. À medida que o cenário da IA continua a evoluir, o Qwen 3 posiciona a Alibaba como um player formidável nos mercados nacional e global.
Como ligar Qwen 3 API da CometAPI
Qwen 3 Preços da API no CometAPI:
| Versão do modelo | Qwen3 235B A22B | Qwen: Qwen3 30B A3B | Qwen3 8B |
| Preço no CometAPI | Tokens de entrada: $ 1.6 / M tokens | Tokens de entrada: $0.4/ M tokens | Tokens de entrada: $ 0.32 / M tokens |
| Tokens de saída: $ 4.8 / M tokens | Tokens de saída: $ 1.2 / M tokens | Tokens de saída: $ 0.96 / M tokens | |
| nome do modelo | qwen3-235b-a22b | qwen3-30b-a3b | qwen3-8b |
| ilustrar | Este é o modelo principal da série Qwen3, com 235 bilhões de parâmetros, utilizando uma arquitetura Mixture of Experts (MoE). | qwen3-30b-a3b: Com 30 bilhões de parâmetros, ele equilibra o desempenho e os requisitos de recursos, adequado para aplicações de nível empresarial. | Um modelo leve com 800 milhões de parâmetros, projetado especificamente para ambientes com recursos limitados (como dispositivos móveis ou servidores de baixa configuração). |
Etapas Necessárias
- Faça o login no cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro
- Obtenha a chave de API da credencial de acesso da interface. Clique em "Adicionar Token" no token da API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.
- Obtenha a URL deste site: https://api.cometapi.com/
Métodos de uso
- Selecione a opção "
qwen3-235b-a22b""qwen3-30b-a3b""qwen3-8b” endpoint para enviar a solicitação de API e definir o corpo da solicitação. O método e o corpo da solicitação são obtidos da documentação da API do nosso site. Nosso site também oferece o teste Apifox para sua conveniência. - Substituir com sua chave CometAPI real da sua conta.
- Insira sua pergunta ou solicitação no campo de conteúdo — é a isso que o modelo responderá.
- . Processe a resposta da API para obter a resposta gerada.
Para obter informações sobre o modelo lançado na API Comet, consulte https://api.cometapi.com/new-model.
Para obter informações sobre o preço do modelo na API Comet, consulte https://api.cometapi.com/pricing.
Veja também Qwen 2.5 API Máxima



