API Qwen 3

CometAPI
AnnaApr 29, 2025
API Qwen 3

A API Qwen 3 é uma interface compatível com OpenAI desenvolvida pela Alibaba Cloud, permitindo que desenvolvedores integrem modelos avançados de linguagem Qwen 3 — disponíveis em arquiteturas densas e de mistura de especialistas (MoE) — em seus aplicativos para tarefas como geração de texto, raciocínio e suporte multilíngue.


Visão geral do Qwen 3

Principais funcionalidades

  • Capacidades de raciocínio híbrido: O Qwen 3 integra funções convencionais de IA e raciocínio dinâmico avançado, melhorando a adaptabilidade e a eficiência para desenvolvedores.
  • Global: A família de modelos inclui modelos densos (parâmetros de 0.6B a 32B) e esparsos (30B com parâmetros ativados de 3B, 235B com parâmetros ativados de 22B), atendendo a uma ampla gama de aplicações.
  • Janela de contexto estendida: A maioria dos modelos Qwen 3 oferece suporte a uma janela de contexto de token de 128K, facilitando o processamento de documentos longos e tarefas complexas.
  • Suporte multimodal:Os modelos Qwen 3 são capazes de processar entradas de texto, imagens, áudio e vídeo, tornando-os adequados para diversas aplicações, incluindo interações de voz em tempo real e análise de dados visuais.
  • Acessibilidade de código aberto: Todos os modelos Qwen 3 são licenciados sob a licença Apache 2.0 e estão disponíveis em plataformas como Hugging Face e ModelScope.

Arquitetura Técnica

Variantes do modelo

O Qwen 3 abrange uma variedade de modelos para atender a diferentes necessidades computacionais:

  • Modelos Densos: Disponível em tamanhos de parâmetros 0.6B, 1.7B, 4B, 8B, 14B e 32B.
  • Modelos Esparsos: Inclui um modelo 30B com parâmetros ativados 3B e um modelo 235B com parâmetros ativados 22B.

A arquitetura permite uma implantação eficiente em diferentes configurações de hardware, de dispositivos móveis a servidores de alto desempenho.

Compreensão Contextual

Com uma janela de contexto de 128K tokens, os modelos Qwen 3 podem manter a coerência em interações prolongadas, tornando-os adequados para tarefas que exigem profundo entendimento contextual, como geração de conteúdo longo e resolução de problemas complexos.

Evolução da série Qwen

De Qwen para Qwen 3

A série Qwen passou por uma evolução significativa:

  • Qwen: Introduzido como modelos básicos de linguagem pré-treinados, demonstrando desempenho superior em diversas tarefas.
  • Qwen-Chat: Modelos de bate-papo aprimorados com técnicas de alinhamento humano, demonstrando recursos avançados de planejamento e uso de ferramentas.
  • Qwen2: Expandimos o conjunto de modelos com modelos de linguagem ajustados por instruções, com intervalos de parâmetros de 0.5 a 72 bilhões. O modelo principal, Qwen2-72B, apresentou desempenho notável em diversos benchmarks.
  • Qwen2.5: Foram introduzidos modelos como o Qwen2.5-Omni, capaz de processar texto, imagens, vídeos e áudio, além de gerar saídas de texto e áudio.
  • Qwen 3: A mais recente iteração, incorporando recursos de raciocínio híbrido e eficiência aprimorada, marcando um avanço significativo na série.

Desempenho de referência

Com desempenho significativamente superior ao de modelos anteriores como QwQ e Qwen2.5, o Qwen3 oferece recursos superiores de matemática, codificação, raciocínio lógico, escrita criativa e diálogo interativo. A variante Qwen3-30B-A3B inclui 30.5 bilhões de parâmetros (3.3 bilhões ativados), 48 camadas, 128 especialistas (8 ativados por tarefa) e suporta até 131 mil contextos de token com YaRN, estabelecendo um novo padrão entre os modelos de código aberto.

  • AIME25: Qwen3 marcou 81.5 pontos, estabelecendo um novo recorde de código aberto.
  • LiveCodeBench: Qwen3 marcou mais de 70 pontos, ainda melhor que Grok3.
  • ArenaHard: Qwen3 superou OpenAl-o1 e DeepSeek-FR1 com 95.6 pontos.

Exemplo de Código

Os desenvolvedores podem interagir com os modelos Qwen 3 usando o seguinte trecho de código Python:

from transformers import AutoTokenizer, AutoModelForCausalLM

# Load tokenizer and model

tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-3-14B")
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-3-14B")

# Encode input prompt

input_text = "Explain the significance of hybrid reasoning in AI models."
input_ids = tokenizer.encode(input_text, return_tensors="pt")

# Generate response

output = model.generate(input_ids, max_length=200)
response = tokenizer.decode(output, skip_special_tokens=True)

print(response)

Este exemplo demonstra como carregar um modelo Qwen 3 e gerar uma resposta a um determinado prompt usando a biblioteca Hugging Face Transformers.

Conclusão

O Qwen 3 representa um marco significativo no desenvolvimento da IA ​​da Alibaba, oferecendo recursos aprimorados de raciocínio, escalabilidade e suporte multimodal. Sua disponibilidade de código aberto sob a licença Apache 2.0 incentiva a ampla adoção e a inovação contínua na comunidade de IA. À medida que o cenário da IA ​​continua a evoluir, o Qwen 3 posiciona a Alibaba como um player formidável nos mercados nacional e global.


Como ligar Qwen 3 API da CometAPI

Qwen 3 Preços da API no CometAPI:

Versão do modeloQwen3 235B A22BQwen: Qwen3 30B A3BQwen3 8B
Preço no CometAPITokens de entrada: $ 1.6 / M tokensTokens de entrada: $0.4/ M tokensTokens de entrada: $ 0.32 / M tokens
Tokens de saída: $ 4.8 / M tokensTokens de saída: $ 1.2 / M tokensTokens de saída: $ 0.96 / M tokens
nome do modeloqwen3-235b-a22bqwen3-30b-a3bqwen3-8b
ilustrarEste é o modelo principal da série Qwen3, com 235 bilhões de parâmetros, utilizando uma arquitetura Mixture of Experts (MoE).qwen3-30b-a3b: Com 30 bilhões de parâmetros, ele equilibra o desempenho e os requisitos de recursos, adequado para aplicações de nível empresarial.Um modelo leve com 800 milhões de parâmetros, projetado especificamente para ambientes com recursos limitados (como dispositivos móveis ou servidores de baixa configuração).

Etapas Necessárias

  • Faça o login no cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro
  • Obtenha a chave de API da credencial de acesso da interface. Clique em "Adicionar Token" no token da API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.
  • Obtenha a URL deste site: https://api.cometapi.com/

Métodos de uso

  1. Selecione a opção "qwen3-235b-a22b""qwen3-30b-a3b""qwen3-8b” endpoint para enviar a solicitação de API e definir o corpo da solicitação. O método e o corpo da solicitação são obtidos da documentação da API do nosso site. Nosso site também oferece o teste Apifox para sua conveniência.
  2. Substituir com sua chave CometAPI real da sua conta.
  3. Insira sua pergunta ou solicitação no campo de conteúdo — é a isso que o modelo responderá.
  4. . Processe a resposta da API para obter a resposta gerada.

Para obter informações sobre o modelo lançado na API Comet, consulte https://api.cometapi.com/new-model.

Para obter informações sobre o preço do modelo na API Comet, consulte https://api.cometapi.com/pricing.

Veja também Qwen 2.5 API Máxima

SHARE THIS BLOG

500+ Modelos em Uma API

Até 20% de Desconto