Qwen3.7-Max
Q

Qwen3.7-Max

Entrada:$1.36/M
Saída:$8.16/M
O ponto forte central do Qwen3.7-Max reside na amplitude e profundidade de suas capacidades de agente. Em programação, lida com tudo, desde a prototipagem de front-end até projetos de engenharia complexos com múltiplos arquivos. Para tarefas de escritório e produtividade, possibilita a automação de fluxos de trabalho por meio da integração com MCP e da colaboração multiagente. Em execução autônoma de longo prazo, manteve um raciocínio coerente ao longo de um experimento de otimização de kernel totalmente autônomo de 35 horas, envolvendo mais de 1,000 chamadas de ferramentas — demonstrando de forma convincente sua execução sustentada e estável. Além disso, oferece uma generalização entre frameworks consistentemente robusta, atuando de forma confiável esteja implantado no Claude Code, OpenClaw, Qwen Code ou em outros frameworks.
Qwen3.6-Plus
Q

Qwen3.6-Plus

Entrada:$0.32/M
Saída:$1.92/M
Qwen 3.6-Plus já está disponível, com capacidades aprimoradas para desenvolvimento de código e maior eficiência em reconhecimento e inferência multimodais, tornando a experiência Vibe Coding ainda melhor.
Q

Qwen 3.5 Flash

Q

Qwen 3.5 Flash

Entrada:$0.16/M
Saída:$0.96/M
A Qwen-3.5 Flash Series é uma família de modelos de linguagem de grande porte (LLMs) orientada para produção, desenvolvida pelo Alibaba Group no âmbito da iniciativa Qwen. Ela representa a camada de implantação (hospedada/API) da família mais ampla de modelos Qwen-3.5, otimizada para alta velocidade, processamento de contexto longo e aplicações baseadas em agentes. Em termos simples: Qwen-3.5 Flash = versões dos modelos Qwen-3.5 rápidas, escaláveis, com contexto longo e capazes de utilizar ferramentas, projetadas para uso em produção no mundo real.
qwen3.5-plus
Q

qwen3.5-plus

Entrada:$0.32/M
Saída:$1.92/M
Os modelos Qwen3.5 da série Plus nativos de visão-linguagem são baseados em uma arquitetura híbrida que integra mecanismos de atenção linear com modelos de mistura de especialistas esparsos, obtendo maior eficiência de inferência.
qwen3.5-397b-a17b
Q

qwen3.5-397b-a17b

Entrada:$0.48/M
Saída:$2.88/M
O modelo nativo de visão-linguagem Qwen3.5 series 397B-A17B é baseado em uma arquitetura híbrida que integra um mecanismo de atenção linear com um modelo de mistura esparsa de especialistas, proporcionando maior eficiência de inferência.
qwen3 max
Q

qwen3 max

Entrada:$0.8/M
Saída:$3.2/M
- qwen3-max: o mais recente modelo Qwen3-Max da equipe Alibaba Tongyi Qianwen, posicionado como o pico de desempenho da série. - 🧠 Multimodal e inferência poderosas: Suporta contexto ultralongo (até 128k tokens) e entrada multimodal, destaca-se em inferência complexa, geração de código, tradução e conteúdo criativo. - ⚡️ Melhoria revolucionária: Otimizado de forma significativa em vários indicadores técnicos, maior velocidade de resposta, data de corte de conhecimento até 2025, adequado para aplicações de IA de alta precisão em nível empresarial.
Q

Qwen Image

Q

Qwen Image

Por Solicitação:$0.028
Qwen-Image é um modelo fundacional revolucionário de geração de imagens lançado em 2025 pela equipe Tongyi Qianwen da Alibaba. Com 20 bilhões de parâmetros, ele é baseado na arquitetura MMDiT (Transformer de Difusão Multimodal). O modelo alcançou avanços significativos na renderização de textos complexos e na edição precisa de imagens, demonstrando desempenho excepcional, especialmente na renderização de texto em chinês. Traduzido com o DeepL.com (versão gratuita)
Q

qwen3-vl-32b

Q

qwen3-vl-32b

Entrada:$0.24/M
Saída:$0.96/M
Qwen3-VL-32B é a variante densa de 32 bilhões de parâmetros na família de modelos de visão e linguagem Qwen3 da Alibaba. É um transformador multimodal (visão + linguagem + vídeo) projetado para percepção unificada, raciocínio de longo contexto, OCR robusto e grounding visual, e fluxos de trabalho baseados em agentes e com uso de ferramentas.
Q

qwen3-vl-235b-a22b

Q

qwen3-vl-235b-a22b

Contexto:2M
Entrada:$0.24/M
Saída:$0.96/M
qwen3-vl-235b-a22b é um modelo multimodal que unifica uma geração de texto robusta com compreensão visual para imagens e vídeos. Sua variante Instruct otimiza o seguimento de instruções para tarefas multimodais gerais. Destaca-se na percepção de categorias do mundo real/sintéticas, na ancoragem espacial 2D/3D e na compreensão visual de formato longo, alcançando resultados competitivos em benchmarks multimodais.
Q

qwen3-coder-plus-2025-07-22

Q

qwen3-coder-plus-2025-07-22

Entrada:$0.52/M
Saída:$2.6/M
A versão estável do Qwen3 Coder Plus, lançada em 22 de julho de 2025, oferece maior estabilidade, adequada para implantação em produção.
Q

qwen3-coder-plus

Q

qwen3-coder-plus

Entrada:$0.52/M
Saída:$2.6/M
Q

qwen3-coder-480b-a35b-instruct

Q

qwen3-coder-480b-a35b-instruct

Entrada:$0.24/M
Saída:$0.96/M
Q

qwen3-coder

Q

qwen3-coder

Entrada:$0.24/M
Saída:$0.96/M
Q

qwen3-8b

Q

qwen3-8b

Entrada:$0.04/M
Saída:$0.16/M
Q

qwen3-32b

Q

qwen3-32b

Entrada:$1.6/M
Saída:$6.4/M
Q

qwen3-30b-a3b

Q

qwen3-30b-a3b

Entrada:$0.12/M
Saída:$0.48/M
Possui 3 bilhões de parâmetros, equilibrando desempenho e requisitos de recursos, adequado para aplicações de nível empresarial. - Este modelo pode empregar MoE ou outras arquiteturas otimizadas, sendo adequado para cenários que exigem processamento eficiente de tarefas complexas, como atendimento ao cliente inteligente e geração de conteúdo.
Q

qwen3-235b-a22b

Q

qwen3-235b-a22b

Entrada:$0.336/M
Saída:$1.344/M
Qwen3-235B-A22B is the flagship model of the Qwen3 series, with 23.5 billion parameters, using a Mixture of Experts (MoE) architecture. - Particularly suitable for complex tasks requiring high-performance Inference, such as coding, mathematics, and Multimodal applications.
Q

qwen3-14b

Q

qwen3-14b

Entrada:$0.8/M
Saída:$3.2/M
Q

qwen-image-2

Q

qwen-image-2

Em breve
Entrada:$60/M
Saída:$240/M
qwen-image-2 em breve
Q

Qwen3.6-Max-Preview

Q

Qwen3.6-Max-Preview

Em breve
Entrada:$1.664/M
Saída:$9.984/M
Qwen3.6-Max-Preview Compared with Qwen3.6-Plus, this preview version brings stronger world knowledge and instruction compliance capabilities, as well as significantly improved agent programming performance on multiple benchmarks