Modelos Aliyun - CometAPI

GPT-5.6 Series is now live on CometAPI →

Happy Horse 1.1

Happy Horse 1.1

Por Segundo:$0.112

HappyHorse 1.1 é um modelo multimodal de geração de vídeo projetado para criação de conteúdo profissional, publicidade, curtas-metragens, produção para redes sociais e narrativa. Ele amplia as capacidades do HappyHorse 1.0 — que ganhou atenção significativa após se classificar entre os primeiros em avaliações independentes de geração de vídeo — com maior coerência entre cenas e fidelidade visual aprimorada.

Happy Horse 1.0

Happy Horse 1.0

Por Segundo:$0.112

Happy Horse 1.0 — um modelo de geração audiovisual de alta qualidade que oferece suporte à criação de texto-para-vídeo e imagem-para-vídeo. Ele pode gerar imagens, áudio e movimentos labiais sincronizados, tornando-o adequado para curtas-metragens, peças publicitárias e apresentações de produtos.

Qwen3.7 Plus

Qwen3.7 Plus

Entrada:$0.32/M

Qwen3.7 Plus é um modelo de linguagem de grande porte e alto desempenho desenvolvido pela Alibaba Cloud. Ele suporta compreensão de contexto longo de até 128K tokens, chamadas de função e tarefas multilíngues. Projetado para cenários de raciocínio complexo, programação e seguimento de instruções.

Qwen3.7-Max

Qwen3.7-Max

Entrada:$1.36/M

O ponto forte central do Qwen3.7-Max reside na amplitude e profundidade de suas capacidades de agente. Em programação, lida com tudo, desde a prototipagem de front-end até projetos de engenharia complexos com múltiplos arquivos. Para tarefas de escritório e produtividade, possibilita a automação de fluxos de trabalho por meio da integração com MCP e da colaboração multiagente. Em execução autônoma de longo prazo, manteve um raciocínio coerente ao longo de um experimento de otimização de kernel totalmente autônomo de 35 horas, envolvendo mais de 1,000 chamadas de ferramentas — demonstrando de forma convincente sua execução sustentada e estável. Além disso, oferece uma generalização entre frameworks consistentemente robusta, atuando de forma confiável esteja implantado no Claude Code, OpenClaw, Qwen Code ou em outros frameworks.

Wan2.7

Wan2.7

Por Segundo:$0.08

Wan2.7 é um modelo de geração de vídeo projetado para síntese visual de alta qualidade e consistência de movimento aprimorada. É adequado para criação de conteúdo cinematográfico e fluxos de trabalho profissionais de produção de vídeo.

Wan2.6

Wan2.6

Por Segundo:$0.08

Wan2.6 é um modelo de geração de vídeo projetado para síntese de vídeo estável e eficiente. Ele fornece qualidade visual confiável e geração de movimento suave para tarefas gerais de criação de vídeo.

Qwen3.6-Plus

Qwen3.6-Plus

Entrada:$0.32/M

Qwen 3.6-Plus já está disponível, com capacidades aprimoradas para desenvolvimento de código e maior eficiência em reconhecimento e inferência multimodais, tornando a experiência Vibe Coding ainda melhor.

Qwen 3.5 Flash

Qwen 3.5 Flash

Entrada:$0.16/M

A Qwen-3.5 Flash Series é uma família de modelos de linguagem de grande porte (LLMs) orientada para produção, desenvolvida pelo Alibaba Group no âmbito da iniciativa Qwen. Ela representa a camada de implantação (hospedada/API) da família mais ampla de modelos Qwen-3.5, otimizada para alta velocidade, processamento de contexto longo e aplicações baseadas em agentes. Em termos simples: Qwen-3.5 Flash = versões dos modelos Qwen-3.5 rápidas, escaláveis, com contexto longo e capazes de utilizar ferramentas, projetadas para uso em produção no mundo real.

qwen3.5-plus

qwen3.5-plus

Entrada:$0.32/M

Os modelos Qwen3.5 da série Plus nativos de visão-linguagem são baseados em uma arquitetura híbrida que integra mecanismos de atenção linear com modelos de mistura de especialistas esparsos, obtendo maior eficiência de inferência.

qwen3.5-397b-a17b

qwen3.5-397b-a17b

Entrada:$0.48/M

O modelo nativo de visão-linguagem Qwen3.5 series 397B-A17B é baseado em uma arquitetura híbrida que integra um mecanismo de atenção linear com um modelo de mistura esparsa de especialistas, proporcionando maior eficiência de inferência.

qwen3 max

qwen3 max

- qwen3-max: o mais recente modelo Qwen3-Max da equipe Alibaba Tongyi Qianwen, posicionado como o pico de desempenho da série. - 🧠 Multimodal e inferência poderosas: Suporta contexto ultralongo (até 128k tokens) e entrada multimodal, destaca-se em inferência complexa, geração de código, tradução e conteúdo criativo. - ⚡️ Melhoria revolucionária: Otimizado de forma significativa em vários indicadores técnicos, maior velocidade de resposta, data de corte de conhecimento até 2025, adequado para aplicações de IA de alta precisão em nível empresarial.

Qwen Image

Qwen Image

Por Solicitação:$0.028

Qwen-Image é um modelo fundacional revolucionário de geração de imagens lançado em 2025 pela equipe Tongyi Qianwen da Alibaba. Com 20 bilhões de parâmetros, ele é baseado na arquitetura MMDiT (Transformer de Difusão Multimodal). O modelo alcançou avanços significativos na renderização de textos complexos e na edição precisa de imagens, demonstrando desempenho excepcional, especialmente na renderização de texto em chinês. Traduzido com o DeepL.com (versão gratuita)

qwen-image-2

qwen-image-2

qwen-image-2 em breve

qwen3-vl-30b-a3b

qwen3-vl-30b-a3b

Entrada:$0.12/M

Qwen3-VL-30B-A3B é um modelo de IA multimodal de ponta da família Qwen3 AI, desenvolvido pela equipe Qwen da Alibaba. Foi projetado para unificar o entendimento de linguagem e a compreensão visual — incluindo texto, imagens e vídeo — em um único modelo base.

qwen3-vl-32b

qwen3-vl-32b

Entrada:$0.24/M

Qwen3-VL-32B é a variante densa de 32 bilhões de parâmetros na família de modelos de visão e linguagem Qwen3 da Alibaba. É um transformador multimodal (visão + linguagem + vídeo) projetado para percepção unificada, raciocínio de longo contexto, OCR robusto e grounding visual, e fluxos de trabalho baseados em agentes e com uso de ferramentas.

qwen3-vl-235b-a22b

qwen3-vl-235b-a22b

Entrada:$0.24/M

qwen3-vl-235b-a22b é um modelo multimodal que unifica uma geração de texto robusta com compreensão visual para imagens e vídeos. Sua variante Instruct otimiza o seguimento de instruções para tarefas multimodais gerais. Destaca-se na percepção de categorias do mundo real/sintéticas, na ancoragem espacial 2D/3D e na compreensão visual de formato longo, alcançando resultados competitivos em benchmarks multimodais.

qwen3-30b-a3b

qwen3-30b-a3b

Entrada:$0.12/M

Possui 3 bilhões de parâmetros, equilibrando desempenho e requisitos de recursos, adequado para aplicações de nível empresarial. - Este modelo pode empregar MoE ou outras arquiteturas otimizadas, sendo adequado para cenários que exigem processamento eficiente de tarefas complexas, como atendimento ao cliente inteligente e geração de conteúdo.

qwen3-coder-plus

qwen3-coder-plus

Entrada:$0.52/M

qwen3-coder-480b-a35b-instruct

qwen3-coder-480b-a35b-instruct

Entrada:$0.24/M

qwen3-coder

qwen3-coder

Entrada:$0.24/M

CometAPI’s qwen3-coder is an affordable, OpenAI-compatible coding model API for Qwen3 Coder, optimized for code generation, debugging, and repository-level engineering workflows with ~20% lower pricing.

qwen3-235b-a22b

qwen3-235b-a22b

Entrada:$0.336/M

Saída:$1.344/M

Qwen3-235B-A22B is the flagship model of the Qwen3 series, with 23.5 billion parameters, using a Mixture of Experts (MoE) architecture. - Particularly suitable for complex tasks requiring high-performance Inference, such as coding, mathematics, and Multimodal applications.

Qwen3.6-Max-Preview

Qwen3.6-Max-Preview

Entrada:$1.664/M

Saída:$9.984/M

Qwen3.6-Max-Preview Compared with Qwen3.6-Plus, this preview version brings stronger world knowledge and instruction compliance capabilities, as well as significantly improved agent programming performance on multiple benchmarks