Entrada:$0.8/M
Saída:$3.2/M
GLM-5.1 (lançado em abril de 2026), projetado especificamente para tarefas autônomas de longo prazo. Ao contrário dos modelos tradicionais otimizados para interações curtas, o GLM-5.1 se destaca em manter o alinhamento com os objetivos, reduzir o desvio estratégico e entregar resultados em nível de produção ao longo de períodos prolongados — até 8 horas de trabalho autônomo contínuo em uma única tarefa complexa. Ele representa um grande salto na engenharia de agentes, deslocando a avaliação da inteligência de uma única interação para a execução sustentada no mundo real.Contexto:200k
Entrada:$0.96/M
Saída:$3.264/M
GLM-5 Turbo é um novo modelo da Z.ai, projetado para inferência rápida e desempenho robusto em ambientes orientados por agentes, como cenários OpenClaw.Entrada:$0.8/M
Saída:$3.2/M
Want this tightened or tailored for a landing page/README/press? I can adapt it. Here are sharper versions plus what info to add for credibility.
Options
- One‑liner: GLM‑5 is Z.ai’s open-source foundation model for end‑to‑end systems design and long‑horizon agent workflows—built for experts, production‑ready, and competitive with top closed models on large‑scale coding tasks.
- 3 value bullets:
- Agentic planning + iterative self‑correction for multi‑step, repo‑wide changes
- Strong backend reasoning and tool use; ships for production workloads
- Open weights, competitive benchmarks vs. closed leaders on code+agent tasks
- 3‑sentence blurb: GLM‑5 is Z.ai’s flagship open‑source model for complex systems design and long‑horizon agent workflows. Built for expert developers, it pairs advanced planning with deep backend reasoning and iterative self‑correction, enabling full‑system construction—not just code snippets. In benchmarks and real deployments, it delivers production‑grade performance on large programming tasks, rivaling leading closed models.
Make it concrete (replace placeholders and I’ll plug them in)
- Model sizes/context: {N}B params, {K} tokens context, {toolformer/routers?}
- Inference: {tok/s} on A100/H100, {batch size}, {throughput/latency P50/P95}
- Benchmarks: SWE‑bench verified {X}%, HumanEval+ {Y}%, MBPP {Z}%, AgentBench {A}%, Repo‑level tasks {B}% (with eval setup)
- Production: pass@k for PR generation, test coverage deltas, rollback rate, success on multi‑repo tasks
- Ecosystem: supports {tools} (Git, shell, HTTP, DB, code indexers), {frameworks} (LangChain, LlamaIndex), license {Apache‑2.0/MIT}, safety/guardrails
Copy tweaks to consider
- Replace “autonomous execution” with “safe autonomous execution with guardrails (approval gates, sandboxes, timeouts)”
- Avoid vague “rivaling” without numbers; pair every claim with a metric and hardware spec
- Add one concrete example: “Upgraded a 120‑service monorepo from Django 3.2→4.2 in 3.1 hours wall‑clock with 92% tests passing on first run”
Tell me the target (website hero, README, press note, tweet/thread), and any real metrics you can share—I’ll produce the final copy.Contexto:200,000
Entrada:$0.96/M
Saída:$3.84/M
Lançado o mais recente modelo carro-chefe da Zhipu, GLM-4.6: parâmetros totais 355B, parâmetros ativos 32B.
As capacidades centrais gerais superam as do GLM-4.5.
Programação: equipara-se ao Claude Sonnet 4, o melhor da China.
Contexto: ampliado para 200K (originalmente 128K).
Inferência: aprimorada, com suporte a chamadas de ferramentas.
Pesquisa: framework de ferramentas e agentes otimizado.
Escrita: mais alinhada às preferências humanas, ao estilo de escrita e à interpretação de papéis.
Multilíngue: capacidade de tradução aprimorada.Contexto:200K
Entrada:$0.96/M
Saída:$3.84/M
GLM-4.7 é o modelo principal mais recente da Z.AI, com aprimoramentos em duas áreas-chave: capacidades de programação aprimoradas e raciocínio e execução em múltiplas etapas mais estáveis. Ele demonstra melhorias significativas na execução de tarefas complexas de agentes, enquanto oferece experiências conversacionais mais naturais e uma estética de front-end superior.Entrada:$3.2/M
Saída:$12.8/M
Modelo de alto desempenho, forte em inferência, com resposta extremamente rápida, otimizado para cenários que exigem velocidade de inferência ultrarrápida e capacidades lógicas poderosas, proporcionando uma experiência de resposta em nível de milissegundos.Entrada:$0.16/M
Saída:$0.64/M
GLM-4.5-Flash is an artificial intelligence model provided by ZhipuAI.Entrada:$1.6/M
Saída:$6.4/M
Modelo leve, de alto desempenho, com resposta ultrarrápida, que combina perfeitamente as vantagens de custo do Air e as vantagens de velocidade do X, uma escolha ideal para equilibrar desempenho e eficiência.Entrada:$0.16/M
Saída:$1.0672/M
GLM-4.5-Air is an artificial intelligence model provided by ZhipuAI.Entrada:$0.96/M
Saída:$3.84/M
GLM-4.5 is an artificial intelligence model provided by ZhipuAI.