Zhipu AI lança o GLM-4.5: um modelo de código aberto para raciocínio, código e agentes

CometAPI
AnnaJul 28, 2025
Zhipu AI lança o GLM-4.5: um modelo de código aberto para raciocínio, código e agentes

Em 28 de julho de 2025, a startup Zhipu AI, sediada em Pequim, apresentou oficialmente sua série GLM‑4.5 de modelos de linguagem de grande porte de código aberto, marcando seu lançamento mais poderoso até o momento e voltado a aplicações avançadas de agentes inteligentes. O anúncio — feito por meio de um evento online ao vivo após a World Artificial Intelligence Conference (WAIC) — apresentou duas variantes: o GLM‑4.5 em escala completa, com 355 bilhões de parâmetros totais (32 bilhões ativos), e o mais compacto GLM‑4.5‑Air, com 106 bilhões de parâmetros totais (12 bilhões ativos). Ambos os modelos empregam uma arquitetura de raciocínio híbrida de “pensamento” e “não‑pensamento” projetada para equilibrar inferência profunda com resposta rápida, e oferecem uma janela de contexto de 128,000 tokens para casos de uso conversacionais e orientados a tarefas em larga escala.

O lançamento do GLM‑4.5 ocorre em meio a uma corrida doméstica de IA que se intensifica. Segundo a Agência de Notícias Xinhua, desenvolvedores chineses lançaram 1,509 modelos de linguagem de grande porte até julho de 2025, liderando o total global de 3,755 modelos — um claro testemunho da escala e velocidade de expansão do ecossistema de IA da China.

Licenciamento de código aberto do GLM‑4.5

Em uma clara ruptura com paradigmas proprietários fechados, a Z.ai está lançando o GLM‑4.5 sob uma licença de código aberto ao estilo MIT, totalmente auditável, concedendo às empresas total transparência sobre os pesos do modelo e o código de treinamento. As organizações podem implantar o GLM‑4.5 on‑premise, ajustá‑lo em conjuntos de dados proprietários ou integrá‑lo por meio de serviços de inferência auto‑hospedados, evitando assim aprisionamento a fornecedores e estruturas opacas de precificação de API.

A disponibilidade de GLM‑4.5 para tarefas gerais de agentes e de GLM‑4.5‑Air, uma variante leve otimizada para ambientes com menos recursos, assegura um amplo espectro de casos de uso — de implantações em data centers em grande escala a cenários de inferência em dispositivos de borda.

Estratégicamente, a abordagem de código aberto da Zhipu posiciona a empresa em oposição a incumbentes ocidentais de código fechado como a OpenAI. Ao democratizar o acesso a um modelo comparável ao GPT‑4 sob a licença MIT, a Zhipu visa cultivar uma comunidade robusta de desenvolvedores downstream e estabelecer referências técnicas para capacidades de IA orientadas a agentes. Observadores da indústria destacam que esse movimento segue uma tendência mais ampla entre os “Tigres da IA” da China, incluindo Moonshot AI e Step AI, que também abriram o código de grandes modelos para acelerar os ciclos de inovação.

benchmark do GLM‑4.5

Benchmarks de desempenho e análise comparativa

Benchmarks preliminares fornecidos pela Zhipu AI indicam que o GLM‑4.5 alcança uma pontuação agregada de 63.2 em 12 suítes de avaliação padrão do setor — posicionando‑o em terceiro lugar entre modelos de código aberto e proprietários — enquanto o enxuto GLM‑4.5‑Air marca 59.8, equilibrando eficiência com alta precisão. Avaliações internas de codificação demonstram ainda que o GLM‑4.5 supera rivais importantes, garantindo uma taxa de vitória de 53.9 por cento contra o Kimi K2 e uma taxa de sucesso de 80.8 por cento frente ao Qwen3‑Coder em 52 tarefas de programação diversas.

GLM‑4.5

Demonstrações durante o evento ao vivo ressaltaram as capacidades de agente do GLM‑4.5: o modelo realizou autonomamente pesquisas na web — recuperando e sintetizando informações de múltiplas fontes — e interagiu com ambientes simulados de mídias sociais e desenvolvimento para gerar postagens, executar trechos de código e manipular elementos da interface do usuário em tempo real. Usuários interessados podem experimentar imediatamente o modelo em escala completa gratuitamente por meio do portal Qingyan da Zhipu e da plataforma CometAPI, enquanto desenvolvedores podem acessar endpoints de API no serviço BigModel da CometAPI ou baixar os pesos completos do modelo no Hugging Face e no ModelScope sob uma licença MIT.

Eficiência de custo é um pilar da estratégia da Z.ai. Treinado em um corpus de 15 trilhões de tokens, o GLM‑4.5 aproveita caminhos de inferência otimizados para entregar uma taxa de geração de 100–200 tokens por segundo — até oito vezes mais rápido que rivais domésticos comparáveis — a um preço anunciado de apenas $0.11 por milhão de tokens, subcotando modelos como o DeepSeek‑R1 e os lançamentos mais recentes da Alibaba. Sob a permissiva licença MIT, todos os pesos do modelo, código e documentação estão disponíveis gratuitamente via Hugging Face, com o objetivo de promover uma comunidade vibrante de desenvolvedores e pesquisadores em todo o mundo.

“O GLM‑4.5 incorpora nosso compromisso de democratizar o acesso à tecnologia de IA de primeira linha”, disse Zhang Peng, CEO da Z.ai, em entrevista à CNBC. “Ao abrir o código de um modelo que se destaca em raciocínio, programação e funções de agente, capacitamos organizações de qualquer porte a inovar sem as amarras de APIs proprietárias ou custos proibitivos.”

Primeiros passos

A CometAPI é uma plataforma de API unificada que agrega mais de 500 modelos de IA de provedores líderes — como a série GPT da OpenAI, o Gemini do Google, o Claude da Anthropic, Midjourney, Suno e outros — em uma única interface amigável ao desenvolvedor. Ao oferecer autenticação consistente, formatação de requisições e tratamento de respostas, a CometAPI simplifica drasticamente a integração de recursos de IA em seus aplicativos. Esteja você construindo chatbots, geradores de imagens, compositores de música ou pipelines analíticos orientados a dados, a CometAPI permite iterar mais rápido, controlar custos e permanecer agnóstico a fornecedores — enquanto aproveita os avanços mais recentes em todo o ecossistema de IA.

Os desenvolvedores podem acessar a API do GLM‑4.5 por meio da CometAPI, sendo que as versões mais recentes dos modelos Claude listadas são referentes à data de publicação do artigo. Para começar, explore os recursos do modelo no Playground e consulte o guia da API para instruções detalhadas. Antes de acessar, certifique‑se de ter feito login na CometAPI e obtido a chave de API. A CometAPI oferece um preço muito inferior ao preço oficial para ajudar na sua integração.

Acesse Modelos de Ponta com Baixo Custo

Leia Mais