A API GLM‑4.5 da Zhipu é um serviço RESTful unificado nas plataformas Z.ai (global) e Zhipu AI Open (China continental) que expõe o modelo GLM‑355 híbrido-especializado de 4.5 bilhões de parâmetros — capaz de raciocínio complexo, codificação e tarefas de agente — com opções configuráveis (por exemplo, temperatura, tokens máximos, streaming).
Características básicas
O GLM‑4.5 foi projetado como um modelo de agente unificado, Integrando raciocínio, codificação e tomada de decisão autônoma capacidades dentro de uma única arquitetura. Ele suporta nativamente dois modos operacionais:pensando para raciocínio complexo e uso de ferramentas, e não-pensante para respostas rápidas e sob demanda, tornando-o ideal para aplicações versáteis agente workflows.
Detalhes Técnicos
- Escala de Parâmetros:O carro-chefe GLM‑4.5 compreende 355 bilhões parâmetros totais com 32 bilhões de ativos parâmetros.
- Raciocínio Híbrido: O GLM‑4.5 emprega um quantização FP8 híbrida estratégia para otimizar eficiência de inferência sem sacrificar substancialmente a precisão.
- Eficiência do parâmetro: Usos 32 B parâmetros ativos de 355 B para minimizar a carga de hardware durante a inferência.
- Otimização de Camadas: Componentes podados e redistribuídos em camadas mais profundas, melhorando raciocínio lógico sem aumentar o tamanho do modelo.
Fluxo de Trabalho de Treinamento
Treinamento em vários estágios:
- Pré-treinamento básico em ~15 trilhões de tokens.
- Raciocínio Ajuste fino em >7 trilhões de tokens selecionados para aprimorar a tomada de decisões e a síntese de código.
Desempenho de referência
Em uma suíte de 12 benchmarks padrão da indústria cobertura agente, raciocínio e codificação tarefas, o GLM‑4.5 alcançou uma pontuação geral de 63.2classificação terceiro globalmente por trás de titãs proprietários como GPT-4 e Grok 4. Os destaques incluem:
| referência | Pontuação GLM‑4.5 | Comparação de proprietários de topo |
|---|---|---|
| BrowseComp (web) | 26.4% | Claude 4 Opus: 18.8% |
| MATEMÁTICA 500 | 98.2% | GPT‑4 Turbo |
| AIME24 | 91.0% | Claude 4 Soneto |
| GPQA | 79.1% | Gêmeos 2.5 Pro |
Em um conjunto de 12 testes competitivos — abrangendo codificação, raciocínio e agente benchmarks—classificações GLM‑4.5 terceiro geral, igualando ou superando modelos proprietários líderes como Claude 4 Sonnet e Gemini 2.5 Pro em tarefas como Banco SWE e AIME24 .

Versões do modelo
O Família GLM‑4.5 inclui diversas variantes especializadas acessíveis via API:
- GLM‑4.5 (355 B parâmetros totais; 32 B ativos)
- GLM‑4.5‑Ar (106 B no total; leve, inferência mais rápida)
- GLM‑4.5‑X, GLM‑4.5‑AirX (inferência ultrarrápida)
- GLM‑4.5‑Flash (grátis, otimizado para codificação e raciocínio)
Como ligar GLM‑4.5 API da CometAPI
GLM‑4.5 Preços da API da série CometAPI, 20% de desconto sobre o preço oficial:
| Modelo | introduzir | Preço |
glm-4.5 | Nosso modelo de raciocínio mais poderoso, com 355 bilhões de parâmetros | Tokens de entrada $ 0.48 Tokens de saída $ 1.92 |
glm-4.5-air | Desempenho leve e robusto, com boa relação custo-benefício | Tokens de entrada $ 0.16 Tokens de saída $ 1.07 |
glm-4.5-x | Alto desempenho, raciocínio forte, resposta ultrarrápida | Tokens de entrada $ 1.60 Tokens de saída $ 6.40 |
glm-4.5-airx | Desempenho leve e forte, resposta ultrarrápida | Tokens de entrada $ 0.02 Tokens de saída $ 0.06 |
glm-4.5-flash | Desempenho forte, excelente para codificação de raciocínio e agentes | Tokens de entrada $ 3.20 Tokens de saída $ 12.80 |
Etapas Necessárias
- Faça o login no cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro
- Obtenha a chave de API da credencial de acesso da interface. Clique em "Adicionar Token" no token da API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.
- Obtenha a URL deste site: https://api.cometapi.com/
Use o método
- Selecione a opção "
glm-4.5” endpoint para enviar a solicitação de API e definir o corpo da solicitação. O método e o corpo da solicitação são obtidos da documentação da API do nosso site. Nosso site também oferece o teste Apifox para sua conveniência. - Substituir com sua chave CometAPI real da sua conta.
- Insira sua pergunta ou solicitação no campo de conteúdo — é a isso que o modelo responderá.
- . Processe a resposta da API para obter a resposta gerada.
A CometAPI fornece uma API REST totalmente compatível — para uma migração perfeita. Detalhes importantes para Doc API:
- URL base: https://api.cometapi.com/v1/chat/completions
- Nomes de modelo: "
glm-4.5" - Autenticação:
Bearer YOUR_CometAPI_API_KEYcabeçalho - Tipo de conteúdo:
application/json.
Integração de API e exemplos
Abaixo está uma Python trecho demonstrando como invocar o GLM‑4.5 por meio da API do CometAPI. Substituir <API_KEY> e <PROMPT> adequadamente:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Parâmetros-chave:
- modelo: Especifica a variante GLM‑4.5
- max_tokens: Controla o comprimento da saída
- temperatura: Ajusta a criatividade versus o determinismo
Veja também GLM-4.5 Air API
