API GLM‑4.5

A API GLM‑4.5 da Zhipu é um serviço RESTful unificado nas plataformas Z.ai (global) e Zhipu AI Open (China continental) que expõe o modelo GLM‑355 híbrido-especializado de 4.5 bilhões de parâmetros — capaz de raciocínio complexo, codificação e tarefas de agente — com opções configuráveis (por exemplo, temperatura, tokens máximos, streaming).

Características básicas

O GLM‑4.5 foi projetado como um modelo de agente unificado, Integrando raciocínio, codificação e tomada de decisão autônoma capacidades dentro de uma única arquitetura. Ele suporta nativamente dois modos operacionais:pensando para raciocínio complexo e uso de ferramentas, e não-pensante para respostas rápidas e sob demanda, tornando-o ideal para aplicações versáteis agente workflows.

Detalhes Técnicos

Escala de Parâmetros:O carro-chefe GLM‑4.5 compreende 355 bilhões parâmetros totais com 32 bilhões de ativos parâmetros.
Raciocínio Híbrido: O GLM‑4.5 emprega um quantização FP8 híbrida estratégia para otimizar eficiência de inferência sem sacrificar substancialmente a precisão.
Eficiência do parâmetro: Usos 32 B parâmetros ativos de 355 B para minimizar a carga de hardware durante a inferência.
Otimização de Camadas: Componentes podados e redistribuídos em camadas mais profundas, melhorando raciocínio lógico sem aumentar o tamanho do modelo.

Fluxo de Trabalho de Treinamento

Treinamento em vários estágios:

Pré-treinamento básico em ~15 trilhões de tokens.
Raciocínio Ajuste fino em >7 trilhões de tokens selecionados para aprimorar a tomada de decisões e a síntese de código.

Desempenho de referência

Em uma suíte de 12 benchmarks padrão da indústria cobertura agente, raciocínio e codificação tarefas, o GLM‑4.5 alcançou uma pontuação geral de 63.2classificação terceiro globalmente por trás de titãs proprietários como GPT-4 e Grok 4. Os destaques incluem:

referência	Pontuação GLM‑4.5	Comparação de proprietários de topo
BrowseComp (web)	26.4%	Claude 4 Opus: 18.8%
MATEMÁTICA 500	98.2%	GPT‑4 Turbo
AIME24	91.0%	Claude 4 Soneto
GPQA	79.1%	Gêmeos 2.5 Pro

Em um conjunto de 12 testes competitivos — abrangendo codificação, raciocínio e agente benchmarks—classificações GLM‑4.5 terceiro geral, igualando ou superando modelos proprietários líderes como Claude 4 Sonnet e Gemini 2.5 Pro em tarefas como Banco SWE e AIME24 .

GLM‑4.5

Versões do modelo

O Família GLM‑4.5 inclui diversas variantes especializadas acessíveis via API:

GLM‑4.5 (355 B parâmetros totais; 32 B ativos)
GLM‑4.5‑Ar (106 B no total; leve, inferência mais rápida)
GLM‑4.5‑X, GLM‑4.5‑AirX (inferência ultrarrápida)
GLM‑4.5‑Flash (grátis, otimizado para codificação e raciocínio)

Como ligar GLM‑4.5 API da CometAPI

`GLM‑4.5` Preços da API da série CometAPI, 20% de desconto sobre o preço oficial:


Modelo	introduzir	Preço
`glm-4.5`	Nosso modelo de raciocínio mais poderoso, com 355 bilhões de parâmetros	Tokens de entrada $ 0.48 Tokens de saída $ 1.92
`glm-4.5-air`	Desempenho leve e robusto, com boa relação custo-benefício	Tokens de entrada $ 0.16 Tokens de saída $ 1.07
`glm-4.5-x`	Alto desempenho, raciocínio forte, resposta ultrarrápida	Tokens de entrada $ 1.60 Tokens de saída $ 6.40
`glm-4.5-airx`	Desempenho leve e forte, resposta ultrarrápida	Tokens de entrada $ 0.02 Tokens de saída $ 0.06
`glm-4.5-flash`	Desempenho forte, excelente para codificação de raciocínio e agentes	Tokens de entrada $ 3.20 Tokens de saída $ 12.80

Etapas Necessárias

Faça o login no cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro
Obtenha a chave de API da credencial de acesso da interface. Clique em "Adicionar Token" no token da API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.
Obtenha a URL deste site: https://api.cometapi.com/

Use o método

Selecione a opção "glm-4.5” endpoint para enviar a solicitação de API e definir o corpo da solicitação. O método e o corpo da solicitação são obtidos da documentação da API do nosso site. Nosso site também oferece o teste Apifox para sua conveniência.
Substituir com sua chave CometAPI real da sua conta.
Insira sua pergunta ou solicitação no campo de conteúdo — é a isso que o modelo responderá.
. Processe a resposta da API para obter a resposta gerada.

A CometAPI fornece uma API REST totalmente compatível — para uma migração perfeita. Detalhes importantes para Doc API:

URL base: https://api.cometapi.com/v1/chat/completions
Nomes de modelo: "glm-4.5"
Autenticação: Bearer YOUR_CometAPI_API_KEY cabeçalho
Tipo de conteúdo: application/json .

Integração de API e exemplos

Abaixo está uma Python trecho demonstrando como invocar o GLM‑4.5 por meio da API do CometAPI. Substituir <API_KEY> e <PROMPT> adequadamente:

import requests

API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
    "Authorization": "Bearer <API_KEY>",
    "Content-Type": "application/json"
}
payload = {
    "model": "glm-4.5",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user",   "content": "<PROMPT>"}
    ],
    "max_tokens": 512,
    "temperature": 0.7
}

response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())

Parâmetros-chave:

modelo: Especifica a variante GLM‑4.5
max_tokens: Controla o comprimento da saída
temperatura: Ajusta a criatividade versus o determinismo

Veja também GLM-4.5 Air API

Características básicas

Detalhes Técnicos

Fluxo de Trabalho de Treinamento

Desempenho de referência

Versões do modelo

Como ligar GLM‑4.5 API da CometAPI

`GLM‑4.5` Preços da API da série CometAPI, 20% de desconto sobre o preço oficial:

Etapas Necessárias

Use o método

Integração de API e exemplos

Leia Mais

500+ Modelos em Uma API

API GLM‑4.5

Características básicas

Detalhes Técnicos

Fluxo de Trabalho de Treinamento

Desempenho de referência

Versões do modelo

Como ligar GLM‑4.5 API da CometAPI

GLM‑4.5 Preços da API da série CometAPI, 20% de desconto sobre o preço oficial:

Etapas Necessárias

Use o método

Integração de API e exemplos

Leia Mais

500+ Modelos em Uma API

`GLM‑4.5` Preços da API da série CometAPI, 20% de desconto sobre o preço oficial: