API GLM‑4.5

CometAPI
AnnaJul 28, 2025
API GLM‑4.5

A API GLM‑4.5 da Zhipu é um serviço RESTful unificado nas plataformas Z.ai (global) e Zhipu AI Open (China continental) que expõe o modelo GLM‑355 híbrido-especializado de 4.5 bilhões de parâmetros — capaz de raciocínio complexo, codificação e tarefas de agente — com opções configuráveis (por exemplo, temperatura, tokens máximos, streaming).


Características básicas

O GLM‑4.5 foi projetado como um modelo de agente unificado, Integrando raciocínio, codificação e tomada de decisão autônoma capacidades dentro de uma única arquitetura. Ele suporta nativamente dois modos operacionais:pensando para raciocínio complexo e uso de ferramentas, e não-pensante para respostas rápidas e sob demanda, tornando-o ideal para aplicações versáteis agente workflows.


Detalhes Técnicos

  • Escala de Parâmetros:O carro-chefe GLM‑4.5 compreende 355 bilhões parâmetros totais com 32 bilhões de ativos parâmetros.
  • Raciocínio Híbrido: O GLM‑4.5 emprega um quantização FP8 híbrida estratégia para otimizar eficiência de inferência sem sacrificar substancialmente a precisão.
  • Eficiência do parâmetro: Usos 32 B parâmetros ativos de 355 B para minimizar a carga de hardware durante a inferência.
  • Otimização de Camadas: Componentes podados e redistribuídos em camadas mais profundas, melhorando raciocínio lógico sem aumentar o tamanho do modelo.

Fluxo de Trabalho de Treinamento

Treinamento em vários estágios:

  1. Pré-treinamento básico em ~15 trilhões de tokens.
  2. Raciocínio Ajuste fino em >7 trilhões de tokens selecionados para aprimorar a tomada de decisões e a síntese de código.

Desempenho de referência

Em uma suíte de 12 benchmarks padrão da indústria cobertura agente, raciocínio e codificação tarefas, o GLM‑4.5 alcançou uma pontuação geral de 63.2classificação terceiro globalmente por trás de titãs proprietários como GPT-4 e Grok 4. Os destaques incluem:

referênciaPontuação GLM‑4.5Comparação de proprietários de topo
BrowseComp (web)26.4%Claude 4 Opus: 18.8%
MATEMÁTICA 50098.2%GPT‑4 Turbo
AIME2491.0%Claude 4 Soneto
GPQA79.1%Gêmeos 2.5 Pro

Em um conjunto de 12 testes competitivos — abrangendo codificação, raciocínio e agente benchmarks—classificações GLM‑4.5 terceiro geral, igualando ou superando modelos proprietários líderes como Claude 4 Sonnet e Gemini 2.5 Pro em tarefas como Banco SWE e AIME24 .

GLM‑4.5


Versões do modelo

O Família GLM‑4.5 inclui diversas variantes especializadas acessíveis via API:

  • GLM‑4.5 (355 B parâmetros totais; 32 B ativos)
  • GLM‑4.5‑Ar (106 B no total; leve, inferência mais rápida)
  • GLM‑4.5‑X, GLM‑4.5‑AirX (inferência ultrarrápida)
  • GLM‑4.5‑Flash (grátis, otimizado para codificação e raciocínio)

Como ligar GLM‑4.5 API da CometAPI

GLM‑4.5 Preços da API da série CometAPI, 20% de desconto sobre o preço oficial:

ModelointroduzirPreço
glm-4.5Nosso modelo de raciocínio mais poderoso, com 355 bilhões de parâmetrosTokens de entrada $ 0.48 Tokens de saída $ 1.92
glm-4.5-airDesempenho leve e robusto, com boa relação custo-benefícioTokens de entrada $ 0.16 Tokens de saída $ 1.07
glm-4.5-xAlto desempenho, raciocínio forte, resposta ultrarrápidaTokens de entrada $ 1.60 Tokens de saída $ 6.40
glm-4.5-airxDesempenho leve e forte, resposta ultrarrápidaTokens de entrada $ 0.02 Tokens de saída $ 0.06
glm-4.5-flashDesempenho forte, excelente para codificação de raciocínio e agentesTokens de entrada $ 3.20 Tokens de saída $ 12.80

Etapas Necessárias

  • Faça o login no cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro
  • Obtenha a chave de API da credencial de acesso da interface. Clique em "Adicionar Token" no token da API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.
  • Obtenha a URL deste site: https://api.cometapi.com/

Use o método

  1. Selecione a opção "glm-4.5” endpoint para enviar a solicitação de API e definir o corpo da solicitação. O método e o corpo da solicitação são obtidos da documentação da API do nosso site. Nosso site também oferece o teste Apifox para sua conveniência.
  2. Substituir com sua chave CometAPI real da sua conta.
  3. Insira sua pergunta ou solicitação no campo de conteúdo — é a isso que o modelo responderá.
  4. . Processe a resposta da API para obter a resposta gerada.

A CometAPI fornece uma API REST totalmente compatível — para uma migração perfeita. Detalhes importantes para Doc API:

Integração de API e exemplos

Abaixo está uma Python trecho demonstrando como invocar o GLM‑4.5 por meio da API do CometAPI. Substituir <API_KEY> e <PROMPT> adequadamente:

import requests

API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
    "Authorization": "Bearer <API_KEY>",
    "Content-Type": "application/json"
}
payload = {
    "model": "glm-4.5",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user",   "content": "<PROMPT>"}
    ],
    "max_tokens": 512,
    "temperature": 0.7
}

response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())

Parâmetros-chave:

  • modelo: Especifica a variante GLM‑4.5
  • max_tokens: Controla o comprimento da saída
  • temperatura: Ajusta a criatividade versus o determinismo

Veja também GLM-4.5 Air API


Leia Mais

500+ Modelos em Uma API

Até 20% de Desconto