API GLM‑4.5

CometAPI
AnnaJul 28, 2025
API GLM‑4.5

API GLM‑4.5 от Zhipu — это унифицированный RESTful-сервис на платформах Z.ai (глобальный) и Zhipu AI Open (материковый Китай), который предоставляет гибридно-экспертную модель GLM‑355 с 4.5 миллиардами параметров, способную выполнять сложные рассуждения, кодирование и агентские задачи, с настраиваемыми параметрами (например, температура, максимальное количество токенов, потоковая передача).


Основные характеристики

GLM‑4.5 разработан как унифицированная агентская модель, Интегрируя рассуждение, кодирование и автономное принятие решений Возможности в рамках единой архитектуры. Он изначально поддерживает два режима работы:мышление для сложных рассуждений и использования инструментов, а также недумающий для быстрого реагирования по требованию, что делает его идеальным для универсального использования агент рабочих процессов.


технические детали

  • Масштаб параметров: Флагманская модель GLM‑4.5 включает в себя 355 миллиарда общие параметры с 32 миллиарда активных параметры.
  • Гибридное рассуждение: GLM‑4.5 использует гибридное квантование FP8 стратегия оптимизации эффективность вывода без существенного ущерба для точности.
  • Параметр Эффективность: Использование 32 B активных параметров из 355 Б для минимизации нагрузки на оборудование во время вывода.
  • Оптимизация слоя: Компоненты сокращены и перераспределены в более глубокие слои, что улучшает Логическое объяснение без увеличения размера модели.

Рабочий процесс обучения

Многоэтапное обучение:

  1. Предварительная подготовка к фундаментальным занятиям на ~15 триллионах токенов.
  2. Тонкая настройка рассуждений на более чем 7 триллионах курируемых токенов для улучшения процесса принятия решений и синтеза кода.

Тестовая производительность

В наборе 12 отраслевых стандартных показателей покрытие агентный, рассуждение и кодирование Задания GLM‑4.5 получили общую оценку 63.2, рейтинг в третьих глобально отстает от таких титанов, как ГПТ-4 и Грок 4, Основные моменты включают в себя:

эталонный тестОценка GLM‑4.5Сравнение лучших фирменных продуктов
BrowseComp (веб)26.4 %Клод 4 Опус: 18.8 %
МАТЕМАТИКА 50098.2 %GPT‑4 Турбо
AIME2491.0 %Клод 4 Сонет
GPQA79.1 %Близнецы 2.5 Про

В наборе из 12 конкурсных тестов, охватывающих кодирование, рассуждение и агентный бенчмарки — рейтинг GLM‑4.5 третий в целом, соответствуя или превосходя ведущие фирменные модели, такие как Claude 4 Sonnet и Gemini 2.5 Pro, по таким задачам, как SWE‑скамья и AIME24 .

ГЛМ‑4.5


Версии модели

The Семейство GLM‑4.5 включает несколько специализированных вариантов, доступных через API:

  • ГЛМ‑4.5 (355 Б общих параметров; 32 Б активных)
  • GLM‑4.5‑Воздух (всего 106 Б; легкий, более быстрый вывод)
  • GLM‑4.5‑X, GLM‑4.5‑AirX (сверхбыстрый вывод)
  • GLM‑4.5‑Flash (бесплатно, оптимизировано для кодирования и рассуждений)

Как позвонить ГЛМ‑4.5 API от CometAPI

GLM‑4.5 Цены на API серии в CometAPI, скидка 20% на официальную цену:

МодельвводитьЦена
glm-4.5Наша самая мощная модель рассуждений с 355 миллиардами параметровВходные токены $0.48 Выходные токены $1.92
glm-4.5-airЭкономичный, легкий, с высокой производительностьюВходные токены $0.16 Выходные токены $1.07
glm-4.5-xВысокая производительность, мощное мышление, сверхбыстрый откликВходные токены $1.60 Выходные токены $6.40
glm-4.5-airxЛегкий, мощный, сверхбыстрый откликВходные токены $0.02 Выходные токены $0.06
glm-4.5-flashВысокая производительность, отлично подходящая для кодирования рассуждений и агентовВходные токены $3.20 Выходные токены $12.80

Необходимые шаги

  • Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
  • Получите ключ API-интерфейса для доступа к учетным данным. Нажмите «Добавить токен» в API-токене в персональном центре, получите ключ токена: sk-xxxxx и отправьте.
  • Получите URL этого сайта: https://api.cometapi.com/

Используйте метод

  1. Выберите "glm-4.5” конечная точка для отправки запроса API и установки тела запроса. Метод запроса и тело запроса получены из нашего веб-сайта API doc. Наш веб-сайт также предоставляет тест Apifox для вашего удобства.
  2. Заменять с вашим реальным ключом CometAPI из вашей учетной записи.
  3. Введите свой вопрос или запрос в поле «Контент» — на него ответит модель.
  4. . Обработайте ответ API, чтобы получить сгенерированный ответ.

CometAPI предоставляет полностью совместимый REST API для беспроблемной миграции. Ключевые детали API документ:

  • Базовый URL: https://api.cometapi.com/v1/chat/completions
  • Название модели:  glm-4.5
  • Аутентификация:  Bearer YOUR_CometAPI_API_KEY заголовок
  • Тип содержимого: application/json .

Интеграция API и примеры

Ниже приведен Питон Фрагмент, демонстрирующий, как вызвать GLM‑4.5 через API CometAPI. Заменить <API_KEY> и <PROMPT> соответственно:

import requests

API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
    "Authorization": "Bearer <API_KEY>",
    "Content-Type": "application/json"
}
payload = {
    "model": "glm-4.5",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user",   "content": "<PROMPT>"}
    ],
    "max_tokens": 512,
    "temperature": 0.7
}

response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())

Ключевые параметры:

  • модель: Указывает вариант GLM‑4.5
  • max_tokens: Управляет длиной выходного сигнала
  • температура: Регулирует креативность против детерминизма

См. также GLM-4.5 Воздушный API


Читать далее

500+ моделей в одном API

Скидка до 20%