API GLM‑4.5 от Zhipu — это унифицированный RESTful-сервис на платформах Z.ai (глобальный) и Zhipu AI Open (материковый Китай), который предоставляет гибридно-экспертную модель GLM‑355 с 4.5 миллиардами параметров, способную выполнять сложные рассуждения, кодирование и агентские задачи, с настраиваемыми параметрами (например, температура, максимальное количество токенов, потоковая передача).
Основные характеристики
GLM‑4.5 разработан как унифицированная агентская модель, Интегрируя рассуждение, кодирование и автономное принятие решений Возможности в рамках единой архитектуры. Он изначально поддерживает два режима работы:мышление для сложных рассуждений и использования инструментов, а также недумающий для быстрого реагирования по требованию, что делает его идеальным для универсального использования агент рабочих процессов.
технические детали
- Масштаб параметров: Флагманская модель GLM‑4.5 включает в себя 355 миллиарда общие параметры с 32 миллиарда активных параметры.
- Гибридное рассуждение: GLM‑4.5 использует гибридное квантование FP8 стратегия оптимизации эффективность вывода без существенного ущерба для точности.
- Параметр Эффективность: Использование 32 B активных параметров из 355 Б для минимизации нагрузки на оборудование во время вывода.
- Оптимизация слоя: Компоненты сокращены и перераспределены в более глубокие слои, что улучшает Логическое объяснение без увеличения размера модели.
Рабочий процесс обучения
Многоэтапное обучение:
- Предварительная подготовка к фундаментальным занятиям на ~15 триллионах токенов.
- Тонкая настройка рассуждений на более чем 7 триллионах курируемых токенов для улучшения процесса принятия решений и синтеза кода.
Тестовая производительность
В наборе 12 отраслевых стандартных показателей покрытие агентный, рассуждение и кодирование Задания GLM‑4.5 получили общую оценку 63.2, рейтинг в третьих глобально отстает от таких титанов, как ГПТ-4 и Грок 4, Основные моменты включают в себя:
| эталонный тест | Оценка GLM‑4.5 | Сравнение лучших фирменных продуктов |
|---|---|---|
| BrowseComp (веб) | 26.4 % | Клод 4 Опус: 18.8 % |
| МАТЕМАТИКА 500 | 98.2 % | GPT‑4 Турбо |
| AIME24 | 91.0 % | Клод 4 Сонет |
| GPQA | 79.1 % | Близнецы 2.5 Про |
В наборе из 12 конкурсных тестов, охватывающих кодирование, рассуждение и агентный бенчмарки — рейтинг GLM‑4.5 третий в целом, соответствуя или превосходя ведущие фирменные модели, такие как Claude 4 Sonnet и Gemini 2.5 Pro, по таким задачам, как SWE‑скамья и AIME24 .

Версии модели
The Семейство GLM‑4.5 включает несколько специализированных вариантов, доступных через API:
- ГЛМ‑4.5 (355 Б общих параметров; 32 Б активных)
- GLM‑4.5‑Воздух (всего 106 Б; легкий, более быстрый вывод)
- GLM‑4.5‑X, GLM‑4.5‑AirX (сверхбыстрый вывод)
- GLM‑4.5‑Flash (бесплатно, оптимизировано для кодирования и рассуждений)
Как позвонить ГЛМ‑4.5 API от CometAPI
GLM‑4.5 Цены на API серии в CometAPI, скидка 20% на официальную цену:
| Модель | вводить | Цена |
glm-4.5 | Наша самая мощная модель рассуждений с 355 миллиардами параметров | Входные токены $0.48 Выходные токены $1.92 |
glm-4.5-air | Экономичный, легкий, с высокой производительностью | Входные токены $0.16 Выходные токены $1.07 |
glm-4.5-x | Высокая производительность, мощное мышление, сверхбыстрый отклик | Входные токены $1.60 Выходные токены $6.40 |
glm-4.5-airx | Легкий, мощный, сверхбыстрый отклик | Входные токены $0.02 Выходные токены $0.06 |
glm-4.5-flash | Высокая производительность, отлично подходящая для кодирования рассуждений и агентов | Входные токены $3.20 Выходные токены $12.80 |
Необходимые шаги
- Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
- Получите ключ API-интерфейса для доступа к учетным данным. Нажмите «Добавить токен» в API-токене в персональном центре, получите ключ токена: sk-xxxxx и отправьте.
- Получите URL этого сайта: https://api.cometapi.com/
Используйте метод
- Выберите "
glm-4.5” конечная точка для отправки запроса API и установки тела запроса. Метод запроса и тело запроса получены из нашего веб-сайта API doc. Наш веб-сайт также предоставляет тест Apifox для вашего удобства. - Заменять с вашим реальным ключом CometAPI из вашей учетной записи.
- Введите свой вопрос или запрос в поле «Контент» — на него ответит модель.
- . Обработайте ответ API, чтобы получить сгенерированный ответ.
CometAPI предоставляет полностью совместимый REST API для беспроблемной миграции. Ключевые детали API документ:
- Базовый URL: https://api.cometapi.com/v1/chat/completions
- Название модели:
glm-4.5 - Аутентификация:
Bearer YOUR_CometAPI_API_KEYзаголовок - Тип содержимого:
application/json.
Интеграция API и примеры
Ниже приведен Питон Фрагмент, демонстрирующий, как вызвать GLM‑4.5 через API CometAPI. Заменить <API_KEY> и <PROMPT> соответственно:
import requests
API_URL = "https://api.cometapi.com/v1/chat/completions"
headers = {
"Authorization": "Bearer <API_KEY>",
"Content-Type": "application/json"
}
payload = {
"model": "glm-4.5",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "<PROMPT>"}
],
"max_tokens": 512,
"temperature": 0.7
}
response = requests.post(API_URL, json=payload, headers=headers)
print(response.json())
Ключевые параметры:
- модель: Указывает вариант GLM‑4.5
- max_tokens: Управляет длиной выходного сигнала
- температура: Регулирует креативность против детерминизма
См. также GLM-4.5 Воздушный API
