Home/Models/Zhipu AI/GLM 4.6

GLM 4.6

Zhipu AI
glm-4.6
Енгізу:$0.64/M
Шығыс:$2.56/M
Контекст:200,000
Максималды шығыс:128,000
Zhipu-дың ең жаңа флагмандық моделі GLM-4.6 шығарылды: жалпы параметрлер 355B, белсенді параметрлер 32B. Жалпы негізгі мүмкіндіктері GLM-4.5-тен асып түседі. Кодтау: Claude Sonnet 4-пен деңгейлес, Қытайдағы ең үздік. Контекст: 200K-қа дейін кеңейтілді (бастапқыда 128K). Инференс: Жетілдірілді, Tool шақыруларын қолдайды. Іздеу: Tool және агент фреймворкі оңтайландырылды. Жазу: Адамдардың қалауына, жазу стиліне және рөлдік ойынға көбірек сәйкеседі. Көптілділік: Аударма сапасы жақсартылды.
Playground
Шолу
Мүмкіндіктер
Баға белгілеу
API

GLM 4.6 үшін Playground

GLM 4.6 Playground-ын зерттеңіз — модельдерді тестілеу және нақты уақытта сұрауларды орындауға арналған интерактивті орта. Промпттарды қолданып көріңіз, параметрлерді реттеңіз және дамуды жеделдету және пайдалану жағдайларын растау үшін лезде қайталаңыз.

GLM-4.6 — Z.ai-дің (бұрын Zhipu AI) GLM отбасындағы ең соңғы ірі релиз: агенттік жұмыс ағындарына, ұзақ контексттік пайымдауға және нақты ортадағы кодтауға бапталған 4-ші буындағы, үлкен тілдік MoE (Mixture-of-Experts) моделі. Бұл релиз практикалық агент/құрал интеграциясына, өте үлкен контекст терезесіне және жергілікті орналастыру үшін ашық салмақтардың қолжетімділігіне баса назар аударады.

Негізгі мүмкіндіктер

  • Ұзақ контекст — табиғи 200K токен контекст терезесі (128K-тан кеңейтілген). (docs.z.ai)
  • Кодтау және агенттік қабілет — нақты кодтау тапсырмаларында сатылымдық жақсартулар және агенттер үшін құрал шақыруды күшейту.
  • Тиімділік — Z.ai сынақтарында GLM-4.5-пен салыстырғанда ~30% төмен токен тұтынуы хабарланған.
  • Орнату және кванттау — Cambricon чиптері үшін алғаш рет FP8 және Int4 интеграциясы жарияланды; vLLM арқылы Moore Threads-та native FP8 қолдауы.
  • Модель өлшемі және тензор түрі — жарияланған артефактілер Hugging Face-те ~357B-параметрлі модельді (BF16 / F32 тензорлары) көрсетеді.

Техникалық егжей-тегжейлер

Модальдылықтар және форматтар. GLM-4.6 — тек мәтіндік LLM (енгізу және шығару модальдылығы: мәтін). Context length = 200K tokens; max output = 128K tokens.

Кванттау және аппараттық қолдау. Топ Cambricon чиптерінде FP8/Int4 кванттауы және Moore Threads GPU-ларында vLLM арқылы инференс үшін native FP8 орындауын хабарлайды — бұл инференс құнын төмендету және on-prem әрі отандық бұлттық орналастыруларға мүмкіндік беру үшін маңызды.

Құралдар және интеграциялар. GLM-4.6 Z.ai API арқылы, үшінші тарап провайдер желілері (мыс., CometAPI) арқылы таратылады және кодтау агенттеріне (Claude Code, Cline, Roo Code, Kilo Code) интеграцияланған.

Техникалық егжей-тегжейлер

Модальдылықтар және форматтар. GLM-4.6 — тек мәтіндік LLM (енгізу және шығару модальдылығы: мәтін). Context length = 200K tokens; max output = 128K tokens.

Кванттау және аппараттық қолдау. Топ Cambricon чиптерінде FP8/Int4 кванттауы және Moore Threads GPU-ларында vLLM арқылы инференс үшін native FP8 орындауын хабарлайды — бұл инференс құнын төмендету және on-prem әрі отандық бұлттық орналастыруларға мүмкіндік беру үшін маңызды.

Құралдар және интеграциялар. GLM-4.6 Z.ai API арқылы, үшінші тарап провайдер желілері (мыс., CometAPI) арқылы таратылады және кодтау агенттеріне (Claude Code, Cline, Roo Code, Kilo Code) интеграцияланған.

Еталондық өнімділік

  • Жарияланған бағалаулар: GLM-4.6 агенттер, пайымдау және кодтау бойынша сегіз қоғамдық бенчмаркта тексерілген және GLM-4.5-тен айқын артықшылық көрсетеді. Адам бағалаған, нақты кодтау сынақтарында (кеңейтілген CC-Bench) GLM-4.5-пен салыстырғанда ~15% аз токен пайдаланады және Anthropic-тің Claude Sonnet 4-мен салыстырғанда ~48.6% жеңіс көрсеткішін тіркейді (көптеген лидербордтарда дерлік паритет).
  • Позициялау: нәтижелер GLM-4.6-ны отандық және халықаралық жетекші модельдермен бәсекелес деп көрсетеді (мысал ретінде DeepSeek-V3.1 және Claude Sonnet 4 келтірілген).

сурет

Шектеулер және тәуекелдер

  • Галлюцинациялар және қателер: барлық қазіргі LLM секілді, GLM-4.6 фактілік қателер жіберуі мүмкін — Z.ai құжаттары шығуларда қателер болуы ықтимал екенін нақты ескертеді. Пайдаланушылар маңызды мазмұн үшін верификация және Retrieval/RAG қолдануы тиіс.
  • Модель күрделілігі және қызмет көрсету құны: 200K контекст және өте үлкен шығулар жады мен кідіру талаптарын айтарлықтай арттырады және инференс құнын көбейтуі мүмкін; ауқымда іске қосу үшін кванттау/инференс инженериясы қажет.
  • Салалық алшақтықтар: GLM-4.6 агент/кодтау өнімділігін жоғары деп хабарласа да, кейбір жалпы есептер оның нақты микробенчмарктарда бәсекелес модельдердің кейбір нұсқаларынан қалып қоятынын атап өтеді (мысалы, Sonnet 4.5-ке қатысты кейбір кодтау метрикалары). Өндірістік модельдерді алмастырмас бұрын тапсырма бойынша жеке бағалаңыз.
  • Қауіпсіздік және саясат: ашық салмақтар қолжетімділікті арттырады, бірақ басқарушылық сұрақтарды да көтереді (митигциялар, қорғаныштар және қызыл команда тексерулері пайдаланушының жауапкершілігі болып қала береді).

Пайдалану сценарийлері

  • Агенттік жүйелер және құрал оркестрациясы: ұзақ агент тректері, көп-құралды жоспарлау, динамикалық құрал шақыру; модельдің агенттік бапталуы негізгі артықшылық.
  • Нақты ортадағы кодтау көмекшілері: көп айналымды код генерациясы, кодқа шолу және интерактивті IDE көмекшілері (Z.ai бойынша Claude Code, Cline, Roo Code-қа интеграцияланған). Токен тиімділігіндегі жақсартулар жоғары жүктемелі әзірлеуші жоспарлары үшін тартымды етеді.
  • Ұзақ құжаттық жұмыс ағындары: 200K терезе арқасында қысқаша мазмұндау, көп құжатты синтездеу, ұзақ заңдық/техникалық шолулар.
  • Контент жасау және виртуалды кейіпкерлер: ұзартылған диалогтар, көп айналымды сценарийлерде тұрақты персонаны сақтау.

GLM-4.6 басқа модельдермен қалай салыстырылады

  • GLM-4.5 → GLM-4.6: контекст өлшемі (128K → 200K) және токен тиімділігі (CC-Bench-те ~15% аз токен) бойынша қадамдық жақсарту; агент/құрал қолдануы жақсартылған.
  • GLM-4.6 vs Claude Sonnet 4 / Sonnet 4.5: Z.ai бірқатар лидербордтарда дерлік паритетті және CC-Bench нақты кодтау тапсырмаларында шамамен ~48.6% жеңіс көрсеткішін хабарлайды (яғни, жақын бәсеке, кейбір микробенчмарктарда Sonnet әлі көш бастап тұр). Көптеген инженерлік командалар үшін GLM-4.6 құн/тиімділік жағынан балама ретінде позицияланады.
  • GLM-4.6 vs ұзақ контекстті басқа модельдер (DeepSeek, Gemini нұсқалары, GPT-4 отбасы): GLM-4.6 үлкен контекст және агенттік кодтау жұмыс ағындарын ерекшелеп көрсетеді; салыстырмалы күшті жақтар метрикаға тәуелді (токен тиімділігі/агент интеграциясы vs таза код синтезінің дәлдігі немесе қауіпсіздік конвейерлері). Эмпирикалық таңдау тапсырмаға бағытталуы тиіс.

Zhipu AI-дің ең соңғы флагмандық моделі GLM-4.6 шығарылды: жалпы 355B параметр, 32B белсенді. Барлық негізгі мүмкіндіктер бойынша GLM-4.5-ті басып озды.

  • Кодтау: Claude Sonnet 4 деңгейіне тең, Қытайдағы ең үздік.
  • Контекст: 200K-қа кеңейтілген (128K-тен).
  • Пайымдау: Жақсартылған, инференс барысында құрал шақыруды қолдайды.
  • Іздеу: Құрал шақыру және агент өнімділігі жақсартылған.
  • Жазу: Стиль, оқылымдылық және рөлдік ойында адам қалауына жақсырақ сәйкеседі.
  • Көптілді: Тілдер арасындағы аудармасы күшейтілген.

GLM 4.6 үшін мүмкіндіктер

[Модель атауы] негізгі мүмкіндіктерін зерттеңіз, олар өнімділік пен пайдалану ыңғайлылығын арттыруға арналған. Бұл мүмкіндіктердің сіздің жобаларыңызға қалай пайда әкелетінін және пайдаланушы тәжірибесін қалай жақсартатынын біліңіз.
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

GLM 4.6 үшін баға белгілеу

[Модель атауы] үшін әртүрлі бюджеттер мен пайдалану қажеттіліктеріне сәйкес келетін бәсекеге қабілетті баға белгілеуді зерттеңіз. Біздің икемді жоспарларымыз сіз тек пайдаланған нәрсеңіз үшін ғана төлеуіңізді қамтамасыз етеді, бұл сіздің талаптарыңыз өскен сайын масштабтауды жеңілдетеді. [Модель атауы] шығындарды басқарылатын деңгейде ұстай отырып, сіздің жобаларыңызды қалай жақсарта алатынын біліңіз.
Комета бағасы (USD / M Tokens)Ресми баға (USD / M Tokens)
Енгізу:$0.64/M
Шығыс:$2.56/M
Енгізу:$0.80/M
Шығыс:$3.20/M

GLM 4.6 үшін үлгі код және API

GLM-4.6 — Z.ai (бұрын Zhipu AI) компаниясының GLM желісіндегі ең соңғы ірі шығарылым: агенттік жұмыс ағындарына, ұзақ контекстті пайымдауға және нақты жағдайларда кодтауға оңтайланған төртінші буынды үлкен тілдік MoE (сарапшылар қоспасы) моделі. Бұл шығарылым практикалық агент/құрал интеграциясына, өте үлкен контексттік терезеге және жергілікті орналастыру үшін ашық салмақтардың қолжетімділігіне басымдық береді.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="glm-4.6",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

Көбірек модельдер