ModellerDestekKurumsalBlog
500+ Yapay Zeka Modeli API'si, Hepsi Tek Bir API'de. Sadece CometAPI'de
Modeller API
Geliştirici
Hızlı BaşlangıçDokümantasyonAPI Kontrol Paneli
Kaynaklar
Yapay Zeka ModelleriBlogKurumsalDeğişiklik GünlüğüHakkında
2025 CometAPI. Tüm hakları saklıdır.Gizlilik PolitikasıHizmet Şartları
Home/Models/Zhipu AI/GLM 4.6
Z

GLM 4.6

Giriş:$0.96/M
Çıktı:$3.84/M
Bağlam:200,000
Maksimum Çıktı:128,000
Zhipu'nun en yeni amiral gemisi modeli GLM-4.6 yayımlandı: toplam parametre 355B, etkin parametre 32B. Genel çekirdek yetenekleri GLM-4.5'i aşıyor. Kodlama: Claude Sonnet 4 ile aynı düzeyde, Çin'de en iyisi. Bağlam: 200K'ye genişletildi (önceden 128K). Çıkarım: İyileştirildi, Tool çağrılarını destekliyor. Arama: Tool ve ajan çerçevesi optimize edildi. Yazma: İnsan tercihleri, yazı stili ve rol yapma ile daha uyumlu. Çok dilli: Çeviri performansı geliştirildi.
Yeni
Ticari kullanım
Playground
Genel Bakış
Özellikler
Fiyatlandırma
API

GLM-4.6, Z.ai’nin (eski adıyla Zhipu AI) GLM ailesindeki en son büyük sürüm: ajan odaklı iş akışları, uzun bağlamlı akıl yürütme ve gerçek dünyaya yönelik kodlama için ayarlanmış, 4. nesil, büyük dil MoE (Mixture-of-Experts) modeli. Sürüm, pratik ajan/araç entegrasyonuna, çok büyük bağlam penceresine ve yerel dağıtım için açık ağırlıkların kullanılabilirliğine vurgu yapar.

Temel özellikler

  • Uzun bağlam — yerel 200K token bağlam penceresi (128K’dan genişletildi). (docs.z.ai)
  • Kodlama ve ajanik yetenek — gerçek dünya kodlama görevlerinde duyurulan iyileştirmeler ve ajanlar için daha iyi araç çağırma.
  • Verimlilik — Z.ai’nin testlerinde GLM-4.5’e kıyasla ~%30 daha düşük token tüketimi bildirildi.
  • Dağıtım ve kuantizasyon — Cambricon çipleri için duyurulan ilk FP8 ve Int4 entegrasyonu; vLLM aracılığıyla Moore Threads üzerinde yerel FP8 desteği.
  • Model boyutu ve tensör türü — yayımlanan artifaktlar, Hugging Face üzerinde ~357B parametreli bir modeli (BF16 / F32 tensörler) gösteriyor.

Teknik ayrıntılar

Modaliteler ve biçimler. GLM-4.6 yalnızca metin LLM’dir (girdi ve çıktı modaliteleri: metin). Bağlam uzunluğu = 200K token; azami çıktı = 128K token.

Kuantizasyon ve donanım desteği. Ekip, Cambricon çiplerinde FP8/Int4 kuantizasyonu ve çıkarım için vLLM kullanarak Moore Threads GPU’larında yerel FP8 yürütmeyi rapor ediyor — çıkarım maliyetini düşürmek ve şirket içi ile yerel bulut dağıtımlarını mümkün kılmak açısından önemli.

Araçlar ve entegrasyonlar. GLM-4.6, Z.ai’nin API’si, üçüncü taraf sağlayıcı ağları (ör. CometAPI) üzerinden dağıtılır ve kodlama ajanlarına (Claude Code, Cline, Roo Code, Kilo Code) entegre edilir.

Teknik ayrıntılar

Modaliteler ve biçimler. GLM-4.6 yalnızca metin LLM’dir (girdi ve çıktı modaliteleri: metin). Bağlam uzunluğu = 200K token; azami çıktı = 128K token.

Kuantizasyon ve donanım desteği. Ekip, Cambricon çiplerinde FP8/Int4 kuantizasyonu ve çıkarım için vLLM kullanarak Moore Threads GPU’larında yerel FP8 yürütmeyi rapor ediyor — çıkarım maliyetini düşürmek ve şirket içi ile yerel bulut dağıtımlarını mümkün kılmak açısından önemli.

Araçlar ve entegrasyonlar. GLM-4.6, Z.ai’nin API’si, üçüncü taraf sağlayıcı ağları (ör. CometAPI) üzerinden dağıtılır ve kodlama ajanlarına (Claude Code, Cline, Roo Code, Kilo Code) entegre edilir.

Kıyaslama performansı

  • Yayımlanan değerlendirmeler: GLM-4.6, ajanlar, akıl yürütme ve kodlamayı kapsayan sekiz açık kıyaslamada test edildi ve GLM-4.5’e göre belirgin kazanımlar gösteriyor. İnsan değerlendirmeli, gerçek dünya kodlama testlerinde (genişletilmiş CC-Bench), GLM-4.6 GLM-4.5’e kıyasla ~%15 daha az token kullanıyor ve Anthropic’in Claude Sonnet 4’üne karşı ~%48.6 kazanım oranı sergiliyor (birçok lider tabloda neredeyse parite).
  • Konumlandırma: sonuçlar, GLM-4.6’nın önde gelen yerli ve uluslararası modellerle rekabetçi olduğunu iddia ediyor (örnekler arasında DeepSeek-V3.1 ve Claude Sonnet 4 bulunuyor).

img

Sınırlamalar ve riskler

  • Halüsinasyonlar ve hatalar: mevcut tüm LLM’ler gibi, GLM-4.6 da olgusal hatalar yapabilir — Z.ai’nin belgeleri çıktılarda hata bulunabileceğini açıkça uyarıyor. Kullanıcılar kritik içerik için doğrulama ve retrieval/RAG uygulamalıdır.
  • Model karmaşıklığı ve hizmet maliyeti: 200K bağlam ve çok büyük çıktılar bellek ve gecikme taleplerini dramatik biçimde artırır ve çıkarım maliyetlerini yükseltebilir; ölçekli çalıştırma için kuantizasyon/çıkarım mühendisliği gereklidir.
  • Alan boşlukları: GLM-4.6 güçlü ajan/kodlama performansı bildirse de bazı kamuya açık raporlar, belirli mikro kıyaslamalarda hâlâ bazı rakip modellerin sürümlerinin gerisinde kaldığını belirtir (ör., bazı kodlama metriklerinde Sonnet 4.5’e karşı). Üretim modellerini değiştirmeden önce göreve göre değerlendirin.
  • Güvenlik ve politika: açık ağırlıklar erişilebilirliği artırır ancak aynı zamanda koruyuculuk ve yönetişim sorularını gündeme getirir (önlemler, koruma mekanizmaları ve red-teaming kullanıcının sorumluluğundadır).

Kullanım senaryoları

  • Ajanik sistemler ve araç orkestrasyonu: uzun ajan izleri, çoklu araç planlama, dinamik araç çağırma; modelin ajanik ayarı önemli bir satış noktasıdır.
  • Gerçek dünya kodlama yardımcıları: çok turlu kod üretimi, kod incelemesi ve etkileşimli IDE asistanları (Z.ai’ye göre Claude Code, Cline, Roo Code ile entegre). Token verimliliği iyileştirmeleri yoğun kullanım geliştirici planları için cazip kılar.
  • Uzun belge iş akışları: özetleme, çok belgelik sentez, 200K pencere sayesinde uzun hukuki/teknik incelemeler.
  • İçerik üretimi ve sanal karakterler: genişletilmiş diyaloglar, çok turlu senaryolarda tutarlı persona sürdürme.

GLM-4.6 diğer modellerle nasıl karşılaştırılır

  • GLM-4.5 → GLM-4.6: bağlam boyutunda (128K → 200K) ve token verimliliğinde (CC-Bench’te ~%15 daha az token) sıçrama; geliştirilmiş ajan/araç kullanımı.
  • GLM-4.6 vs Claude Sonnet 4 / Sonnet 4.5: Z.ai, birçok sıralamada neredeyse parite ve CC-Bench gerçek dünya kodlama görevlerinde ~%48.6 kazanım oranı bildirmektedir (yani yakın rekabet; bazı mikro kıyaslamalarda Sonnet hâlâ önde). Birçok mühendislik ekibi için GLM-4.6, maliyet açısından verimli bir alternatif olarak konumlandırılıyor.
  • GLM-4.6 vs diğer uzun bağlam modelleri (DeepSeek, Gemini varyantları, GPT-4 ailesi): GLM-4.6, büyük bağlam ve ajanik kodlama iş akışlarını vurgular; göreli güçlü yanlar ölçüte bağlıdır (token verimliliği/araç entegrasyonu vs ham kod sentezi doğruluğu veya güvenlik hatları). Ampirik seçim görev odaklı olmalıdır.

Zhipu AI’nin en yeni amiral gemisi modeli GLM-4.6 yayımlandı: toplam 355B parametre, 32B aktif. Tüm temel yeteneklerde GLM-4.5’i geride bırakır.

  • Kodlama: Claude Sonnet 4 ile eş düzeyde, Çin’de en iyisi.
  • Bağlam: 200K’a genişletildi (128K’dan).
  • Akıl yürütme: iyileştirildi, çıkarım sırasında araç çağırmayı destekler.
  • Arama: geliştirilmiş araç çağırma ve ajan performansı.
  • Yazma: stil, okunabilirlik ve rol yapma konusunda insan tercihleriyle daha iyi uyum sağlar.
  • Çok dilli: diller arası çeviri güçlendirildi.

SSS

What are the context window and output limits for GLM-4-6?

GLM-4-6 supports a 200,000 token context window (extended from 128K in GLM-4.5) with up to 128,000 output tokens, enabling extensive document analysis and long-form generation.

How does GLM-4-6 compare to Claude Sonnet 4 in coding?

According to Zhipu, GLM-4-6's coding capabilities align with Claude Sonnet 4, making it the best coding model among Chinese domestic models.

Does GLM-4-6 support tool calling and agent workflows?

Yes, GLM-4-6 features improved inference capabilities with enhanced Tool calls support and an optimized agent framework for complex multi-step task automation.

What is the architecture of GLM-4-6?

GLM-4-6 is a Mixture-of-Experts model with 355B total parameters and 32B active parameters, balancing capability with efficiency.

What makes GLM-4-6 different from GLM-4.5?

GLM-4-6 offers extended context (200K vs 128K), improved reasoning and tool calling, enhanced writing aligned with human preferences, better multilingual translation, and optimized role-playing.

Is GLM-4-6 suitable for enterprise Chinese language applications?

Yes, GLM-4-6 is particularly strong for Chinese language tasks including translation, content writing, and conversational AI, with enhanced multilingual capabilities.

When should I choose GLM-4-6 over GPT-5.2 or Claude?

Choose GLM-4-6 for Chinese-first applications, cost-effective 200K context needs, or when you need a strong domestic AI alternative with coding capabilities comparable to frontier models.

GLM 4.6 için Özellikler

GLM 4.6'in performansı ve kullanılabilirliği artırmak için tasarlanmış temel özelliklerini keşfedin. Bu yeteneklerin projelerinize nasıl fayda sağlayabileceğini ve kullanıcı deneyimini nasıl geliştirebileceğini öğrenin.

GLM 4.6 için Fiyatlandırma

GLM 4.6 için çeşitli bütçelere ve kullanım ihtiyaçlarına uygun rekabetçi fiyatlandırmayı keşfedin. Esnek planlarımız sadece kullandığınız kadar ödeme yapmanızı sağlar ve ihtiyaçlarınız büyüdükçe kolayca ölçeklendirme imkanı sunar. GLM 4.6'in maliyetleri yönetilebilir tutarken projelerinizi nasıl geliştirebileceğini keşfedin.
Comet Fiyatı (USD / M Tokens)Resmi Fiyat (USD / M Tokens)İndirim
Giriş:$0.96/M
Çıktı:$3.84/M
Giriş:$1.2/M
Çıktı:$4.8/M
-20%

GLM 4.6 için örnek kod ve API

GLM-4.6, Z.ai’nin (eski adıyla Zhipu AI) GLM ailesindeki en yeni büyük sürümdür: ajan güdümlü iş akışları, uzun bağlamlı muhakeme ve gerçek dünya kodlaması için ayarlanmış dördüncü nesil, büyük dil MoE (Mixture-of-Experts) modelidir. Bu sürüm, pratik ajan/araç entegrasyonuna, çok büyük bir bağlam penceresine ve yerel kurulum için açık ağırlıkların kullanılabilirliğine vurgu yapar.
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="glm-4.6",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="glm-4.6",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const completion = await openai.chat.completions.create({
  model: "glm-4.6",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "Hello!" },
  ],
});

console.log(completion.choices[0].message.content);

Curl Code Example

curl https://api.cometapi.com/v1/chat/completions \
     --header "Authorization: Bearer $COMETAPI_KEY" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "glm-4.6",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"}
    ]
}'

Daha Fazla Model

A

Claude Opus 4.6

Giriş:$4/M
Çıktı:$20/M
Claude Opus 4.6, Anthropic’in “Opus” sınıfı büyük dil modelidir; Şubat 2026’da yayımlandı. Bilgi odaklı çalışma ve araştırma iş akışları için bir temel araç olarak konumlandırılmıştır — uzun bağlamlarda akıl yürütmeyi, çok adımlı planlamayı, araç kullanımını (ajan tabanlı yazılım iş akışları dahil) ve otomatik slayt ve e-tablo oluşturma gibi bilgisayar kullanımına yönelik görevleri geliştirir.
A

Claude Sonnet 4.6

Giriş:$2.4/M
Çıktı:$12/M
Claude Sonnet 4.6, şimdiye kadarki en yetenekli Sonnet modelimiz. Modelin kodlama, bilgisayar kullanımı, uzun bağlamlı akıl yürütme, ajan planlama, bilgi çalışması ve tasarım alanlarındaki becerilerine tam kapsamlı bir yükseltme sunar. Sonnet 4.6 ayrıca beta aşamasında 1M token bağlam penceresi sunar.
O

GPT-5.4 nano

Giriş:$0.16/M
Çıktı:$1/M
GPT-5.4 nano, hız ve maliyetin en çok önem taşıdığı sınıflandırma, veri çıkarımı, sıralama ve alt ajanlar gibi görevler için tasarlanmıştır.
O

GPT-5.4 mini

Giriş:$0.6/M
Çıktı:$3.6/M
GPT-5.4 mini, GPT-5.4'ün güçlü yönlerini yüksek hacimli iş yükleri için tasarlanmış daha hızlı ve daha verimli bir modele taşır.
A

Claude Mythos Preview

A

Claude Mythos Preview

Yakında
Giriş:$60/M
Çıktı:$240/M
Claude Mythos Preview, bugüne kadarki en güçlü öncü modelimizdir ve önceki öncü modelimiz Claude Opus 4.6 ile karşılaştırıldığında birçok değerlendirme ölçütündeki puanlarda çarpıcı bir sıçrama göstermektedir.
X

mimo-v2-pro

Giriş:$0.8/M
Çıktı:$2.4/M
MiMo-V2-Pro, Xiaomi'nin amiral gemisi temel modeli olup, 1T'den fazla toplam parametreye ve 1M bağlam uzunluğuna sahiptir; ajan odaklı senaryolar için derinlemesine optimize edilmiştir. OpenClaw gibi genel amaçlı ajan çerçevelerine son derece uyum sağlar. Standart PinchBench ve ClawBench kıyaslama testlerinde dünya çapında en üst sıralarda yer alır; algılanan performansı Opus 4.6 seviyesine yaklaşır. MiMo-V2-Pro, ajan sistemlerinin beyni olarak hizmet vermek üzere tasarlanmış olup karmaşık iş akışlarını orkestre eder, üretim mühendisliği görevlerini yürütür ve sonuçları güvenilir biçimde sunar.

İlgili Blog

GLM-4.7 Yayımlandı: Bu, Yapay Zekânın Zekâ Düzeyi İçin Ne Anlama Geliyor?
Dec 23, 2025
glm-4-7

GLM-4.7 Yayımlandı: Bu, Yapay Zekânın Zekâ Düzeyi İçin Ne Anlama Geliyor?

22 Aralık 2025’te Zhipu AI (Z.ai), Genel Dil Modeli (GLM) ailesindeki en yeni sürüm olan GLM-4.7’yi resmen yayımladı — açık kaynak yapay zeka modelleri dünyasında küresel düzeyde dikkat çekti. Bu model yalnızca kodlama ve akıl yürütme görevlerindeki yetenekleri ilerletmekle kalmıyor, aynı zamanda kilit kıyaslamalarda GPT-5.2 ve Claude Sonnet 4.5 gibi mülkiyetli modellerin hakimiyetine de meydan okuyor.