Temel özellikler (hızlı liste)
- İki model varyantı:
grok-4-fast-reasoningvegrok-4-fast-non-reasoning(derinlik ve hız için ayarlanabilir). - Çok büyük bağlam penceresi: 2.000.000 token’a kadar; son derece uzun belgeleri / çok saatlik transkriptleri / çok belgeli iş akışlarını mümkün kılar.
- Token verimliliği / maliyet odağı: xAI, Grok-4’e kıyasla ortalama olarak ~%40 daha az düşünme token’ı ve aynı benchmark performansına ulaşmak için maliyette ~%98 azalma sağlandığını bildiriyor (xAI’nin raporladığı metriklerde).
- Yerel araç / tarama entegrasyonu: web/X taraması, kod yürütme ve ajan tabanlı arama davranışları için araç kullanımı RL ile uçtan uca eğitilmiştir.
- Çok modluluk ve function calling: görselleri ve yapılandırılmış çıktıları destekler; API’de function calling ve yapılandırılmış yanıt formatları desteklenir.
Teknik detaylar
Birleşik akıl yürütme mimarisi: Grok-4-Fast, tamamen ayrı iki omurga model sunmak yerine, sistem istemleri veya varyant seçimi aracılığıyla akıl yürütme (uzun chain-of-thought) ya da akıl yürütmesiz (hızlı yanıtlar) davranışına yönlendirilebilen tek bir model ağırlık tabanı kullanır. Bu, karma iş yüklerinde geçiş gecikmesini ve token maliyetini azaltır.
Zekâ yoğunluğu için reinforcement learning: xAI, belirtilen token verimliliği kazanımlarının temelini oluşturan, token başına performansı en üst düzeye çıkarmaya odaklanan büyük ölçekli reinforcement learning kullandığını bildiriyor.
Araç koşullandırma ve ajan tabanlı arama: Grok-4-Fast, araç çağırmayı gerektiren görevlerde (web tarama, X araması, kod yürütme) eğitilmiş ve değerlendirilmiştir. Modelin, araçları ne zaman çağıracağına ve tarama kanıtlarını yanıtlara nasıl birleştireceğine karar verme konusunda yetkin olduğu ifade edilmektedir.
Benchmark performansı
BrowseComp’ta iyileşmeler (%44,9 pass\@1; Grok-4 için %43,0), SimpleQA’da (%95,0; %94,0’a karşı) ve belirli Çince tarama/arama alanlarında büyük kazanımlar. xAI ayrıca grok-4-fast-search varyantı için LMArena’nın Search Arena’sında en üst sıralamayı da bildiriyor。
Tipik ve önerilen kullanım senaryoları
- Yüksek hacimli arama ve bilgi erişimi — hızlı çok adımlı web akıl yürütmesine ihtiyaç duyan arama ajanları.
- Ajan tabanlı asistanlar ve botlar — tarama, kod yürütme ve eşzamansız araç çağrılarını birleştiren ajanlar (izin verildiğinde).
- Maliyete duyarlı üretim dağıtımları — daha ağır bir temel modele kıyasla daha iyi token/fayda ekonomisi isteyen ve çok sayıda çağrı gerektiren hizmetler.
- Geliştirici denemeleri — hızlı, tekrarlanan sorgulara dayanan çok modlu veya web ile zenginleştirilmiş akışların prototiplenmesi.
- Grok 4 fast API’ye nasıl erişilir
Adım 1: API anahtarı için kaydolun
cometapi.com’a giriş yapın. Henüz kullanıcımız değilseniz, lütfen önce kayıt olun. CometAPI konsolunuzda oturum açın. Arayüzün erişim kimlik bilgisi olan API anahtarını alın. Kişisel merkezdeki API token bölümünde “Add Token” seçeneğine tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.
Adım 2: Grok 4 fast API’ye istek gönderin
API isteğini göndermek ve istek gövdesini ayarlamak için “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” endpoint’ini seçin. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümantasyonundan alınır. Web sitemiz ayrıca kolaylığınız için Apifox testi de sağlar. <YOUR_API_KEY> ifadesini hesabınızdaki gerçek CometAPI anahtarınızla değiştirin. base url, Chat biçimindedir (https://api.cometapi.com/v1/chat/completions).
Sorunuzu veya isteğinizi content alanına ekleyin — modelin yanıt vereceği kısım burasıdır. Oluşturulan yanıtı almak için API yanıtını işleyin.
Adım 3: Sonuçları alın ve doğrulayın
Oluşturulan yanıtı almak için API yanıtını işleyin. İşlemden sonra API, görev durumunu ve çıktı verilerini döndürür.

