Home/Models/Aliyun/qwen3.5-397b-a17b
Q

qwen3.5-397b-a17b

Giriş:$0.48/M
Çıktı:$2.88/M
Qwen3.5 serisi 397B-A17B yerel görsel-dil modeli, doğrusal bir dikkat mekanizmasını seyrek bir uzmanlar karışımı modeliyle entegre eden hibrit bir mimari üzerine inşa edilmiştir ve daha yüksek çıkarım verimliliği sağlamaktadır.
Yeni
Ticari kullanım
Playground
Genel Bakış
Özellikler
Fiyatlandırma
API

Qwen3.5-397B-A17B'nin teknik özellikleri

ÖğeQwen3.5-397B-A17B (açık ağırlıklarla sonradan eğitilmiş)
Model ailesiQwen3.5 (Tongyi Qwen serisi, Alibaba)
MimariHibrit Mixture-of-Experts (MoE) + Gated DeltaNet; erken birleştirme ile çok modlu eğitim
Toplam parametre sayısı~397 milyar (toplam)
Aktif parametreler (A17B)~17 milyar token başına aktif (seyrek yönlendirme)
Girdi türleriMetin, Görüntü, Video (çok modlu erken birleştirme)
Çıktı türleriMetin (sohbet, kod, RAG çıktıları), görüntüden metne, çok modlu yanıtlar
Yerel bağlam penceresi262,144 token (yerel ISL)
Genişletilebilir bağlamYaRN/ RoPE ölçekleme ile ~1,010,000 token'a kadar (platforma bağlı)
Maksimum çıktı tokenÇerçeve/sunucuya bağlı (kılavuzlarda örnekler 81,920–131,072 gösteriyor)
Diller200+ dil ve lehçe
Yayın tarihiFebruary 16, 2026 (open-weight release)
LisansApache‑2.0 (Hugging Face / ModelScope üzerinde açık ağırlıklar)

Qwen3.5-397B-A17B nedir

Qwen3.5-397B-A17B, Alibaba’nın Qwen3.5 ailesindeki ilk açık ağırlık sürümüdür: erken birleştirme görsel‑dil hedefleriyle eğitilmiş, ajan temelli iş akışları için optimize edilmiş, büyük, çok modlu mixture‑of‑experts temel model. Model, seyrek yönlendirme kullanarak (“A17B” son eki) 397B‑parametreli mimarinin tam kapasitesini açığa çıkarır ve token başına yalnızca ~17B parametreyi aktif tutarak bilgi kapasitesi ile çıkarım verimliliği arasında denge sağlar.

Bu sürüm, uzun bağlam akıl yürütme, görsel anlama ve alma‑destekli/ajan temelli uygulamalar için açık, dağıtılabilir ve çok modlu bir temel modele ihtiyaç duyan araştırmacılar ve mühendislik ekipleri için tasarlanmıştır.


Qwen3.5-397B-A17B'nin başlıca özellikleri

  • Aktif parametre verimliliğine sahip seyrek MoE: Büyük küresel kapasite (397B) ve token başına etkinlik 17B yoğun modele kıyaslanabilir; bilgi çeşitliliğini korurken token başına FLOPS’u düşürür.
  • Yerel çok modluluk (erken birleştirme): Metin, görüntü ve videoyu tekleştirilmiş belirteçleme ve kodlayıcı stratejisiyle ele alacak şekilde eğitilmiştir; çapraz‑mod akıl yürütmeyi destekler.
  • Çok uzun bağlam desteği: Yerel girdi dizi uzunluğu 262K token ve RoPE/YARN ölçekleme kullanılarak ~1M+ token’a genişletmek için belgelendirilmiş yollar; alma ve uzun‑belge ardışıkları için uygundur.
  • Düşünme modu ve ajan araçları: Dahili akıl yürütme izlerini ve ajan temelli yürütme desenini destekler; örnekler arasında araç çağrılarını etkinleştirme ve kod yorumlayıcı entegrasyonu bulunur.
  • Açık ağırlık ve geniş uyumluluk: Apache‑2.0 altında Hugging Face ve ModelScope’da yayınlanır; Transformers, vLLM, SGLang ve topluluk çerçeveleri için birinci taraf entegrasyon kılavuzları mevcuttur.
  • Kurumsal kullanıma uygun dil kapsamı: Kapsamlı çok dilli eğitim (200+ dil) ve ölçekli dağıtım için talimatlar ve reçeteler.

Qwen3.5-397B-A17B vs Seçili modeller

ModelBağlam penceresi (yerel)Güçlü yönTipik ödünler
Qwen3.5-397B-A17B262K (yerel)Çok modlu MoE, açık ağırlıklar, 397B kapasite ve 17B aktifBüyük model artifaktları; tam performans için dağıtık barındırma gerekir
GPT-5.2 (temsilî kapalı)~400K (bazı varyantlar için raporlanmıştır)Yüksek tek model yoğun akıl yürütme doğruluğuKapalı ağırlıklar, ölçekte daha yüksek çıkarım maliyeti
LLaMA‑stil yoğun 70B~128K (değişir)Daha basit çıkarım yığını, yoğun çalışma zamanları için daha düşük VRAMMoE’nin küresel bilgisine kıyasla daha az parametre kapasitesi

Bilinen sınırlamalar ve operasyonel hususlar

  • Bellek ayak izi: Seyrek MoE yine büyük ağırlık dosyalarının depolanmasını gerektirir; barındırma, 17B yoğun bir klona kıyasla önemli depolama ve aygıt belleği ister.
  • Mühendislik karmaşıklığı: Optimum verim için dikkatli paralelleştirme (tensor/pipeline) ve vLLM veya SGLang gibi çerçeveler gerekir; saf tek GPU barındırma pratik değildir.
  • Token ekonomisi: Token başına hesaplama azaltılmış olsa da, çok uzun bağlamlar I/O’yu, KV önbellek boyutunu ve yönetilen sağlayıcılar için faturalamayı artırır.
  • Güvenlik ve koruma mekanizmaları: Açık ağırlıklar esnekliği artırır ancak güvenlik filtreleme, izleme ve dağıtım korumalarının sorumluluğunu operatöre kaydırır.

Temsili kullanım durumları

  1. Araştırma ve model analizi: Açık ağırlıklar tekrarlanabilir araştırmayı ve topluluk odaklı değerlendirmeyi mümkün kılar.
  2. Yerinde (on‑premise) çok modlu hizmetler: Veri yerleşimi gerektiren işletmeler, görsel+metin iş yüklerini yerel olarak dağıtabilir ve çalıştırabilir.
  3. RAG ve uzun‑belge ardışıkları: Yerel uzun bağlam desteği, büyük derlemeler üzerinde tek geçişli akıl yürütmeye yardımcı olur.
  4. Kod zekası ve ajan araçları: Monorepo’ları analiz edin, yamalar oluşturun ve denetimli ortamlarda ajan temelli araç çağrısı döngülerini çalıştırın.
  5. Çok dilli uygulamalar: Küresel ürünler için yüksek kapsama sahip dil desteği.

Qwen3.5-397B-A17B’ye nasıl erişilir ve entegre edilir

Adım 1: API Anahtarı için Kaydolun

cometapi.com adresine giriş yapın. Henüz kullanıcımız değilseniz lütfen önce kayıt olun. CometAPI console hesabınıza giriş yapın. Arayüzün erişim kimlik bilgisi API anahtarını edinin. Kişisel merkezde API token bölümünde “Add Token”e tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.

Adım 2: Qwen3.5-397B-A17B API’sine İstek Gönderin

API isteğini göndermek için “Qwen3.5-397B-A17B” uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanından alınır. Web sitemiz ayrıca kolaylığınız için Apifox testi sağlar. Hesabınızdaki gerçek CometAPI anahtarınız ile <YOUR_API_KEY> öğesini değiştirin. Nerede çağrılır: Chat biçimi.

Sorunuzu veya isteğinizi içerik alanına ekleyin—modelin yanıtlayacağı şey budur. Üretilen yanıtı almak için API yanıtını işleyin.

Adım 3: Sonuçları Alın ve Doğrulayın

Üretilen yanıtı almak için API yanıtını işleyin. İşlemeden sonra, API görev durumunu ve çıktı verilerini döndürür.

SSS

Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

Yes. The Qwen3.5-397B-A17B weights are released under Apache-2.0 on Hugging Face and ModelScope, and the project provides serving recipes for Transformers, vLLM, and SGLang.

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

A17B indicates the model's sparse routing design uses roughly 17 billion active parameters per token (active experts), while the global model capacity is ~397 billion parameters.

What is the native context window and can I extend it for very long documents?

The model ships with a native input sequence length of 262,144 tokens and includes documented methods to extend context to ~1,010,000 tokens via YaRN/RoPE scaling, depending on serving framework.

Which input modalities does Qwen3.5-397B-A17B support?

It is a unified vision-language model trained with early-fusion; supported inputs include text, images, and video tokens for multimodal reasoning and generation.

How does inference efficiency compare to a 17B dense model?

Per-token inference compute is similar to 17B dense-class models thanks to sparse MoE routing, but model artifacts and memory requirements are larger because full weights must be stored and distributed across devices.

qwen3.5-397b-a17b için Özellikler

qwen3.5-397b-a17b'in performansı ve kullanılabilirliği artırmak için tasarlanmış temel özelliklerini keşfedin. Bu yeteneklerin projelerinize nasıl fayda sağlayabileceğini ve kullanıcı deneyimini nasıl geliştirebileceğini öğrenin.

qwen3.5-397b-a17b için Fiyatlandırma

qwen3.5-397b-a17b için çeşitli bütçelere ve kullanım ihtiyaçlarına uygun rekabetçi fiyatlandırmayı keşfedin. Esnek planlarımız sadece kullandığınız kadar ödeme yapmanızı sağlar ve ihtiyaçlarınız büyüdükçe kolayca ölçeklendirme imkanı sunar. qwen3.5-397b-a17b'in maliyetleri yönetilebilir tutarken projelerinizi nasıl geliştirebileceğini keşfedin.
Comet Fiyatı (USD / M Tokens)Resmi Fiyat (USD / M Tokens)İndirim
Giriş:$0.48/M
Çıktı:$2.88/M
Giriş:$0.6/M
Çıktı:$3.6/M
-20%

qwen3.5-397b-a17b için örnek kod ve API

qwen3.5-397b-a17b için kapsamlı örnek kodlara ve API kaynaklarına erişerek entegrasyon sürecinizi kolaylaştırın. Ayrıntılı dokümantasyonumuz adım adım rehberlik sağlayarak projelerinizde qwen3.5-397b-a17b'in tüm potansiyelinden yararlanmanıza yardımcı olur.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="qwen3.5-397b-a17b",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

Daha Fazla Model