| Alan | Değer / Notlar |
|---|---|
| Model adı | Qwen3-VL-32B (Instruct / Thinking varyantları mevcut). |
| Model ailesi / mimarisi | Qwen3-VL — ViT tarzı görsel kodlayıcı + LLM füzyon katmanlarına sahip bir görsel-dil dönüştürücüsü; çok modlu omurga. |
| Parametre sayısı | “32B” sınıfı olarak adlandırılır (genel kaynaklar, yoğun 32B varyantı için yaklaşık ~32–33B parametre ölçeğini listeler). |
| Varyantlar | Yoğun: 2B / 4B / 8B / 32B; MoE: 30B-A3B, 235B-A22B (daha büyük MoE varyantları da yayımlandı). |
| Yerel bağlam uzunluğu | 256K token (yerel, iç içe geçmiş çok modlu bağlam), bazı dağıtımlarda ~1M token’a kadar etkinleştiren mühendislik uzatma modları/teknikleri ile birlikte. |
| Girdi modaliteleri | Metin + görüntüler (yüksek çözünürlüklü) + uzun video (zamansal modelleme/zaman damgaları) + OCR (çok dilli). |
| Çıktı modaliteleri | Metin (doğal dil), yapılandırılmış çıkarım (OCR/tablo/grafik çıkarımı), video için zaman damgaları/bölüm özetleri; araç kullanımı / ajan çağrılarını destekler. |
Qwen3-VL-32B nedir
Qwen3-VL-32B, Alibaba’nın Qwen3 görsel-dil model ailesindeki 32 milyar parametreli yoğun varyanttır. Birleşik algılama, uzun bağlamlı akıl yürütme, güçlü OCR ve görsel yerelleştirme ile ajan/araçlaştırılmış iş akışları için tasarlanmış çok modlu (görüntü + dil + video) bir dönüştürücüdür.
Ana özellikler
- Büyük çok modlu bağlam — Uzun belgeler ve uzun videolar için etkili bağlamı ~1M token’a genişletmeye yönelik mimari kancalar / araçlarla birlikte, 256K iç içe geçmiş token’ı (metin + görüntü referansları) yerel olarak destekler; belgeler arası ve ortamlar arası erişim ile akıl yürütmeyi mümkün kılar.
- Birleşik görsel + dil ön eğitimi — Erken aşamalardan itibaren ortak eğitim, görsel girdilere dilsel bağlamayı iyileştirerek daha güçlü çapraz modal temsillere yol açar (VQA, OCR ve diyagram akıl yürütmesi için faydalıdır).
- Video anlama ve zamansal hizalama — Zaman damgalı metin hizalaması ve uzun video akışlarını ince zamansal ayrıntı düzeyinde özetleme veya dizinleme yeteneği ile yerel video işleme.
- Çok dilli OCR ve belge ayrıştırma — Birçok dilde yüksek kaliteli OCR ve tablo ile grafik çıkarımı kullanım senaryoları için sağlam belge/düzen anlama.
- Instruct ve Thinking varyantları — Uygulama ihtiyaçlarına uyacak şekilde komut uyumluluğu (Instruct) ile derin içsel düşünce zinciri / akıl yürütme verimi (Thinking) için optimize edilmiş ayrı sürümler (güvenlik/özlülük ile adım adım akıl yürütme).
- Ölçeklendirme için MoE seçenekleri — Aşırı kapasite/kapsama için, uzman yönlendirmesi yoluyla çıkarım hesaplamasını kontrol etmeye çalışırken temsil kapasitesini artıran MoE varyantları (30B-A3B, 235B-A22B) vardır.
Qwen3-VL-32B’nin iyi uygun olduğu alanlar
- Büyük ölçekte belge ve form çıkarımı — diller arasında güçlü OCR, tablo ve grafik çıkarımı ve uzun raporların anlamsal özetlenmesi.
- Karmaşık görüntüler için görsel soru yanıtlama — görsel kanıtı adım adım metinsel akıl yürütmeyle birleştirmeyi gerektiren tıbbi/mühendislik diyagramları, açıklamalı fotoğraflar veya görsel sorun giderme.
- Uzun video dizinleme ve özetleme — saatler süren kayıtlar veya gözetim/video arşivleri için aranabilir dökümler, saniye düzeyinde dizinleme ve özetler üretme.
- Çok modlu ajanlar / araç zincirleri — görsel yüklerin çıkarılmasını gerektiren araç çağrılarını düzenleme (ör. OCR→arama→eylem), algı ve eylemi birleştiren ajan çerçeveleri için uygundur.
- STEM görsel akıl yürütme ve özel ders araçları — görüntü/grafikler ve metinsel açıklamayı birleştiren diyagramatik matematik ve adım adım çözümler (eğitsel ortamlarda çıktılarının doğruluk açısından doğrulanması gerektiği unutulmamalıdır).
Qwen3 VL-32B API’sine nasıl erişilir
Adım 1: API Anahtarı için Kaydolun
cometapi.com’a giriş yapın. Henüz kullanıcımız değilseniz, lütfen önce kayıt olun. CometAPI konsolunuza giriş yapın. Arayüzün erişim kimlik bilgisi olan API anahtarını alın. Kişisel merkezde API token bölümünde “Add Token” seçeneğine tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.
Adım 2: Qwen3 VL-32B API’sine İstek Gönderin
API isteğini göndermek ve istek gövdesini ayarlamak için “Qwen3-VL-32B” uç noktasını seçin. İstek yöntemi ve istek gövdesi web sitemizin API belgelerinden alınır. Web sitemiz ayrıca kolaylığınız için Apifox testi de sağlar. <YOUR_API_KEY> kısmını hesabınızdaki gerçek CometAPI anahtarınızla değiştirin. temel url Chat adresidir
Sorunuzu veya isteğinizi içerik alanına ekleyin — modelin yanıtlayacağı kısım burasıdır. Oluşturulan yanıtı almak için API yanıtını işleyin.
Adım 3: Sonuçları Alın ve Doğrulayın
Oluşturulan yanıtı almak için API yanıtını işleyin. İşlemeden sonra API, görev durumunu ve çıktı verilerini döndürür.