Qwen3: Nedir ve Nasıl Kullanılır

CometAPI
AnnaApr 29, 2025
Qwen3: Nedir ve Nasıl Kullanılır

Nisan 2025'te Alibaba Cloud, Qwen büyük dil modelleri (LLM) serisinin en son sürümü olan Qwen3'ü piyasaya sürdü. Yapay zeka alanında önemli bir ilerleme olarak Qwen3, dil anlama, muhakeme, çok modlu işleme ve hesaplama verimliliğinde olağanüstü yetenekler göstermektedir. Model 119 dili destekler, 36 trilyon belirteçten oluşan bir veri kümesi üzerinde eğitilmiştir ve 0.6 milyardan 235 milyar parametreye kadar çeşitli model boyutları sunar. Bu makale, Qwen3'ün tanımı, özellikleri, kullanım yöntemleri, erişim yaklaşımları, diğer modellerle karşılaştırmaları ve AI alanındaki potansiyel etkisi hakkında derinlemesine bir inceleme sunarak geliştiriciler, araştırmacılar ve işletmeler için kapsamlı bir referans görevi görmeyi amaçlamaktadır.

Qwen3 nedir?

Qwen3, günlük konuşmalardan karmaşık muhakeme görevlerine kadar çeşitli senaryolar için uygun, insan benzeri metinleri anlamak ve üretmek üzere tasarlanmış bir dizi büyük dil modelidir. Alibaba Cloud tarafından geliştirilen Qwen serisinin üçüncü neslidir ve 2023'te Qwen'in ve 2'te Qwen2024'nin yayınlanmasının ardından performans ve işlevsellikte iyileştirmeler sunmuştur.

Qwen Serisinin Kısa Tarihi

Qwen serisi, başlangıçta Meta AI'nın Llama mimarisine dayanan "Tongyi Qianwen" olarak adlandırılan Qwen modelinin piyasaya sürülmesiyle Nisan 2023'te başladı. Eylül 2023'te Çin hükümetinden onay aldıktan sonra Qwen resmi olarak halka duyuruldu. Aralık 2023'te Qwen 72B ve 1.8B modelleri açık kaynaklı hale getirildi ve ardından Haziran 2'te Uzman Karışımı (MoE) mimarisini benimseyen Qwen2024 piyasaya sürüldü. Nisan 3'te tanıtılan Qwen2025, hibrit akıl yürütme yeteneklerini ve çok modlu işlevleri bünyesinde barındırarak onu serideki en gelişmiş sürüm haline getirdi.

Qwen3'ün Özellikleri

Qwen3, küresel AI model manzarasında onu farklılaştıran bir dizi yenilikçi özellik sunuyor:

Dilde Destek

Qwen3, başlıca küresel dil sistemlerini kapsayan 119 dili destekler. Bu, onu uluslararası müşteri desteği ve çok dilli içerik üretimi gibi kültürler arası ve çok dilli uygulamalar için ideal bir seçim haline getirir.

Büyük Ölçekli Eğitim Verileri

Qwen3 eğitim veri seti yaklaşık 36 trilyon jetondan oluşur ve yaklaşık 270 milyar kelimeye eşittir. Ders kitapları, soru-cevap çiftleri, kod parçacıkları ve AI tarafından oluşturulan içerik gibi geniş bir içerik yelpazesi içerir, öncelikli olarak Çince ve İngilizce'dir. Bu ölçek, dil anlama ve oluşturmada mükemmel performansını garanti eder.

Çeşitli Model Boyutları

Qwen3, 0.6 milyardan 235 milyara kadar parametreye sahip çeşitli model boyutları sunar:

  • Küçük Modeller (0.6B, 1.7B): Hafif uygulamalar için uygundur, akıllı telefonlar gibi cihazlarda çalışabilir.
  • Orta Modeller (4B, 8B, 14B, 32B): Çoğu geliştirme senaryosuna uygulanabilir şekilde, kaynak ihtiyaçlarıyla performansı dengeleyin.
  • Büyük Modeller (235B): Kurumsal düzeydeki görevler için en üst düzey performansı sağlayın.
Model adıParametre BoyutuBağlam Penceresi (belirteçler)Uygulanabilir Senaryolar
Qwen3-0.6B0.6 milyar32,768Mobil cihazlar, hafif uygulamalar
Qwen3-1.7B1.7 milyar32,768Gömülü sistemler, hızlı akıl yürütme
Qwen3-4B4 milyar131,072Küçük ve orta ölçekli projeler, araştırma
Qwen3-8B8 milyar131,072Genel uygulamalar, geliştirme
Qwen3-32B32 milyar131,072Yüksek performanslı görevler, kurumsal uygulamalar
Qwen3-235B-A22B235 milyar131,072En üst düzey performans, karmaşık akıl yürütme (kamuya açık değil)

Hibrit Muhakeme Yetenekleri

Qwen3, modelin karmaşık sorulara yanıtlar vermeden önce adım adım akıl yürütmesine olanak tanıyan bir "karma akıl yürütme" özelliği sunar. Bu yetenek özellikle mantıksal akıl yürütme, matematiksel problemler ve programlama görevlerinde belirgindir. Kullanıcılar bu modu ayarlar aracılığıyla etkinleştirebilir veya devre dışı bırakabilir (örn. enable_thinking=True).

Uzmanların Karışımı (MoE) Modelleri

Qwen3, Qwen3-30B-A3B (30 milyar parametre, 3 milyar aktif) ve Qwen3-235B-A22B (235 milyar parametre, 22 milyar aktif) gibi Uzmanların Karışımı modellerini içerir. Bu modeller, yüksek performansı korurken yalnızca bir parametre alt kümesini etkinleştirerek çıkarımı hızlandırır ve bu da onları büyük ölçekli dağıtım için uygun hale getirir.

Genişletilmiş Token Limitleri

Bazı Qwen3 modelleri 131,072 token'a kadar bağlam pencerelerini destekler (4B ve üzeri modeller), Qwen2'nin 32,768 token'ına göre önemli bir artış. Bu geliştirme, modelin daha uzun diyalogları ve daha karmaşık metin oluşturma görevlerini işlemesine olanak tanır.

Qwen3

Qwen 3 Ölçütleri

Model, kod oluşturma, hata ayıklama ve matematiksel problem çözme konusunda yeterlilik gösterdiğinden yazılım geliştirme ve veri analizi için değerli bir araç haline geliyor.

Qwen3: Nedir ve Nasıl Kullanılır

Qwen3 Nasıl Kullanılır

Uygulamalar

Qwen3'ün çok yönlülüğü onu çeşitli senaryolar için uygun hale getirir:

  • Chatbot'lar ve Sanal Asistanlar: Müşteri desteği ve kişisel asistan uygulamaları için doğal, bağlam farkında yanıtlar sağlayın.
  • İçerik Üretimi: Makaleler, hikayeler, kodlar ve diğer yaratıcı veya teknik içerikler üretin.
  • Veri analizi: Araştırma ve iş zekası için büyük veri kümelerinin yorumlanmasına ve özetlenmesine yardımcı olun.
  • Eğitim Araçları: Öğrencilere ödev, açıklama ve kişiselleştirilmiş öğrenme deneyimleri konusunda yardımcı olun.
  • Bilimsel araştırma: Literatür taramasını, hipotez oluşturmayı ve bilimsel problem çözmeyi destekleyin.

Proje Entegrasyonu

Geliştiriciler, aşağıdaki çerçeveleri ve araçları kullanarak Qwen3'ü projelerine entegre edebilirler:

  • Transformers: Gerektirir transformers>=4.51.0Örnek kod parçacığı:
  from transformers import AutoModelForCausalLM, AutoTokenizer
  model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen3-8B")
  tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen3-8B")
  inputs = tokenizer("Hello, how can I assist you?", return_tensors="pt")
  outputs = model.generate(**inputs, enable_thinking=True)
  print(tokenizer.decode(outputs))

Kullanıcılar, muhakeme modunu şu şekilde etkinleştirebilir: enable_thinking=True veya kullanarak kontrol edin /think ve /nothink.

  • lama.cpp: Gerektirir llama.cpp>=b5092Komut satırı örneği:
  ./llama-cli -hf Qwen/Qwen3-8B-GGUF:Q8_0 --jinja --color -ngl 99 -fa -sm row --temp 0.6 --top-k 20 --top-p 0.95 --min-p 0 -c 40960 -n 32768 --no-context-shift
  • : Gerektirir Ollama v0.6.6 veya daha yüksek. Komutu çalıştırın:
  ollama run qwen3:8b

Şu gibi parametreleri destekler: num_ctx 40960 ve num_predict 32768.

  • Dağıtım Seçenekleri:
  • SGLang: Gerektirir sglang>=0.4.6.post1Başlatma komutu: python -m sglang.launch_server --model-path Qwen/Qwen3-8B --port 30000 --reasoning-parser qwen3
  • vLLM: Gerektirir vllm>=0.8.5. Hizmet emri: vllm serve Qwen/Qwen3-8B --port 8000 --enable-reasoning --reasoning-parser deepseek_r1
  • ZihinIE: Ascend NPU'yu destekler; ayrıntılar için Modelleyiciler sayfasını ziyaret edin.

Araç Kullanımı

Qwen-Agent, Qwen3'ün dinamik veri erişimi gerektiren görevler için uygun olan harici araçlar ve API'lerle etkileşimini destekler. Bu özellik ayrıca SGLang, vLLM, Transformers, llama.cpp ve Ollama tarafından da desteklenir.

İnce ayar

Qwen3, Denetimli İnce Ayar (SFT), Doğrudan Tercih Optimizasyonu (DPO) ve Grup Sağlam Tercih Optimizasyonu (GRPO) gibi teknikleri destekleyen Axolotl, UnSloth, Swift ve Llama-Factory gibi çerçeveler kullanılarak ince ayarlanabilir.

Sonuç

Qwen3, gelişmiş işlevsellik, çok yönlülük ve erişilebilirlik sunarak büyük dil modelleri alanında bir atılımı temsil ediyor. Çok dilli desteği, hibrit akıl yürütmesi ve görme, matematik ve ses görevleri için özel sürümleriyle Qwen3, AI alanında kilit bir oyuncu olarak konumlanıyor. Codeforces, AIME ve BFCL gibi kıyaslamalardaki rekabetçi performansı ve açık kaynaklı kullanılabilirliği, onu geliştiriciler, araştırmacılar ve işletmeler için ideal bir seçim haline getiriyor. AI teknolojisi ilerledikçe Qwen3, giderek daha karmaşık şekillerde dünyayı anlayabilen, akıl yürütebilen ve etkileşim kurabilen akıllı sistemler yaratma yolunda önemli bir adım anlamına geliyor.

Başlamak

Geliştiriciler erişebilir Qwen 3 API aracılığıyla Kuyrukluyıldız API'siBaşlamak için, Oyun Alanında modelin yeteneklerini keşfedin ve danışın API kılavuzu Ayrıntılı talimatlar için. Bazı geliştiricilerin modeli kullanmadan önce organizasyonlarını doğrulamaları gerekebileceğini unutmayın.

Devamını Oku

500+ Model Tek Bir API'de

%20'ye Varan İndirim