Qwen3: Apa itu & Cara Menggunakannya

CometAPI
AnnaApr 29, 2025
Qwen3: Apa itu & Cara Menggunakannya

Pada bulan April 2025, Alibaba Cloud meluncurkan Qwen3, versi terbaru dalam rangkaian model bahasa besar (LLM) Qwen. Sebagai kemajuan signifikan dalam bidang kecerdasan buatan, Qwen3 menunjukkan kemampuan luar biasa dalam pemahaman bahasa, penalaran, pemrosesan multimoda, dan efisiensi komputasi. Model ini mendukung 119 bahasa, dilatih pada kumpulan data 36 triliun token, dan menawarkan berbagai ukuran model mulai dari 0.6 miliar hingga 235 miliar parameter. Artikel ini memberikan eksplorasi mendalam tentang definisi, fitur, metode penggunaan, pendekatan akses, perbandingan dengan model lain, dan dampak potensialnya pada domain AI, yang bertujuan untuk menjadi referensi komprehensif bagi pengembang, peneliti, dan perusahaan.

Apa itu Qwen3?

Qwen3 adalah serangkaian model bahasa besar yang dirancang untuk memahami dan menghasilkan teks mirip manusia, yang cocok untuk berbagai skenario mulai dari percakapan sehari-hari hingga tugas penalaran yang rumit. Ini adalah generasi ketiga dalam seri Qwen yang dikembangkan oleh Alibaba Cloud, setelah peluncuran Qwen pada tahun 2023 dan Qwen2 pada tahun 2024, yang memperkenalkan peningkatan dalam kinerja dan fungsionalitas.

Sejarah Singkat Seri Qwen

Seri Qwen dimulai pada April 2023 dengan peluncuran model Qwen, yang awalnya diberi nama “Tongyi Qianwen,” berdasarkan arsitektur Llama milik Meta AI. Setelah mendapat persetujuan dari pemerintah Tiongkok pada September 2023, Qwen resmi dirilis ke publik. Pada Desember 2023, model Qwen 72B dan 1.8B dijadikan open-source, diikuti dengan peluncuran Qwen2 pada Juni 2024, yang mengadopsi arsitektur Mixture of Experts (MoE). Qwen3, yang diperkenalkan pada April 2025, menggabungkan kemampuan penalaran hybrid dan fungsionalitas multimodal, menjadikannya versi tercanggih dalam seri ini.

Fitur Qwen3

Qwen3 menawarkan serangkaian fitur inovatif yang membedakannya dalam lanskap model AI global:

Dukungan multibahasa

Qwen3 mendukung 119 bahasa, yang mencakup sistem bahasa global utama. Hal ini menjadikannya pilihan ideal untuk aplikasi lintas budaya dan multibahasa, seperti dukungan pelanggan internasional dan pembuatan konten multibahasa.

Data Pelatihan Skala Besar

Kumpulan data pelatihan Qwen3 terdiri dari hampir 36 triliun token, yang setara dengan sekitar 270 miliar kata. Kumpulan data ini mencakup berbagai macam konten, seperti buku teks, pasangan pertanyaan dan jawaban, potongan kode, dan konten yang dihasilkan AI, terutama dalam bahasa Mandarin dan Inggris. Skala ini memastikan kinerjanya yang sangat baik dalam pemahaman dan pembuatan bahasa.

Ukuran Model Beragam

Qwen3 menawarkan berbagai ukuran model mulai dari 0.6 miliar hingga 235 miliar parameter:

  • Model Kecil (0.6B, 1.7B): Cocok untuk aplikasi ringan, mampu berjalan pada perangkat seperti telepon pintar.
  • Model Sedang (4B, 8B, 14B, 32B): Menyeimbangkan kinerja dengan kebutuhan sumber daya, berlaku untuk sebagian besar skenario pengembangan.
  • Model Besar (235B): Memberikan kinerja tingkat atas untuk tugas tingkat perusahaan.
Model NamaUkuran ParameterJendela Konteks (token)Skenario yang Berlaku
Qwen3-0.6B0.6 miliar32,768Perangkat seluler, aplikasi ringan
Qwen3-1.7B1.7 miliar32,768Sistem tertanam, penalaran cepat
Qwen3-4B4 miliar131,072Proyek kecil hingga menengah, penelitian
Qwen3-8B8 miliar131,072Aplikasi umum, pengembangan
Qwen3-32B32 miliar131,072Tugas berkinerja tinggi, aplikasi perusahaan
Qwen3-235B-A22B235 miliar131,072Performa tingkat atas, penalaran kompleks (tidak tersedia untuk umum)

Kemampuan Penalaran Hibrida

Qwen3 memperkenalkan fitur “hybrid reasoning” yang memungkinkan model untuk bernalar selangkah demi selangkah sebelum memberikan jawaban atas pertanyaan yang rumit. Kemampuan ini khususnya menonjol dalam penalaran logis, masalah matematika, dan tugas pemrograman. Pengguna dapat mengaktifkan atau menonaktifkan mode ini melalui pengaturan (misalnya, enable_thinking=True).

Model Campuran Pakar (MoE)

Qwen3 mencakup model Mixture of Experts, seperti Qwen3-30B-A3B (30 miliar parameter, 3 miliar aktif) dan Qwen3-235B-A22B (235 miliar parameter, 22 miliar aktif). Model-model ini mempercepat inferensi dengan hanya mengaktifkan sebagian kecil parameter sambil mempertahankan kinerja tinggi, sehingga sangat cocok untuk penerapan skala besar.

Batas Token Diperluas

Beberapa model Qwen3 mendukung jendela konteks hingga 131,072 token (model 4B dan di atasnya), peningkatan signifikan dari 2 token milik Qwen32,768. Peningkatan ini memungkinkan model untuk menangani dialog yang lebih panjang dan tugas pembuatan teks yang lebih kompleks.

Qwen3

Benchmark Qwen 3

Model ini menunjukkan kemahiran dalam pembuatan kode, debugging, dan pemecahan masalah matematika, menjadikannya alat yang berharga untuk pengembangan perangkat lunak dan analisis data.

Qwen3: Apa itu & Cara Menggunakannya

Cara Menggunakan Qwen3

Aplikasi

Fleksibilitas Qwen3 membuatnya cocok untuk berbagai skenario:

  • Chatbots dan Asisten Virtual: Memberikan respons yang alami dan sadar konteks untuk dukungan pelanggan dan aplikasi asisten pribadi.
  • Pembuatan Konten: Hasilkan artikel, cerita, kode, dan konten kreatif atau teknis lainnya.
  • Analisis data: Membantu dalam menafsirkan dan meringkas kumpulan data besar untuk penelitian dan intelijen bisnis.
  • Alat Pendidikan: Bantu siswa dengan pekerjaan rumah, penjelasan, dan pengalaman belajar yang dipersonalisasi.
  • Penelitian ilmiah: Mendukung tinjauan pustaka, pembuatan hipotesis, dan pemecahan masalah ilmiah.

Integrasi Proyek

Pengembang dapat mengintegrasikan Qwen3 ke dalam proyek mereka menggunakan kerangka kerja dan alat berikut:

  • Transformer: Membutuhkan transformers>=4.51.0Contoh potongan kode:
  from transformers import AutoModelForCausalLM, AutoTokenizer
  model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen3-8B")
  tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen3-8B")
  inputs = tokenizer("Hello, how can I assist you?", return_tensors="pt")
  outputs = model.generate(**inputs, enable_thinking=True)
  print(tokenizer.decode(outputs))

Pengguna dapat mengaktifkan mode penalaran dengan enable_thinking=True atau mengendalikannya menggunakan /think dan /nothink.

  • llama.cpp: Membutuhkan llama.cpp>=b5092Contoh baris perintah:
  ./llama-cli -hf Qwen/Qwen3-8B-GGUF:Q8_0 --jinja --color -ngl 99 -fa -sm row --temp 0.6 --top-k 20 --top-p 0.95 --min-p 0 -c 40960 -n 32768 --no-context-shift
  • Ollama: Membutuhkan Ollama v0.6.6 atau lebih tinggi. Jalankan perintah:
  ollama run qwen3:8b

Mendukung parameter seperti num_ctx 40960 dan num_predict 32768.

  • Opsi Penerapan:
  • SGLang: Membutuhkan sglang>=0.4.6.post1Perintah peluncuran: python -m sglang.launch_server --model-path Qwen/Qwen3-8B --port 30000 --reasoning-parser qwen3
  • vLLM: Membutuhkan vllm>=0.8.5. Perintah servis: vllm serve Qwen/Qwen3-8B --port 8000 --enable-reasoning --reasoning-parser deepseek_r1
  • PikiranIE: Mendukung Ascend NPU; kunjungi Modelers untuk detailnya.

Penggunaan Alat

Qwen-Agent mendukung interaksi Qwen3 dengan alat dan API eksternal, cocok untuk tugas yang memerlukan akses data dinamis. Fitur ini juga didukung oleh SGLang, vLLM, Transformers, llama.cpp, dan Ollama.

Mencari setelan

Qwen3 dapat disempurnakan menggunakan kerangka kerja seperti Axolotl, UnSloth, Swift, dan Llama-Factory, yang mendukung teknik seperti Supervised Fine-Tuning (SFT), Direct Preference Optimization (DPO), dan Group Robust Preference Optimization (GRPO).

Kesimpulan

Qwen3 merupakan terobosan dalam bidang model bahasa besar, yang menawarkan fungsionalitas, fleksibilitas, dan aksesibilitas yang lebih baik. Dengan dukungan multibahasa, penalaran hibrida, dan versi khusus untuk tugas penglihatan, matematika, dan audio, Qwen3 memposisikan dirinya sebagai pemain kunci dalam bidang AI. Performanya yang kompetitif dalam tolok ukur seperti Codeforces, AIME, dan BFCL, beserta ketersediaan sumber terbukanya, menjadikannya pilihan ideal bagi pengembang, peneliti, dan perusahaan. Seiring kemajuan teknologi AI, Qwen3 menandakan langkah penting menuju terciptanya sistem cerdas yang mampu memahami, bernalar, dan berinteraksi dengan dunia dengan cara yang semakin canggih.

Mulai

Pengembang dapat mengakses Qwen 3 API melalui API KometUntuk memulai, jelajahi kemampuan model di Playground dan konsultasikan Panduan API untuk petunjuk terperinci. Perhatikan bahwa beberapa pengembang mungkin perlu memverifikasi organisasi mereka sebelum menggunakan model tersebut.

Baca Selengkapnya

500+ Model dalam Satu API

Diskon hingga 20%