Qwen3: Nó là gì và cách sử dụng

CometAPI
AnnaApr 29, 2025
Qwen3: Nó là gì và cách sử dụng

Vào tháng 2025 năm 3, Alibaba Cloud đã ra mắt Qwen3, phiên bản mới nhất trong loạt Qwen của các mô hình ngôn ngữ lớn (LLM). Là một bước tiến đáng kể trong lĩnh vực trí tuệ nhân tạo, Qwen119 chứng minh khả năng vượt trội trong việc hiểu ngôn ngữ, lập luận, xử lý đa phương thức và hiệu quả tính toán. Mô hình này hỗ trợ 36 ngôn ngữ, được đào tạo trên tập dữ liệu gồm 0.6 nghìn tỷ mã thông báo và cung cấp nhiều kích thước mô hình khác nhau, từ 235 tỷ đến 3 tỷ tham số. Bài viết này cung cấp một cuộc khám phá sâu sắc về định nghĩa, tính năng, phương pháp sử dụng, cách tiếp cận truy cập, so sánh với các mô hình khác và tác động tiềm tàng của QwenXNUMX đối với lĩnh vực AI, nhằm mục đích phục vụ như một tài liệu tham khảo toàn diện cho các nhà phát triển, nhà nghiên cứu và doanh nghiệp.

Qwen3 là gì?

Qwen3 là một loạt các mô hình ngôn ngữ lớn được thiết kế để hiểu và tạo ra văn bản giống con người, phù hợp với nhiều tình huống từ cuộc trò chuyện hàng ngày đến các nhiệm vụ lý luận phức tạp. Đây là thế hệ thứ ba trong loạt Qwen do Alibaba Cloud phát triển, sau khi phát hành Qwen vào năm 2023 và Qwen2 vào năm 2024, giới thiệu những cải tiến về hiệu suất và chức năng.

Lịch sử tóm tắt của Qwen Series

Dòng Qwen bắt đầu vào tháng 2023 năm 2023 với việc phát hành mô hình Qwen, ban đầu có tên là "Tongyi Qianwen", dựa trên kiến ​​trúc Llama của Meta AI. Sau khi nhận được sự chấp thuận từ chính phủ Trung Quốc vào tháng 2023 năm 72, Qwen chính thức được phát hành cho công chúng. Vào tháng 1.8 năm 2, các mô hình Qwen 2024B và 3B đã được mở mã nguồn, tiếp theo là sự ra mắt của Qwen2025 vào tháng XNUMX năm XNUMX, áp dụng kiến ​​trúc Hỗn hợp các chuyên gia (MoE). QwenXNUMX, được giới thiệu vào tháng XNUMX năm XNUMX, kết hợp các khả năng suy luận lai và các chức năng đa phương thức, khiến nó trở thành phiên bản tiên tiến nhất trong dòng sản phẩm.

Tính năng của Qwen3

Qwen3 cung cấp một loạt các tính năng cải tiến giúp nó trở nên nổi bật trong bối cảnh mô hình AI toàn cầu:

Hỗ trợ đa ngôn ngữ

Qwen3 hỗ trợ 119 ngôn ngữ, bao gồm các hệ thống ngôn ngữ toàn cầu chính. Điều này làm cho nó trở thành lựa chọn lý tưởng cho các ứng dụng đa văn hóa và đa ngôn ngữ, chẳng hạn như hỗ trợ khách hàng quốc tế và tạo nội dung đa ngôn ngữ.

Dữ liệu đào tạo quy mô lớn

Bộ dữ liệu đào tạo Qwen3 bao gồm gần 36 nghìn tỷ token, tương đương với khoảng 270 tỷ từ. Nó bao gồm nhiều nội dung, chẳng hạn như sách giáo khoa, cặp câu hỏi và câu trả lời, đoạn mã và nội dung do AI tạo ra, chủ yếu bằng tiếng Trung và tiếng Anh. Quy mô này đảm bảo hiệu suất tuyệt vời của nó trong việc hiểu và tạo ngôn ngữ.

Kích cỡ mẫu đa dạng

Qwen3 cung cấp nhiều kích thước mô hình khác nhau, từ 0.6 tỷ đến 235 tỷ tham số:

  • Mô hình nhỏ (0.6B, 1.7B): Phù hợp cho các ứng dụng nhẹ, có khả năng chạy trên các thiết bị như điện thoại thông minh.
  • Các mẫu trung bình (4B, 8B, 14B, 32B): Cân bằng hiệu suất với nhu cầu tài nguyên, áp dụng cho hầu hết các tình huống phát triển.
  • Mô hình lớn (235B): Cung cấp hiệu suất hàng đầu cho các tác vụ cấp doanh nghiệp.
Tên ModelKích thước tham sốCửa sổ ngữ cảnh (mã thông báo)Các tình huống có thể áp dụng
Qwen3-0.6B0.6 tỷ32,768Thiết bị di động, ứng dụng nhẹ
Qwen3-1.7B1.7 tỷ32,768Hệ thống nhúng, suy luận nhanh
Qwen3-4B4 tỷ131,072Các dự án vừa và nhỏ, nghiên cứu
Qwen3-8B8 tỷ131,072Ứng dụng chung, phát triển
Qwen3-32B32 tỷ131,072Nhiệm vụ hiệu suất cao, ứng dụng doanh nghiệp
Qwen3-235B-A22B235 tỷ131,072Hiệu suất hàng đầu, lý luận phức tạp (không công khai)

Khả năng suy luận lai

Qwen3 giới thiệu tính năng “lý luận lai” cho phép mô hình lý luận từng bước trước khi đưa ra câu trả lời cho các câu hỏi phức tạp. Khả năng này đặc biệt nổi bật trong lý luận logic, các bài toán toán học và các nhiệm vụ lập trình. Người dùng có thể bật hoặc tắt chế độ này thông qua cài đặt (ví dụ: enable_thinking=True).

Mô hình hỗn hợp chuyên gia (MoE)

Qwen3 bao gồm các mô hình Mixture of Experts, chẳng hạn như Qwen3-30B-A3B (30 tỷ tham số, 3 tỷ tham số đang hoạt động) và Qwen3-235B-A22B (235 tỷ tham số, 22 tỷ tham số đang hoạt động). Các mô hình này tăng tốc suy luận bằng cách chỉ kích hoạt một tập hợp con các tham số trong khi vẫn duy trì hiệu suất cao, khiến chúng phù hợp để triển khai trên quy mô lớn.

Giới hạn mã thông báo mở rộng

Một số mô hình Qwen3 hỗ trợ cửa sổ ngữ cảnh lên đến 131,072 mã thông báo (mô hình 4B trở lên), tăng đáng kể so với 2 mã thông báo của Qwen32,768. Cải tiến này cho phép mô hình xử lý các hộp thoại dài hơn và các tác vụ tạo văn bản phức tạp hơn.

Qwen3

Tiêu chuẩn Qwen 3

Mô hình này chứng minh khả năng tạo mã, gỡ lỗi và giải quyết vấn đề toán học, khiến nó trở thành một công cụ hữu ích cho phát triển phần mềm và phân tích dữ liệu.

Qwen3: Nó là gì và cách sử dụng

Cách sử dụng Qwen3

Ứng dụng

Tính linh hoạt của Qwen3 làm cho nó phù hợp với nhiều tình huống khác nhau:

  • Chatbots và Trợ lý ảo: Cung cấp phản hồi tự nhiên, phù hợp với ngữ cảnh cho các ứng dụng hỗ trợ khách hàng và trợ lý cá nhân.
  • Tạo nội dung: Tạo bài viết, câu chuyện, mã và nội dung sáng tạo hoặc kỹ thuật khác.
  • Phân tích dữ liệu: Hỗ trợ giải thích và tóm tắt các tập dữ liệu lớn phục vụ nghiên cứu và kinh doanh thông minh.
  • Công cụ giáo dục: Giúp học sinh làm bài tập về nhà, giải thích và trải nghiệm học tập được cá nhân hóa.
  • Nghiên cứu khoa học: Hỗ trợ việc xem xét tài liệu, đưa ra giả thuyết và giải quyết vấn đề khoa học.

Tích hợp dự án

Các nhà phát triển có thể tích hợp Qwen3 vào dự án của mình bằng cách sử dụng các khuôn khổ và công cụ sau:

  • Máy biến áp: Yêu cầu transformers>=4.51.0. Đoạn mã ví dụ:
  from transformers import AutoModelForCausalLM, AutoTokenizer
  model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen3-8B")
  tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen3-8B")
  inputs = tokenizer("Hello, how can I assist you?", return_tensors="pt")
  outputs = model.generate(**inputs, enable_thinking=True)
  print(tokenizer.decode(outputs))

Người dùng có thể kích hoạt chế độ lý luận với enable_thinking=True hoặc kiểm soát nó bằng cách sử dụng /think/nothink.

  • llama.cpp: Yêu cầu llama.cpp>=b5092. Ví dụ dòng lệnh:
  ./llama-cli -hf Qwen/Qwen3-8B-GGUF:Q8_0 --jinja --color -ngl 99 -fa -sm row --temp 0.6 --top-k 20 --top-p 0.95 --min-p 0 -c 40960 -n 32768 --no-context-shift
  • Olama: Yêu cầu Ollama v0.6.6 hoặc cao hơn. Chạy lệnh:
  ollama run qwen3:8b

Hỗ trợ các thông số như num_ctx 40960num_predict 32768.

  • Tùy chọn triển khai:
  • Ngôn ngữ: Yêu cầu sglang>=0.4.6.post1. Lệnh khởi chạy: python -m sglang.launch_server --model-path Qwen/Qwen3-8B --port 30000 --reasoning-parser qwen3
  • vLLM: Yêu cầu vllm>=0.8.5. Lệnh phục vụ: vllm serve Qwen/Qwen3-8B --port 8000 --enable-reasoning --reasoning-parser deepseek_r1
  • Tâm trí: Hỗ trợ Ascend NPU; truy cập Modelers để biết thông tin chi tiết.

Công cụ sử dụng

Qwen-Agent hỗ trợ tương tác của Qwen3 với các công cụ và API bên ngoài, phù hợp với các tác vụ yêu cầu truy cập dữ liệu động. Tính năng này cũng được hỗ trợ bởi SGLang, vLLM, Transformers, llama.cpp và Ollama.

tinh chỉnh

Qwen3 có thể được tinh chỉnh bằng cách sử dụng các khuôn khổ như Axolotl, UnSloth, Swift và Llama-Factory, hỗ trợ các kỹ thuật như Điều chỉnh có giám sát (SFT), Tối ưu hóa sở thích trực tiếp (DPO) và Tối ưu hóa sở thích mạnh mẽ theo nhóm (GRPO).

Kết luận

Qwen3 đại diện cho một bước đột phá trong lĩnh vực mô hình ngôn ngữ lớn, cung cấp chức năng, tính linh hoạt và khả năng truy cập được cải tiến. Với khả năng hỗ trợ đa ngôn ngữ, lý luận lai và các phiên bản chuyên biệt cho các tác vụ thị giác, toán học và âm thanh, Qwen3 tự định vị mình là một nhân tố chủ chốt trong lĩnh vực AI. Hiệu suất cạnh tranh của nó trong các chuẩn mực như Codeforces, AIME và BFCL, cùng với tính khả dụng của mã nguồn mở, khiến nó trở thành lựa chọn lý tưởng cho các nhà phát triển, nhà nghiên cứu và doanh nghiệp. Khi công nghệ AI phát triển, Qwen3 đánh dấu một bước tiến quan trọng hướng tới việc tạo ra các hệ thống thông minh có khả năng hiểu, lý luận và tương tác với thế giới theo những cách ngày càng tinh vi.

Bắt đầu

Các nhà phát triển có thể truy cập Qwen 3 API thông qua Sao chổiAPI. Để bắt đầu, hãy khám phá các khả năng của mô hình trong Sân chơi và tham khảo Hướng dẫn API để biết hướng dẫn chi tiết. Lưu ý rằng một số nhà phát triển có thể cần xác minh tổ chức của họ trước khi sử dụng mô hình.

Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%