API Qwen 3

CometAPI
AnnaApr 29, 2025
API Qwen 3

API Qwen 3 là giao diện tương thích với OpenAI do Alibaba Cloud phát triển, cho phép các nhà phát triển tích hợp các mô hình ngôn ngữ lớn Qwen 3 tiên tiến - có sẵn trong cả kiến ​​trúc dày đặc và kiến ​​trúc hỗn hợp chuyên gia (MoE) - vào ứng dụng của họ để thực hiện các tác vụ như tạo văn bản, lập luận và hỗ trợ đa ngôn ngữ.


Tổng quan về Qwen 3

Các tính năng chính

  • Khả năng suy luận lai:Qwen 3 tích hợp cả chức năng AI thông thường và khả năng suy luận động tiên tiến, nâng cao khả năng thích ứng và hiệu quả cho các nhà phát triển.
  • khả năng mở rộng:Họ mô hình bao gồm cả mô hình dày đặc (tham số 0.6B đến 32B) và mô hình thưa thớt (30B với 3 tham số được kích hoạt, 235B với 22B tham số được kích hoạt), phục vụ cho nhiều ứng dụng khác nhau.
  • Cửa sổ ngữ cảnh mở rộng:Hầu hết các mô hình Qwen 3 đều hỗ trợ cửa sổ ngữ cảnh mã thông báo 128K, giúp xử lý các tài liệu dài và các tác vụ phức tạp dễ dàng hơn.
  • Hỗ trợ đa phương thức:Các mô hình Qwen 3 có khả năng xử lý văn bản, hình ảnh, âm thanh và video, phù hợp với nhiều ứng dụng khác nhau, bao gồm tương tác bằng giọng nói thời gian thực và phân tích dữ liệu trực quan.
  • Khả năng truy cập nguồn mở:Tất cả các mô hình Qwen 3 đều được cấp phép theo giấy phép Apache 2.0 và có sẵn thông qua các nền tảng như Hugging Face và ModelScope.

Kiến trúc kỹ thuật

Các biến thể mô hình

Qwen 3 bao gồm một loạt các mô hình để giải quyết các nhu cầu tính toán khác nhau:

  • Mô hình dày đặc: Có sẵn các kích thước tham số 0.6B, 1.7B, 4B, 8B, 14B và 32B.
  • Mô hình thưa thớt: Bao gồm mô hình 30B với 3 tham số kích hoạt và mô hình 235B với 22 tham số kích hoạt.

Kiến trúc này cho phép triển khai hiệu quả trên nhiều cấu hình phần cứng khác nhau, từ thiết bị di động đến máy chủ hiệu suất cao.

Hiểu theo ngữ cảnh

Với cửa sổ ngữ cảnh mã thông báo 128K, các mô hình Qwen 3 có thể duy trì tính nhất quán trong các tương tác mở rộng, giúp chúng thành thạo trong các tác vụ đòi hỏi sự hiểu biết sâu sắc về ngữ cảnh, chẳng hạn như tạo nội dung dạng dài và giải quyết vấn đề phức tạp.

Sự phát triển của Qwen Series

Từ Qwen đến Qwen 3

Dòng Qwen đã trải qua quá trình phát triển đáng kể:​

  • Qwen: Được giới thiệu là mô hình ngôn ngữ được đào tạo trước cơ bản, chứng minh hiệu suất vượt trội trong nhiều tác vụ khác nhau.​
  • Qwen-Chat: Các mô hình trò chuyện được tinh chỉnh bằng các kỹ thuật căn chỉnh của con người, thể hiện khả năng lập kế hoạch và sử dụng công cụ tiên tiến.​
  • Qwen2:Mở rộng bộ mô hình với các mô hình ngôn ngữ được điều chỉnh theo hướng dẫn, có phạm vi tham số từ 0.5 đến 72 tỷ. Mô hình chủ lực, Qwen2-72B, đã thể hiện hiệu suất đáng chú ý trên nhiều chuẩn mực khác nhau.
  • Qwen2.5: Giới thiệu các mô hình như Qwen2.5-Omni, có khả năng xử lý văn bản, hình ảnh, video và âm thanh, đồng thời tạo ra cả đầu ra văn bản và âm thanh.
  • Qwen 3:Phiên bản mới nhất, kết hợp khả năng suy luận kết hợp và hiệu quả được nâng cao, đánh dấu bước tiến đáng kể trong series.

Hiệu suất chuẩn

Vượt trội hơn hẳn so với các mô hình trước đó như QwQ và Qwen2.5, Qwen3 cung cấp khả năng toán học, mã hóa, lý luận thông thường, viết sáng tạo và đối thoại tương tác vượt trội. Biến thể Qwen3-30B-A3B bao gồm 30.5 tỷ tham số (3.3 tỷ được kích hoạt), 48 lớp, 128 chuyên gia (8 được kích hoạt cho mỗi tác vụ) và hỗ trợ tới 131K ngữ cảnh mã thông báo với YaRN, thiết lập một tiêu chuẩn mới trong số các mô hình nguồn mở.

  • AIME25:Qwen3 đạt 81.5 điểm, lập kỷ lục mới về mã nguồn mở.
  • LiveCodeBench: Qwen3 ghi được hơn 70 điểm, thậm chí còn tốt hơn Grok3.
  • Đấu trường khó: Qwen3 đã vượt qua OpenAl-o1 và DeepSeek-FR1 với 95.6 điểm.

Ví dụ về mã

Các nhà phát triển có thể tương tác với các mô hình Qwen 3 bằng cách sử dụng đoạn mã Python sau:

from transformers import AutoTokenizer, AutoModelForCausalLM

# Load tokenizer and model

tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-3-14B")
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-3-14B")

# Encode input prompt

input_text = "Explain the significance of hybrid reasoning in AI models."
input_ids = tokenizer.encode(input_text, return_tensors="pt")

# Generate response

output = model.generate(input_ids, max_length=200)
response = tokenizer.decode(output, skip_special_tokens=True)

print(response)

Ví dụ này trình bày cách tải mô hình Qwen 3 và tạo phản hồi cho lời nhắc nhất định bằng cách sử dụng thư viện Hugging Face Transformers.

Kết luận

Qwen 3 là một cột mốc quan trọng trong quá trình phát triển AI của Alibaba, cung cấp khả năng lập luận nâng cao, khả năng mở rộng và hỗ trợ đa phương thức. Tính khả dụng mã nguồn mở của nó theo giấy phép Apache 2.0 khuyến khích việc áp dụng rộng rãi và đổi mới hơn nữa trong cộng đồng AI. Khi bối cảnh AI tiếp tục phát triển, Qwen 3 định vị Alibaba là một đối thủ đáng gờm trong cả đấu trường trong nước và toàn cầu.


Cách gọi Qwen 3 API từ CometAPI

Qwen 3 Giá API trong CometAPI:

Phiên bản mô hìnhQwen3 235B A22BQwen: Qwen3 30B A3BQwen3 8B
Giá trong CometAPIMã thông báo đầu vào: $1.6/M mã thông báoMã thông báo đầu vào: $0.4/M mã thông báoMã thông báo đầu vào: $0.32/M mã thông báo
Mã thông báo đầu ra: 4.8 đô la/M mã thông báoMã thông báo đầu ra: 1.2 đô la/M mã thông báoMã thông báo đầu ra: 0.96 đô la/M mã thông báo
tên người mẫuqwen3-235b-a22bqwen3-30b-a3bqwen3-8b
minh họaĐây là model chủ lực của dòng Qwen3, với 235 tỷ tham số, sử dụng kiến ​​trúc Hỗn hợp chuyên gia (MoE).qwen3-30b-a3b: Với 30 tỷ tham số, nó cân bằng giữa hiệu suất và yêu cầu về tài nguyên, phù hợp cho các ứng dụng cấp doanh nghiệp.Một mô hình nhẹ với 800 triệu tham số, được thiết kế dành riêng cho môi trường hạn chế về tài nguyên (như thiết bị di động hoặc máy chủ cấu hình thấp).

Các bước cần thiết

  • Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước
  • Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Thêm mã thông báo” tại mã thông báo API trong trung tâm cá nhân, nhận khóa mã thông báo: sk-xxxxx và gửi.
  • Lấy url của trang web này: https://api.cometapi.com/

Phương pháp sử dụng

  1. Chọn hàng**qwen3-235b-a22b**""qwen3-30b-a3b""qwen3-8b” điểm cuối để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API của trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn.
  2. Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
  3. Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi.
  4. . Xử lý phản hồi API để nhận được câu trả lời đã tạo.

Để biết thông tin về Model được lưu trong Comet API, vui lòng xem https://api.cometapi.com/new-model.

Để biết thông tin về Giá mẫu trong Comet API, vui lòng xem https://api.cometapi.com/pricing.

Xem thêm Qwen 2.5 API tối đa

SHARE THIS BLOG

500+ Mô hình trong Một API

Giảm giá lên đến 20%