Qwen của Alibaba: Nó có thực sự là mã nguồn mở không?

CometAPI
AnnaApr 19, 2025
Qwen của Alibaba: Nó có thực sự là mã nguồn mở không?

Qwen là gì?

Qwen (Tongyi Qianwen) là một loạt các mô hình ngôn ngữ lớn (LLM) và các mô hình đa phương thức do Alibaba Cloud phát triển, ban đầu được ra mắt ở phiên bản beta vào tháng 2023 năm 2024. Đến tháng XNUMX năm XNUMX, nó được xếp hạng là mô hình ngôn ngữ tiếng Trung hàng đầu trong một số điểm chuẩn nhất định và đứng thứ ba trên toàn cầu, chỉ sau các mô hình hàng đầu từ Anthropic và OpenAI. Tên "Tongyi Qianwen" có nghĩa là "Sự thật từ một nghìn câu hỏi", phản ánh khả năng cung cấp phản hồi chính xác cho nhiều truy vấn khác nhau.

Chuỗi này được xây dựng trên dữ liệu đa ngôn ngữ, đặc biệt chú trọng đến tiếng Trung và tiếng Anh, nhưng cũng hỗ trợ các ngôn ngữ khác như tiếng Tây Ban Nha, tiếng Pháp và tiếng Nhật. Các mô hình có phạm vi từ 1.8 tỷ tham số (1.8B) đến 72 tỷ tham số (72B), phù hợp với nhiều ứng dụng từ nghiên cứu đến doanh nghiệp. Chuỗi đã phát triển để bao gồm phiên bản 2 (ra mắt vào tháng 2024 năm 2.5) và phiên bản 2025 (cập nhật vào đầu năm XNUMX), giới thiệu các cải tiến như kiến ​​trúc hỗn hợp chuyên gia (MoE) và xử lý đa phương thức thời gian thực.

Qwen

Chính sách nguồn mở của Qwen đã phát triển như thế nào theo thời gian?

Cách tiếp cận của Alibaba đối với việc mở nguồn các mô hình của mình rất năng động, phản ánh sự cân bằng giữa việc thúc đẩy sự hợp tác và duy trì lợi thế cạnh tranh. Vào tháng 2023 năm 72, Alibaba đã mở nguồn các mô hình 1.8B và 7B, tiếp theo là mô hình XNUMXB vào tháng XNUMX cùng năm. Những bản phát hành sớm này rất quan trọng, cung cấp cho các nhà nghiên cứu và nhà phát triển quyền truy cập vào các mô hình AI mạnh mẽ theo các thỏa thuận cấp phép cụ thể.

Với việc ra mắt phiên bản 2 vào tháng 2024 năm 2.5, Alibaba đã thay đổi chiến lược của mình, giữ lại các mô hình tiên tiến nhất của mình dưới dạng độc quyền trong khi chọn lọc mở nguồn các mô hình khác. Xu hướng này tiếp tục với dòng 2.5, trong đó các mô hình như 32-VL-2025B-Instruct (phát hành tháng 2.5 năm 7) và 2025-Omni-2.0B (phát hành tháng 2.5 năm XNUMX) được cung cấp theo giấy phép Apache XNUMX, trong khi XNUMX-Max vẫn là nguồn đóng. Cách tiếp cận hỗn hợp này đã làm dấy lên các cuộc thảo luận về sự đánh đổi giữa quyền truy cập mở và quyền kiểm soát độc quyền trong ngành AI.

Điều gì thúc đẩy chiến lược hỗn hợp của Alibaba?

Chính sách nguồn mở của Alibaba dường như được thúc đẩy bởi một số yếu tố:

  • Cộng Đồng:Các mô hình mã nguồn mở như Qwen2.5-Omni-7B khuyến khích các nhà phát triển xây dựng các ứng dụng và đóng góp vào hệ sinh thái, như có thể thấy qua tính khả dụng của nó trên các nền tảng như Hugging Face và GitHub.
  • Lợi thế cạnh tranh:Việc duy trì tính độc quyền của các mô hình tiên tiến như Qwen2.5-Max cho phép Alibaba duy trì vị thế dẫn đầu về công nghệ và kiếm tiền thông qua các dịch vụ đám mây.
  • Cân nhắc về Quy định:Hoạt động tại Trung Quốc, Alibaba phải tuân thủ các quy định của chính phủ, điều này có thể ảnh hưởng đến quyết định cấp phép của công ty.

Chiến lược này phù hợp với xu hướng của ngành, nơi các công ty như OpenAI và Meta AI cũng cân bằng các mô hình mở và đóng để thúc đẩy đổi mới đồng thời bảo vệ lợi ích thương mại.

Những mô hình Qwen cụ thể nào là mã nguồn mở?

Gia đình Qwen bao gồm nhiều mô hình, với các trạng thái nguồn mở khác nhau. Dưới đây là tổng quan chi tiết về các mô hình chính và giấy phép của chúng:

MẫuMã nguồn mởGiấy phépSự có sẵn
Qwen2.5-VL-32B-Hướng dẫnApache 2.0Ôm mặt, ModelScope, GitHub
Qwen2.5-Omni-7BApache 2.0Ôm mặt, ModelScope, GitHub, Qwen Chat
Qwen-72B, Qwen-14B, Qwen-7BTHỎA THUẬN GIẤY PHÉP Tongyi Qianwen (sử dụng thương mại phải có đơn xin cấp phép)Ôm mặt, ModelScope
Qwen-1.8BThỏa thuận cấp phép nghiên cứu của Tongyi Qianwen (sử dụng thương mại cần liên hệ)Ôm mặt, ModelScope
Qwen2.5-MaxKhôngĐộc quyền (chỉ truy cập API)Qwen Chat, Alibaba Cloud Model Studio
  • Qwen2.5-VL-32B-Hướng dẫn: Ra mắt vào tháng 2025 năm 2.0, mô hình ngôn ngữ thị giác này rất tuyệt vời trong việc xử lý hình ảnh và văn bản. Đây là mã nguồn mở theo giấy phép Apache XNUMX, cho phép sử dụng và sửa đổi miễn phí.
  • Qwen2.5-Omni-7B: Ra mắt vào tháng 2025 năm 2.0, mô hình đa phương thức này xử lý văn bản, hình ảnh, âm thanh và video, và có thể triển khai trên các thiết bị biên như điện thoại di động. Nó cũng là mã nguồn mở theo Apache XNUMX.
  • Qwen-72B, Qwen-14B, Qwen-7B:Các mô hình trước đó có sẵn theo THỎA THUẬN CẤP PHÉP Tongyi Qianwen, cho phép sử dụng cho mục đích nghiên cứu nhưng yêu cầu phải nộp đơn xin cấp phép cho mục đích thương mại.
  • Qwen-1.8B:Được cấp phép theo THỎA THUẬN GIẤY PHÉP NGHIÊN CỨU Tongyi Qianwen, mô hình này chủ yếu dành cho mục đích nghiên cứu, còn mục đích sử dụng thương mại đòi hỏi phải liên hệ trực tiếp với Alibaba.
  • Qwen2.5-Max:Mô hình này, được đào tạo trên 20 nghìn tỷ token, không phải là mã nguồn mở, với trọng số được giữ độc quyền. Nó chỉ có thể truy cập thông qua các API như Qwen Chat.

Mã nguồn của Qwen thường có sẵn theo giấy phép Apache 2.0 trên GitHub, cho phép các nhà phát triển sửa đổi và xây dựng dựa trên mã nguồn đó, tuân theo các điều khoản của giấy phép.

Qwen của Alibaba: Nó có thực sự là mã nguồn mở không?

Các mô hình nguồn mở mang lại lợi ích gì cho nhà phát triển?

Các mô hình Qwen nguồn mở mang lại một số lợi thế:

  • Cá nhân hóa:Các nhà phát triển có thể tinh chỉnh các mô hình cho các ứng dụng cụ thể, như được thấy trong “Liberated Qwen” của Abacus AI.
  • Hiệu quả chi phí:Việc tiếp cận miễn phí giúp giảm bớt rào cản cho các công ty khởi nghiệp và nhà nghiên cứu, cho phép thử nghiệm mà không cần đầu tư đáng kể.
  • Minh bạch:Các mô hình nguồn mở cho phép kiểm toán độc lập, tăng cường sự tin cậy vào hiệu suất và việc sử dụng có đạo đức.

Tuy nhiên, các mô hình độc quyền như Qwen2.5-Max hạn chế tính linh hoạt này, đòi hỏi các nhà phát triển phải dựa vào cơ sở hạ tầng của Alibaba.

Qwen2.5-Max

Qwen2.5-Max có phải là mã nguồn mở không?

Qwen2.5-Max, một mô hình chủ lực trong gia đình Qwen, không phải là mã nguồn mở. Trọng số của nó không được công khai, nghĩa là các nhà phát triển không thể tải xuống hoặc sửa đổi mô hình trực tiếp. Thay vào đó, quyền truy cập được cung cấp thông qua các API, chẳng hạn như Qwen Chat và Model Studio của Alibaba Cloud. Ra mắt vào tháng 2025 năm 2.5, Qwen4-Max vượt trội hơn các đối thủ cạnh tranh như GPT-3o, DeepSeek-V3.1 và Llama-405-XNUMXB trong một số điểm chuẩn, khiến nó trở thành một công cụ mạnh mẽ nhưng bị hạn chế).

Tại sao lại giữ Qwen2.5-Max là độc quyền?

Quyết định giữ lại quyền sở hữu Qwen2.5-Max của Alibaba có thể xuất phát từ:

  • Định vị thị trường:Việc duy trì quyền kiểm soát các mô hình tiên tiến đảm bảo lợi thế cạnh tranh của Alibaba trên thị trường AI.
  • Tạo doanh thu:API và dịch vụ đám mây cung cấp lộ trình kiếm tiền, hỗ trợ hoạt động R&D tiếp theo.
  • Giám sát sử dụng:Các mô hình độc quyền cho phép Alibaba thực thi các nguyên tắc đạo đức và pháp lý, đặc biệt là ở các thị trường được quản lý như Trung Quốc.

Cách tiếp cận này phản ánh chiến lược của các công ty như OpenAI, hạn chế quyền truy cập vào các mô hình tiên tiến nhất trong khi vẫn cung cấp các giải pháp dựa trên API.

Qwen so sánh với các mô hình nguồn mở khác như thế nào?

Các mô hình nguồn mở của Qwen góp phần vào hệ sinh thái ngày càng phát triển của các mô hình AI nguồn mở, bao gồm Llama của Meta (một phần dựa trên Qwen) và các mô hình từ Hugging Face. Điểm độc đáo của Qwen nằm ở khả năng đa ngôn ngữ mạnh mẽ, đặc biệt là trong phạm vi tiếng Trung, ít phổ biến hơn trong các mô hình do phương Tây phát triển.

Ngoài ra, kiến ​​trúc MoE được sử dụng trong Qwen 2 và các phiên bản sau đó thể hiện một cách tiếp cận tiên tiến đối với quy mô và hiệu quả của mô hình, thu hút sự quan tâm của cộng đồng nghiên cứu. Sau đây là một so sánh ngắn gọn về Qwen với các mô hình nguồn mở khác:

MẫuNhà phát triểnKhả năng đa ngôn ngữĐổi mới kiến ​​trúcMức độ cởi mở
QwenAlibaba CloudMạnh (tập trung vào Trung Quốc)MoE (Qwen 2+)Mở một phần
Loài đà mã ở nam mỹMục tiêu AITrung bìnhMáy biến áp truyền thốngMở cho nghiên cứu
Ôm mặtVì cộng đồnghỗn hợpThông báo sauMở rộng

Tương lai của chính sách nguồn mở của Qwen sẽ ra sao?

Tính đến tháng 2025 năm 3, Alibaba đang chuẩn bị phát hành Qwen 3, phiên bản nâng cấp của mô hình AI hàng đầu của mình, có khả năng vào cuối tháng này. Trong khi trạng thái mã nguồn mở của Qwen 2.5 vẫn chưa rõ ràng, các hành động gần đây của Alibaba cho thấy một cách tiếp cận hỗn hợp liên tục. Việc phát hành Qwen7-Omni-2025B vào tháng 2.0 năm XNUMX theo Apache XNUMX cho thấy cam kết đóng góp mã nguồn mở.

Ngoài ra, quan hệ đối tác chiến lược giữa Manus AI và nhóm Qwen vào tháng 2025 năm XNUMX báo hiệu một cách tiếp cận hợp tác, có khả năng dẫn đến nhiều sáng kiến ​​nguồn mở hơn. Quan hệ đối tác này nhằm mục đích phát triển các tác nhân AI tiên tiến, có thể hưởng lợi từ các mô hình nguồn mở để đẩy nhanh quá trình áp dụng.

Kết luận:

Qwen không hoàn toàn là mã nguồn mở, mà là sự kết hợp giữa mã nguồn mở và mã nguồn độc quyền. Các mô hình như Qwen-72B, Qwen-1.8B, Qwen 7B và một số phần của Qwen 2 và Qwen 2.5 được mã nguồn mở theo các giấy phép như Apache 2.0, cung cấp nguồn tài nguyên đáng kể cho cộng đồng AI. Tuy nhiên, một số mô hình tiên tiến vẫn là mã nguồn độc quyền, phản ánh sự cân bằng giữa tính cởi mở và lợi ích thương mại của Alibaba.

Chiến lược này cho phép Qwen thúc đẩy việc áp dụng rộng rãi và đổi mới trong khi vẫn duy trì vị thế cạnh tranh của Alibaba trong lĩnh vực AI. Khi Qwen tiếp tục phát triển, chiến lược nguồn mở của công ty sẽ vẫn là chủ đề thảo luận chính trong cộng đồng AI.

Dành cho nhà phát triển: Truy cập API

CometAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp Qwen API và bạn sẽ nhận được 1 đô la trong tài khoản sau khi đăng ký và đăng nhập! Chào mừng bạn đến đăng ký và trải nghiệm CometAPI.

CometAPI hoạt động như một trung tâm tập trung cho các API của một số mô hình AI hàng đầu, loại bỏ nhu cầu phải hợp tác riêng với nhiều nhà cung cấp API.

Vui lòng tham khảo trước Qwen 2.5 API tối đa để biết chi tiết về tích hợp. CometAPI đã cập nhật phiên bản mới nhất API QwQ-32B.

Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%