Thông số kỹ thuật của Qwen3.6-Plus
Mô hình được thiết kế cho các khối lượng công việc tác tử có ngữ cảnh dài và thông lượng cao.
| Thông số | Chi tiết |
|---|---|
| Độ dài ngữ cảnh | 1,000,000 token (1M) theo mặc định |
| Số token đầu ra tối đa | 65,536 token |
| Dạng đầu vào | Văn bản, Hình ảnh, Video |
| Đầu ra | Văn bản (kèm suy luận đa phương thức và thực thi công cụ) |
| Kiến trúc | Lai (chú ý tuyến tính + định tuyến MoE thưa) |
| Khả năng chính | Lập luận theo chuỗi luôn bật; gọi công cụ gốc; lập kế hoạch tầm xa; tác tử thị giác |
| Tương thích API | Giao thức OpenAI và Anthropic |
Qwen3.6-Plus là gì?
Qwen3.6-Plus là mô hình ngôn ngữ lớn đa phương thức độc quyền mới nhất trong dòng Qwen3 của Alibaba. Khác với các biến thể open-weight trước đó, phiên bản “Plus” này chỉ được lưu trữ, là dòng flagship tối ưu cho hiệu năng agentic cấp sản xuất. Mô hình vượt trội trong việc kết nối nhận thức, bộ nhớ dài hạn và thực thi công cụ chính xác trong một quy trình—những dấu ấn của AI tác tử đích thực. Được xây dựng trên kiến trúc lai thế hệ mới (chú ý tuyến tính hiệu quả kết hợp với định tuyến MoE thưa), mô hình mở rộng hiệu quả trong khi vẫn duy trì năng lực hàng đầu về lập trình, lập kế hoạch và hiểu đa phương thức.
Tính năng chính của Qwen3.6-Plus
- Xuất sắc trong lập trình tác tử: Từ ứng dụng full-stack chỉ với một prompt đến gỡ lỗi ở cấp kho mã và phát triển frontend (bao gồm cảnh 3D và trò chơi). Hỗ trợ tích hợp liền mạch với các công cụ như OpenClaw, Qwen Code và môi trường terminal.
- Nhận thức đa phương thức nâng cao: Hiểu rõ hơn về hình ảnh, tài liệu, biểu đồ, thành phần UI và video, cho phép tác tử thị giác điều hướng màn hình, OCR và lập luận theo thời gian.
- Lập kế hoạch tầm xa & sử dụng công cụ: Thực thi nhiều bước đáng tin cậy, lưu giữ bộ nhớ và ra quyết định thích ứng.
- Ổn định & “Vibe Coding”: Phản hồi được tinh chỉnh theo ý kiến cộng đồng để đạt hiệu năng nhất quán, sẵn sàng cho sản xuất.
- Sức mạnh đa ngôn ngữ & đa lĩnh vực: Cạnh tranh trên 200+ ngôn ngữ và nhiều lĩnh vực (STEM, pháp lý, tài chính, chăm sóc sức khỏe).
Hiệu năng benchmark của Qwen3.6-Plus
Qwen3.6-Plus đạt kết quả hàng đầu hoặc tiệm cận hàng đầu trên các benchmark về tác tử, lập trình, lý luận và đa phương thức. Một số điểm nổi bật (đánh giá chính thức của Qwen, temperature=1.0, cửa sổ ngữ cảnh phù hợp):
Benchmark về tác tử & lập trình
- SWE-bench Verified: 78.8 (Claude Opus 4.5: 80.9; cạnh tranh với các biến thể GPT-5.x)
- Terminal-Bench 2.0: 61.6 (vượt Claude Opus 4.5: 59.3)
- QwenClawBench: 57.2 (Claude: 52.3)
- SWE-bench Multilingual: 73.8
Lý luận & Tri thức
- GPQA: 90.4 (Claude Opus 4.5: 87.0)
- LiveCodeBench v6: 87.1 (Claude: 84.8)
- MMLU-Pro: 88.5
Đa phương thức & Thị giác
- OmniDocBench1.5: 91.2 (GPT-5.2: 85.7)
- VideoMME (với phụ đề): 87.8 (GPT-5.2: 86.0)
- MMMU: 86.0
- RealWorldQA: 85.4
Mô hình dẫn đầu trong các kịch bản agentic thực tiễn (thực thi trên terminal, lập kế hoạch dài hạn) đồng thời vẫn rất cạnh tranh trong các nhiệm vụ thuần lý luận và thị giác. Mô hình thường ngang bằng hoặc vượt các mô hình hàng đầu như Claude Opus 4.5/4.6, GPT-5.x, Gemini 3 Pro và Kimi K2.5 trong các đánh giá mục tiêu.
Cách truy cập Qwen3.6-Plus qua CometAPI
CometAPI là cổng AI hướng nhà phát triển hợp nhất quyền truy cập vào hơn 500 mô hình—bao gồm toàn bộ dòng Qwen—thông qua một endpoint tương thích OpenAI duy nhất. Để sử dụng Qwen3.6-Plus:
- Đăng ký tại cometapi.com.
- Lấy khóa API từ bảng điều khiển.
- Sử dụng client tiêu chuẩn của OpenAI (hoặc bất kỳ SDK tương thích nào) với định danh mô hình cho Qwen3.6-Plus (thường là
qwen3.6-plushoặc tương đương trong danh mục của họ).
CometAPI hỗ trợ đầu vào văn bản, hình ảnh và video, gọi công cụ, và ngữ cảnh đầy đủ lên tới 1M token.
Vì sao chọn CometAPI để dùng Qwen3.6-Plus?
CometAPI nổi bật cho sử dụng khối lượng lớn, cấp sản xuất với các mô hình hàng đầu như Qwen3.6-Plus vì cung cấp:
- Truy cập hợp nhất: Một khóa API và endpoint cho 500+ mô hình (OpenAI, Anthropic, Google, Qwen, DeepSeek, v.v.)—loại bỏ phân mảnh nhà cung cấp và đơn giản hóa thanh toán.
- Giá cạnh tranh: Tỷ lệ hiệu quả thấp hơn đáng kể so với truy cập trực tiếp Alibaba Cloud (đầu vào Qwen3.6-Plus thường ~$0.32 per million tokens via aggregators; đầu vào Qwen3.6-Plus thường ~$1.92 per million tokens). Trả theo mức dùng, không tối thiểu.
- Định tuyến thông minh & độ tin cậy: Hạ tầng toàn cầu, tự động chuyển dự phòng, và tối ưu hóa cho tốc độ/độ trễ.
- Trải nghiệm nhà phát triển: SDK nhẹ, playground tương tác, phân tích sử dụng, ưu tiên quyền riêng tư (không lưu giữ dữ liệu), và bảo mật cấp doanh nghiệp.
- Hiệu quả chi phí ở quy mô: Lý tưởng cho các quy trình tác tử tiêu thụ ngữ cảnh lớn; sức mua theo lô chuyển hóa thành tiết kiệm đáng kể so với nhà cung cấp trực tiếp.
Dù bạn xây dựng tác tử lập trình tự động, nền tảng tự động hóa doanh nghiệp, hay ứng dụng đa phương thức thế hệ mới, Qwen3.6-Plus via CometAPI mang lại hiệu năng hàng đầu cùng sự đơn giản và hiệu quả kinh tế cần thiết cho triển khai thực tế. Việc mô hình được tiếp nhận nhanh và dẫn đầu benchmark cho thấy AI tác tử đã chuyển từ thử nghiệm sang sẵn sàng sản xuất—và CometAPI giúp mọi nhà phát triển tiếp cận ngay lập tức.