模型定價企業
500+ AI 模型 API,全部整合在一個 API 中。就在 CometAPI
模型 API
開發者
快速入門說明文件API 儀表板
公司
關於我們企業
資源
AI模型部落格更新日誌支援
服務條款隱私政策
© 2026 CometAPI · All rights reserved
Home/Models/Aliyun/qwen3-vl-235b-a22b
Q

qwen3-vl-235b-a22b

輸入:$0.24/M
輸出:$0.96/M
上下文:2M
最大輸出:30K
qwen3-vl-235b-a22b 是一個多模態模型,將強大的文字生成與對圖像與影片的視覺理解相結合。其 Instruct 變體針對一般多模態任務優化了指令遵循能力。它在真實/合成類別的感知、2D/3D 空間定位以及長篇視覺理解方面表現出色,並在多模態基準測試中取得具競爭力的成績。
新
商業用途
Playground
概覽
功能
定價
API
版本

什麼是 Qwen3-VL-235B-A22B

Qwen3-VL-235B-A22B 是來自 Qwen(Alibaba)家族的高容量多模態 LLM。它結合了大型 MoE Transformer 主幹、跨模態視覺編碼器,以及新的位置/時間編碼技術,以處理多圖像與長時長影片輸入,並執行視覺問答(VQA)、長文件 OCR、空間/3D 定位、多模態程式碼生成,以及代理式 GUI 控制等任務。此次發佈同時包含 Instruct(針對指令遵循進行任務/few-shot 微調)與 Thinking(提供額外推理支援與內部「think」模式)兩種變體。


主要特性(Qwen3-VL-235B-A22B 的獨特之處)

  • 大型 MoE 設計與高活躍容量: 採用 MoE 堆疊,每次請求只啟用部分專家(約 ≈22B 活躍參數),在需要時提供更多算力,同時控制推理成本。
  • 超長原生上下文(256K)並可擴展至 ~1M: 適用於書籍級文件、數小時影片,以及多文件工作流程,而無需過度切塊。
  • 先進的視覺推理(空間與時間): Interleaved-MRoPE 與 DeepStack 模組可實現時間戳對齊與細粒度圖文融合,支援影片時間軸查詢與 3D 定位。
  • 改進的 OCR 與文件解析: 擴展 OCR 語言支援(宣稱支援 ~32 種語言),對模糊/傾斜/低光照情況具有更強魯棒性,並提升對長篇、多頁文件結構解析的能力。
  • 視覺代理 + GUI 自動化: 明確具備代理能力,可識別 GUI 元素、呼叫函式或工具,並在 PC/行動裝置 UI 上執行自動化任務。
  • 視覺編碼與多模態程式合成: 可將圖像/影片/UI 草圖轉換為 Draw.io/HTML/CSS/JS,並協助進行 UI 除錯。

Qwen3-VL-235B-A22B 與其他模型的比較

以下為與同期模型的高層級比較;數值與上限取自公開的供應商/模型頁面與彙整文章。

  • Google Gemini 3 Pro — Gemini 強調超大規模多模態推理與代理式工具使用;Google 宣稱支援 1M token 上下文模式,並具備深度產品整合。Gemini 被定位為代理式多模態的一般領先者(閉源/專有),且在部分產品化基準上通常優於公開可得的開放模型。Qwen3-VL 則更直接地作為高容量開放權重替代方案競爭,並針對 OCR、影片時間軸對齊與 MoE 成本權衡進行最佳化。
  • Grok-4 Heavy (xAI) — Grok-4 是另一個具備長上下文與高推理能力的模型家族;部分 Grok 變體列出 ~256K 上下文視窗,以及強大的程式設計/數學表現。Qwen3-VL 與 Grok-4 都面向長篇推理;Qwen3-VL 的差異化優勢在於更重視視覺/影片/OCR 工具能力與 MoE 擴展。
  • DeepSeek-R1 / DeepSeek family — DeepSeek R1 強調高效訓練,以及在較低推理成本下具備有競爭力的推理表現;它常被用作推理/程式碼任務的開放替代方案。相較於 R1 主要聚焦於文字推理,Qwen3-VL 則主打更強的多模態與空間/影片能力。

代表性使用場景

  • 文件解析與大規模 OCR — 長篇、多頁發票、書籍、含多語文字的歷史文件。
  • 影片理解與時間軸查詢 — 摘要數小時錄製影片、依時間定位事件、將文字與影片時間戳對齊。
  • 視覺問答與多模態助理 — 多輪圖像 + 文字對話(如附截圖的客服支援、醫學影像註記)。
  • GUI 自動化/視覺代理 — 偵測 UI 元素並驅動 PC/行動裝置流程(自動化、測試、輔助代理)。
  • 多模態程式碼生成與 UI 原型設計 — 將模型稿/圖像轉換為 HTML/CSS/JS 或 Draw.io 圖表。
  • 研究與大型文件分析 — 書籍級摘要、多文件綜合分析且可在單一上下文中完成。

如何存取 Qwen3 VL-235B-A22B API

第 1 步:註冊 API Key

登入 cometapi.com。若您尚未成為我們的使用者,請先註冊。登入您的 CometAPI console。取得該介面的存取憑證 API key。在個人中心的 API token 中點擊「Add Token」,取得 token key:sk-xxxxx,然後提交。

第 2 步:向 Qwen3 VL-235B-A22B API 發送請求

選擇 “Qwen3-VL-235B-A22B” 端點以發送 API 請求,並設定 request body。請求方法與 request body 可從我們網站的 API 文件取得。我們的網站也提供 Apifox 測試以方便您使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI key。base url 為 Chat

將您的問題或請求插入 content 欄位——這是模型會回應的內容。處理 API 回應以取得生成的答案。

第 3 步:擷取並驗證結果

處理 API 回應以取得生成的答案。完成處理後,API 會回傳任務狀態與輸出資料。

qwen3-vl-235b-a22b 的定價

探索 qwen3-vl-235b-a22b 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 qwen3-vl-235b-a22b 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)官方價格 (USD / M Tokens)折扣
輸入:$0.24/M
輸出:$0.96/M
輸入:$0.3/M
輸出:$1.2/M
-20%

qwen3-vl-235b-a22b 的範例程式碼和 API

存取完整的範例程式碼和 API 資源,以簡化您的 qwen3-vl-235b-a22b 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 qwen3-vl-235b-a22b 的潛力。
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="qwen3-vl-235b-a22b",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="qwen3-vl-235b-a22b",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const completion = await openai.chat.completions.create({
  model: "qwen3-vl-235b-a22b",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "Hello!" },
  ],
});

console.log(completion.choices[0].message.content);

Curl Code Example

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "qwen3-vl-235b-a22b",
    "messages": [
      {
        "role": "system",
        "content": "You are a helpful assistant."
      },
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  }'

qwen3-vl-235b-a22b的版本

qwen3-vl-235b-a22b擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。
模型名稱描述
qwen3-vl-235b-a22b標準版
qwen3-vl-235b-a22b-thinking思考版