Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

Иә. Qwen3.5-397B-A17B салмақтары Apache-2.0 лицензиясы бойынша Hugging Face және ModelScope-та жарияланған, әрі жоба Transformers, vLLM және SGLang үшін қызмет көрсетуге арналған нұсқаулықтар ұсынады.

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

A17B бұл модельдің сирек маршрутизациялау дизайны әр токенге шамамен 17 миллиард белсенді параметрді (белсенді сарапшылар) қолданатынын, ал модельдің жалпы сыйымдылығы ~397 миллиард параметр екенін білдіреді.

What is the native context window and can I extend it for very long documents?

Модель 262,144 токендік бастапқы кіріс тізбегі ұзындығымен жеткізіледі және қызмет көрсету фреймворкіне байланысты YaRN/RoPE масштабтауы арқылы контексті ~1,010,000 токенге дейін кеңейтуге арналған құжатталған әдістерді қамтиды.

Which input modalities does Qwen3.5-397B-A17B support?

Бұл early-fusion арқылы жаттықтырылған бірыңғай көру-тіл моделі; қолдау көрсетілетін енгізулерге мультимодальды пайымдау мен генерация үшін мәтін, суреттер және видео токендер кіреді.

How does inference efficiency compare to a 17B dense model?

Sparse MoE маршрутизациясының арқасында әр токенге шаққандағы инференс есептеуі 17B тығыз модельдерге ұқсас, бірақ толық салмақтарды құрылғылар арасында сақтау және тарату қажет болғандықтан, модель артефакттары мен жадқа қойылатын талаптар жоғарырақ.

Қолжетімді qwen3.5-397b-a17b API | text-to-text

Qwen3.5-397B-A17B техникалық сипаттамалары

Тармақ	Qwen3.5-397B-A17B (ашық салмақты кейінгі оқыту)
Модельдер отбасы	Qwen3.5 (Tongyi Qwen сериясы, Alibaba)
Архитектурасы	Гибридті Mixture-of-Experts (MoE) + Gated DeltaNet; ерте біріктіру арқылы мультимодальды оқыту
Жалпы параметрлер	~397 миллиард (барлығы)
Белсенді параметрлер (A17B)	әр токен үшін ~17 миллиард белсенді (сирек бағыттау)
Енгізу түрлері	Мәтін, Сурет, Бейне (мультимодальды ерте біріктіру)
Шығару түрлері	Мәтін (чат, код, RAG нәтижелері), кескіннен мәтінге, мультимодальды жауаптар
Жергілікті контекст терезесі	262,144 токен (native ISL)
Кеңейтілетін контекст	YaRN/ RoPE масштабтауы арқылы ~1,010,000 токенге дейін (платформаға тәуелді)
Ең көбі шығыс токендері	Фреймворк/қызметке тәуелді (нұсқаулықтарда 81,920–131,072 көрсетілген)
Тілдер	200+ тіл және диалект
Шығарылу күні	2026 жылғы 16 ақпан
Лицензия	Apache‑2.0 (Hugging Face / ModelScope-та ашық салмақтар)

Qwen3.5-397B-A17B деген не

Qwen3.5-397B-A17B — Alibaba-ның Qwen3.5 отбасындағы ашық салмақты алғашқы шығарылым: ерте біріктіру негізіндегі көру–тіл мақсаттарымен оқытылған және агенттік жұмыс процестеріне оңтайландырылған, үлкен көлемді, мультимодальды сарапшылар қоспасына негізделген іргелі модель. Модель 397B параметрлі архитектураның толық мүмкіндігін аша отырып, сирек бағыттауды қолданады (“A17B” жалғауы), сол арқылы әр токен үшін тек шамамен 17B параметр белсенді болып, білім сыйымдылығы мен инференс тиімділігі арасында тепе-теңдік береді.

Бұл шығарылым ұзын контекстте ой жүгіртуге, визуалдық түсінуге, сондай-ақ іздеумен толықтырылған/агенттік қолданбаларға арналған ашық, орналастырылатын және мультимодальды іргелі модель қажет зерттеушілер мен инженерлік командаларға арналған.

Qwen3.5-397B-A17B негізгі мүмкіндіктері

Белсенді параметр тиімділігі бар сирек MoE: Үлкен жаһандық сыйымдылық (397B) және әр токенге белсенділігі 17B тығыз модельге ұқсас, білім алуан түрлілігін сақтай отырып токенге шаққандағы FLOPS-ты төмендетеді.
Туған мультимодалдылық (ерте біріктіру): Мәтін, кескін және бейнені бірізді токенизация мен энкодер стратегиясы арқылы өңдеуге үйретілген, кросс-модальды пайымдауды қолдайды.
Өте ұзын контекстті қолдау: Жергілікті енгізу тізбегі ұзындығы 262K токен және RoPE/YARN масштабтауы арқылы ~1M+ токенге дейін кеңейту жолдары құжатталған, RAG және ұзын құжат пайплайндары үшін қолайлы.
Ойлау режимі және агент құралдары: Ішкі пайымдау іздерін және агенттік орындау үлгісін қолдайды; мысалдар ретінде құрал шақыруларын қосу және код интерпретаторымен интеграцияны айтуға болады.
Ашық салмақтар және кең үйлесімділік: Apache‑2.0 аясында Hugging Face және ModelScope-та жарияланған, Transformers, vLLM, SGLang және қауымдастық фреймворктарына арналған бірінші тарап нұсқаулықтары бар.
Кәсіпорынға қолайлы тіл қамтуы: Көптілді оқыту (200+ тіл) және ауқымды енгізуге арналған нұсқаулар мен рецептілер.

Qwen3.5-397B-A17B vs таңдалған модельдер

Модель	Контекстік терезе (жергілікті)	Күшті тұстары	Әдеттегі компромистер
Qwen3.5-397B-A17B	262K (жергілікті)	Мультимодальды MoE, ашық салмақтар, 397B сыйымдылық, 17B белсенді	Үлкен модель артефактілері, толық өнімділік үшін таратылған хостинг қажет
GPT-5.2 (өкілдік жабық)	~400K (кейбір нұсқалар үшін хабарланған)	Жалғыз тығыз модельдің жоғары пайымдау дәлдігі	Жабық салмақтар, ауқымда инференс құны жоғары
LLaMA‑стильді тығыз 70B	~128K (өзгереді)	Қарапайым инференс стекі, тығыз рантаймдар үшін VRAM талабы төмен	MoE жаһандық білім қорымен салыстырғанда параметр сыйымдылығы аз

Белгілі шектеулер және операциялық ескертпелер

Жад ізі: Сирек MoE әлі де үлкен салмақ файлдарын сақтауды талап етеді; 17B тығыз клонымен салыстырғанда хостинг едәуір сақтау мен құрылғы жадын қажет етеді.
Инженерлік күрделілік: Оңтайлы өткізу қабілеті мұқият параллелизмді (тензор/пайплайн) және vLLM немесе SGLang сияқты фреймворктарды талап етеді; қарапайым бір GPU-да орналастыру практикалық емес.
Токен экономикасы: Токенге шаққандағы есептеу азайғанымен, өте ұзын контексттер I/O, KV кэш көлемін және басқарылатын провайдерлер үшін биллингті арттырады.
Қауіпсіздік және қорғаныш шектеулер: Ашық салмақтар икемділікті арттырады, бірақ қауіпсіздік сүзгілері, мониторинг және енгізу қорғаныштарына жауапкершілікті операторға аударады.

Өкілдік қолдану жағдайлары

Зерттеу және модельді талдау: Ашық салмақтар қайталанатын зерттеу мен қауымдастық бағалауын мүмкін етеді.
On‑premise мультимодальды сервистер: Деректердің орналасуын талап ететін кәсіпорындар vision+text жүктемелерін жергілікті түрде іске қоса алады.
RAG және ұзын құжат пайплайндары: Туған ұзын контекст үлкен корпустар бойынша бір өтімдік пайымдауға көмектеседі.
Кодтық интеллект және агент құралдары: Монорепаларды талдау, патчтар генерациялау және бақылаулы ортада агенттік құрал шақыру циклдарын жүргізу.
Көптілді қолданбалар: Ғаламдық өнімдер үшін кең тіл қамтуы.

Qwen3.5-397B-A17B-ге қол жеткізу және біріктіру жолы

1-қадам: API кілтін алу үшін тіркелу

cometapi.com сайтына кіріңіз. Егер сіз әлі пайдаланушы болмасаңыз, алдымен тіркеліңіз. CometAPI консоліне кіріңіз. Интерфейстің қолжеткізу деректемесі — API кілтін алыңыз. Жеке кабинеттегі API токені бөлімінде “Add Token” батырмасын басыңыз, токен кілтін алыңыз: sk-xxxxx және жіберіңіз.

2-қадам: Qwen3.5-397B-A17B API-не сұраулар жіберу

API сұрауын жіберу үшін “Qwen3.5-397B-A17B” эндпоинтын таңдаңыз және сұрау денесін орнатыңыз. Сұрау әдісі мен сұрау денесі біздің сайттағы API құжаттамасынан алынады. Ыңғайлылық үшін сайтымыз Apifox тестін де ұсынады. <YOUR_API_KEY> мәнін аккаунтыңыздағы нақты CometAPI кілтіне ауыстырыңыз. Қайда шақыруға болады: [Chat] форматы.

Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель дәл соған жауап береді. Генерацияланған жауапты алу үшін API жауабын өңдеңіз.

3-қадам: Нәтижелерді алу және тексеру

Генерацияланған жауапты алу үшін API жауабын өңдеңіз. Өңдеуден кейін API тапсырма күйі мен шығыс деректерін қайтарады.

qwen3.5-397b-a17b