Qwen3.5-397B-A17B техникалық сипаттамалары
| Элемент | Qwen3.5-397B-A17B (ашық салмақты қосымша оқытылған) |
|---|---|
| Модель отбасы | Qwen3.5 (Tongyi Qwen сериясы, Alibaba) |
| Архитектура | Гибридті MoE (Mixture‑of‑Experts) + Gated DeltaNet; ерте біріктіруге негізделген мультимодальды оқыту |
| Жалпы параметрлер | ~397 миллиард (барлығы) |
| Белсенді параметрлер (A17B) | Әр токенге ~17 миллиард белсенді (сирек бағдарлау) |
| Енгізу түрлері | Мәтін, Сурет, Бейне (ерте біріктірумен мультимодальды) |
| Шығыс түрлері | Мәтін (чат, код, RAG жауаптары), суреттен мәтінге, мультимодальды жауаптар |
| Нативті контексттік терезе | 262,144 токен (native ISL) |
| Кеңейтілетін контекст | YaRN/ RoPE масштабтауы арқылы ~1,010,000 токенге дейін (платформаға тәуелді) |
| Шығыс токендерінің ең көбі | Фреймворк/қызмет көрсетуге тәуелді (нұсқаулықтарда 81,920–131,072 көрсетілген) |
| Тілдер | 200+ тілдер мен диалектілер |
| Шығарылған күні | 2026 жылғы 16 ақпан (ашық салмақты релиз) |
| Лицензия | Apache‑2.0 (Hugging Face / ModelScope‑те ашық салмақтар) |
Qwen3.5-397B-A17B деген не
Qwen3.5-397B-A17B — Alibaba‑ның Qwen3.5 отбасыдағы алғашқы ашық салмақты релизі: ерте біріктірулі көру‑тіл мақсаттарымен және агенттік жұмыс процестеріне оңтайландырылған, үлкен, мультимодальды сарапшылар қоспасы (MoE) негізді модель. Модель 397B параметрлі архитектураның толық мүмкіндігін ұсына отырып, сирек бағдарлауды қолданады (“A17B” жұрнағы), сондықтан әр токенде шамамен 17B параметр белсенді — бұл білім сыйымдылығы мен инференс тиімділігі арасындағы теңгерімді қамтамасыз етеді.
Бұл релиз ұзын контекстте пайымдау, көрнекі түсіну және іздеумен кеңейтілген/агенттік қолданбаларға қабілетті, ашық әрі орналастырылатын мультимодальды іргелі модель қажет зерттеушілер мен инженерлік командаларға арналған.
Qwen3.5-397B-A17B негізгі мүмкіндіктері
- Белсенді параметрлер тиімділігі бар сирек MoE: Үлкен жаһандық сыйымдылық (397B) және токен сайын 17B тығыз модельге шамалас белсенділік, бұл токенге шаққандағы FLOPS-ты азайтып, білім әртүрлілігін сақтайды.
- Нативті мультимодальдылық (ерте біріктіру): Көлденең модальдық пайымдау үшін біріктірілген токенизация және энкодер стратегиясы арқылы мәтін, сурет және бейнені өңдеуге үйретілген.
- Өте ұзын контекстті қолдау: 262K токендік нативті енгізу тізбегі және RoPE/YARN масштабтауы арқылы ~1M+ токенге дейін кеңейту жолдары құжатталған — RAG және ұзын құжаттық конвейерлер үшін.
- Ойлау режимі және агент құралдары: Ішкі пайымдау трассаларын және агенттік орындалу үлгісін қолдайды; мысалдарға құрал шақыру және код интерпретаторымен интеграция кіреді.
- Ашық салмақ және кең үйлесімділік: Apache‑2.0 лицензиясымен Hugging Face және ModelScope‑та; Transformers, vLLM, SGLang және қауымдастық фреймворктерімен бірінші тарап интеграция нұсқаулықтары бар.
- Кәсіпорындарға қолайлы тілдік қамту: 200+ тіл бойынша кең ауқымды көптілді оқыту, сонымен қатар ауқымды енгізуге арналған нұсқаулар мен рецепттер.
Qwen3.5-397B-A17B және таңдаулы модельдер
| Модель | Контекст терезесі (негізгі) | Күшті жақтары | Әдеттегі ымыралар |
|---|---|---|---|
| Qwen3.5-397B-A17B | 262K (негізгі) | Мультимодальды MoE, ашық салмақтар, 397B сыйымдылық, 17B белсенді | Үлкен модель артефакттары, толық өнімділік үшін таратылған хостинг қажет |
| GPT-5.2 (репрезентативті жабық) | ~400K (кейбір нұсқаларда) | Бір модельді тығыз пайымдаудың жоғары дәлдігі | Жабық салмақтар, ауқымда инференс құны жоғары |
| LLaMA‑стильді тығыз 70B | ~128K (өзгермелі) | Инференс стегі қарапайым, тығыз рантаймдар үшін VRAM аз қажет | MoE‑дің жаһандық білімімен салыстырғанда параметр сыйымдылығы аз |
Белгілі шектеулер және операциялық ескертулер
- Жады ізі: Сирек MoE болса да үлкен салмақ файлдарын сақтау қажет; хостинг 17B тығыз клонмен салыстырғанда едәуір сақтау және құрылғы жады талап етеді.
- Инженерлік күрделілік: Оңтайлы өткізу қабілеті мұқият параллелизмді (тензор/пайнлайн) және vLLM немесе SGLang сияқты фреймворктерді қажет етеді; қарапайым жалғыз GPU‑да хостинг жасау практикалық емес.
- Токен экономикасы: Токенге шаққандағы есептеу азайғанымен, өте ұзын контексттер I/O, KV кэші өлшемін және басқарылатын провайдерлер үшін биллингті арттырады.
- Қауіпсіздік және қорғаныс шаралары: Ашық салмақтар икемділікті арттырады, бірақ қауіпсіздікті сүзу, мониторинг және енгізу қорғаныс шаралары үшін жауапкершілікті операторға аударады.
Өкілдік қолдану жағдайлары
- Зерттеу және модельді талдау: Ашық салмақтар қайталанатын зерттеу мен қауымдастықтық бағалауды мүмкін етеді.
- On‑premise мультимодальды қызметтер: Деректер резиденттілігі талаптары бар кәсіпорындар көру+мәтін жүктемелерін жергілікті іске қоса алады.
- RAG және ұзын құжаттық конвейерлер: Нативті ұзын контекст үлкен корпустарды бір өтуде пайымдауға көмектеседі.
- Кодтық интеллект және агент құралдары: Монореполарды талдау, патчтар жасау және бақыланатын ортада агенттік құрал‑шақыру циклдерін іске қосу.
- Көптілді қолданбалар: Жаһандық өнімдер үшін жоғары қамтылымды тілдік қолдау.
Qwen3.5-397B-A17B‑ке қалай қол жеткізу және біріктіру
1‑қадам: API кілтіне тіркелу
cometapi.com сайтына кіріңіз. Егер әлі пайдаланушы болмасаңыз, алдымен тіркеліңіз. Өз CometAPI консоліне кіріңіз. Интерфейстің қол жеткізу деректемесі — API кілтін алыңыз. Жеке кабинеттегі API token бөлімінде “Add Token” түймесін басып, token кілтін алыңыз: sk-xxxxx және жіберіңіз.
2‑қадам: Qwen3.5-397B-A17B API‑іне сұраулар жіберу
API сұрауын жіберу үшін “Qwen3.5-397B-A17B” эндпоинтын таңдап, сұрау денесін орнатыңыз. Сұрау әдісі мен сұрау денесін біздің веб‑сайттағы API құжатынан алыңыз. Қолайлылық үшін сайтымызда Apifox тесті де ұсынылған. <YOUR_API_KEY> мәнін аккаунтыңыздағы нақты CometAPI кілтімен ауыстырыңыз. Қайда шақыруға болады: Chat форматы.
Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель соған жауап береді . API жауабын өңдеп, генерацияланған жауапты алыңыз.
3‑қадам: Нәтижелерді алу және тексеру
API жауабын өңдеп, генерацияланған жауапты алыңыз. Өңдеуден кейін API тапсырма мәртебесі мен шығыс деректерін қайтарады.