Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

Ja. Vægtene for Qwen3.5-397B-A17B er udgivet under Apache-2.0 på Hugging Face og ModelScope, og projektet leverer opskrifter til serving for Transformers, vLLM og SGLang.

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

A17B angiver, at modellens sparsomme routing-design bruger cirka 17 milliarder aktive parametre pr. token (aktive eksperter), mens den samlede modelkapacitet er ~397 milliarder parametre.

What is the native context window and can I extend it for very long documents?

Modellen leveres med en indbygget inputsekvenslængde på 262,144 tokens og omfatter dokumenterede metoder til at udvide konteksten til ~1,010,000 tokens via YaRN/RoPE-skalering, afhængigt af serving-rammeværket.

Which input modalities does Qwen3.5-397B-A17B support?

Det er en forenet vision-sprog-model trænet med early-fusion; understøttede input omfatter tekst, billeder og videotokens til multimodal ræsonnering og generering.

How does inference efficiency compare to a 17B dense model?

Inferensberegning pr. token er på niveau med 17B tætte modeller takket være sparsom MoE-routing, men modelartefakter og hukommelseskrav er større, fordi de fulde vægte skal lagres og distribueres på tværs af enheder.

Overkommelig qwen3.5-397b-a17b API | text-to-text

Tekniske specifikationer for Qwen3.5-397B-A17B

Punkt	Qwen3.5-397B-A17B (open-weight post-trained)
Modelfamilie	Qwen3.5 (Tongyi Qwen-serien, Alibaba)
Arkitektur	Hybrid Mixture-of-Experts (MoE) + Gated DeltaNet; multimodal træning med early fusion
Samlet antal parametre	~397 milliarder (i alt)
Aktive parametre (A17B)	~17 milliarder aktive pr. token (sparsom routing)
Inputtyper	Tekst, billede, video (multimodal early fusion)
Outputtyper	Tekst (chat, kode, RAG-uddata), billede-til-tekst, multimodale svar
Native kontekstvindue	262.144 tokens (native ISL)
Udvidelig kontekst	Op til ~1.010.000 tokens via YaRN/ RoPE-skalering (platformafhængigt)
Maks output-tokens	Afhænger af framework/serve (eksempler viser 81,920–131,072 i vejledninger)
Sprog	200+ sprog og dialekter
Udgivelsesdato	16. februar 2026 (open-weight udgivelse)
Licens	Apache‑2.0 (åbne vægte på Hugging Face / ModelScope)

Hvad er Qwen3.5-397B-A17B

Qwen3.5-397B-A17B er den første open‑weight-udgivelse i Alibabas Qwen3.5-familie: en stor, multimodal mixture‑of‑experts grundmodel trænet med early‑fusion vision–language-mål og optimeret til agentiske arbejdsgange. Modellen eksponerer den fulde kapacitet af en arkitektur med 397B parametre, mens den anvender sparsom routing (endelsen “A17B”), så kun ~17B parametre er aktive pr. token—hvilket giver en balance mellem videnskapacitet og inferenseffektivitet.

Denne udgivelse er tiltænkt forskere og engineering-teams, der har brug for en åben, deployerbar og multimodal grundmodel, som kan langkontekst- ræsonnere, forstå visuelle input og understøtte retrieval‑augmented/agentiske applikationer.

Vigtigste funktioner i Qwen3.5-397B-A17B

Sparsom MoE med effektiv udnyttelse af aktive parametre: Stor global kapacitet (397B) med per‑token aktivitet på niveau med en 17B dense-model, hvilket sænker FLOPS pr. token og samtidig bevarer vidensdiversitet.
Native multimodalitet (early fusion): Trænet til at håndtere tekst, billeder og video via en samlet tokeniserings- og encoderstrategi til tværmodalt ræsonnement.
Understøttelse af meget lange kontekster: Native inputsekvenslængde på 262K tokens og dokumenterede veje til at udvide til ~1M+ tokens ved hjælp af RoPE/YARN-skalering til retrieval og long-document-pipelines.
Tænketilstand & agentværktøjer: Understøttelse af interne ræsonnementsspor og et agentisk eksekveringsmønster; eksempler omfatter aktivering af værktøjskald og integration af kodefortolker.
Åbne vægte & bred kompatibilitet: Udgivet under Apache‑2.0 på Hugging Face og ModelScope, med førsteparts-integrationsvejledninger til Transformers, vLLM, SGLang og community-frameworks.
Virksomhedsvenlig sprogunderstøttelse: Omfattende flersproglig træning (200+ sprog) samt instruktioner og opskrifter til udrulning i stor skala.

Qwen3.5-397B-A17B vs udvalgte modeller

Model	Kontekstvindue (native)	Styrke	Typiske kompromiser
Qwen3.5-397B-A17B	262K (native)	Multimodal MoE, åbne vægte, 397B kapacitet med 17B aktive	Store modelartefakter, kræver distribueret hosting for fuld ydeevne
GPT-5.2 (repræsentativ lukket)	~400K (rapporteret for nogle varianter)	Høj ræsonnementnøjagtighed for en enkelt dense-model	Lukkede vægte, højere inferensomkostninger i skala
LLaMA‑stil dense 70B	~128K (varierer)	Enklere inferensstak, lavere VRAM for dense-kørsler	Mindre parameterkapacitet relativt til MoE’s globale viden

Kendte begrænsninger og driftsmæssige overvejelser

Hukommelsesaftryk: Sparsom MoE kræver stadig lagring af store vægtfiler; hosting kræver betydelig lagerplads og enhedshukommelse sammenlignet med en 17B dense-klon.
Ingeniørmæssig kompleksitet: Optimal throughput kræver omhyggelig parallelisering (tensor/pipeline) og frameworks som vLLM eller SGLang; naiv hosting på en enkelt GPU er upraktisk.
Token-økonomi: Selvom compute pr. token reduceres, øger meget lange kontekster stadig I/O, KV-cache-størrelse og fakturering hos managed-udbydere.
Sikkerhed og værn: Åbne vægte øger fleksibiliteten, men flytter ansvaret for sikkerhedsfiltrering, overvågning og deploymentsværn til operatøren.

Repræsentative anvendelsestilfælde

Forskning og modelanalyse: Åbne vægte muliggør reproducerbar forskning og community‑drevet evaluering.
On‑premise multimodale tjenester: Virksomheder med behov for dataresidens kan udrulle og køre vision+tekst‑workloads lokalt.
RAG og long‑document‑pipelines: Native langkontekststøtte hjælper med single‑pass‑ræsonnement over store korpora.
Kodeintelligens & agentværktøjer: Analysér monorepos, generér patches og kør agentiske tool‑call‑loops i kontrollerede miljøer.
Flersprogede applikationer: Høj sprog‑dækning til globale produkter.

Sådan tilgår og integrerer du Qwen3.5-397B-A17B

Trin 1: Tilmeld dig for API‑nøgle

Log ind på cometapi.com. Hvis du ikke allerede er bruger, skal du først registrere dig. Log ind i din CometAPI‑konsol. Hent API‑nøglen til interfacet. Klik på “Add Token” ved API‑tokenet i det personlige center, få token‑nøglen: sk-xxxxx og indsend.

Trin 2: Send forespørgsler til Qwen3.5-397B-A17B API

Vælg “Qwen3.5-397B-A17B”-endpointet for at sende API‑forespørgslen og angiv request body. Forespørgselsmetode og request body fås fra vores websteds API‑dokumentation. Vores websted tilbyder også Apifox‑test for din bekvemmelighed. Erstat <YOUR_API_KEY> med din faktiske CometAPI‑nøgle fra din konto. Hvor kaldes det: Chat-format.

Indsæt dit spørgsmål eller din anmodning i content‑feltet—det er dette, modellen vil svare på. Behandl API‑svaret for at få den genererede respons.

Trin 3: Hent og verificer resultater

Behandl API‑svaret for at få den genererede respons. Efter behandlingen svarer API'et med opgavestatus og outputdata.

qwen3.5-397b-a17b