Is Qwen3.5-397B-A17B available as open weights for local hosting and research?

Ja. Vektene til Qwen3.5-397B-A17B er utgitt under Apache-2.0 på Hugging Face og ModelScope, og prosjektet tilbyr oppskrifter for serving med Transformers, vLLM og SGLang.

What does the "A17B" suffix mean in Qwen3.5-397B-A17B?

A17B angir at modellens design for sparsom ruting bruker omtrent 17 milliarder aktive parametere per token (aktive eksperter), mens den globale modellkapasiteten er ~397 milliarder parametere.

What is the native context window and can I extend it for very long documents?

Modellen leveres med en opprinnelig inndata-sekvenslengde på 262,144 tokens og inkluderer dokumenterte metoder for å utvide konteksten til ~1,010,000 tokens via YaRN/RoPE-skalering, avhengig av serving-rammeverk.

Which input modalities does Qwen3.5-397B-A17B support?

Det er en enhetlig visjon-språk-modell trent med tidlig fusjon; støttede inndata omfatter tekst, bilder og videotokens for multimodal resonnering og generering.

How does inference efficiency compare to a 17B dense model?

Beregning per token under inferens er lik 17B tette modeller takket være sparsom MoE-ruting, men modellartefakter og minnekrav er større fordi fullstendige vekter må lagres og distribueres på tvers av enheter.

Rimelig qwen3.5-397b-a17b API | text-to-text

Tekniske spesifikasjoner for Qwen3.5-397B-A17B

Egenskap	Qwen3.5-397B-A17B (åpne vekter, ettertrenet)
Modellfamilie	Qwen3.5 (Tongyi Qwen-serien, Alibaba)
Arkitektur	Hybrid Mixture-of-Experts (MoE) + Gated DeltaNet; multimodal trening med tidlig fusjon
Totalt antall parametere	~397 milliarder (totalt)
Aktive parametere (A17B)	~17 milliarder aktive per token (sparsom ruting)
Inndatatyper	Tekst, bilde, video (multimodal tidlig fusjon)
Utdatatyper	Tekst (chat, kode, RAG-utdata), bilde‑til‑tekst, multimodale svar
Opprinnelig kontekstvindu	262,144 tokens (native ISL)
Utvidbar kontekst	Opptil ~1,010,000 tokens via YaRN/ RoPE‑skalering (plattformavhengig)
Maks utdata‑tokens	Rammeverk-/serving‑avhengig (eksempler viser 81,920–131,072 i veiledningene)
Språk	200+ språk og dialekter
Utgivelsesdato	February 16, 2026 (open-weight release)
Lisens	Apache‑2.0 (åpne vekter på Hugging Face / ModelScope)

Hva er Qwen3.5-397B-A17B

Qwen3.5-397B-A17B er den første utgivelsen med åpne vekter i Alibabas Qwen3.5‑familie: en stor, multimodal Mixture‑of‑Experts grunnmodell trent med visjon–språk‑mål for tidlig fusjon og optimalisert for agentbaserte arbeidsflyter. Modellen eksponerer hele kapasiteten til en arkitektur med 397B parametere, samtidig som den bruker sparsom ruting (suffikset “A17B”) slik at bare ~17B parametere er aktive per token—noe som gir en balanse mellom kunnskapskapasitet og inferenseffektivitet.

Denne utgivelsen er ment for forskere og ingeniørteam som trenger en åpen, distribuerbar og multimodal grunnmodell som kan håndtere resonnering over lange kontekster, visuell forståelse og retrieval‑forsterkede/agentbaserte applikasjoner.

Hovedfunksjoner ved Qwen3.5-397B-A17B

Sparsom MoE med effektivitet i aktive parametere: Stor global kapasitet (397B) med per‑token‑aktivitet på nivå med en 17B dense‑modell, reduserer FLOPS per token samtidig som kunnskapsmangfoldet bevares.
Naturlig multimodalitet (tidlig fusjon): Trent til å håndtere tekst, bilder og video via en enhetlig tokeniserings- og encoderstrategi for tverrmodalt resonnement.
Svært lang kontekststøtte: Opprinnelig inndatasekvenslengde på 262K tokens og dokumenterte veier for å utvide til ~1M+ tokens med RoPE/YaRN‑skalering for retrieval og langdokument‑pipeliner.
Tenkemodus og agentverktøy: Støtte for interne resonnementsspor og et agentbasert kjøremønster; eksempler inkluderer aktivering av verktøykall og integrering av kodefortolker.
Åpne vekter og bred kompatibilitet: Utgitt under Apache‑2.0 på Hugging Face og ModelScope, med førsteparts integrasjonsguider for Transformers, vLLM, SGLang og community‑rammeverk.
Bedriftsvennlig språkdekning: Omfattende flerspråklig trening (200+ språk), pluss instruksjoner og oppskrifter for utrulling i stor skala.

Qwen3.5-397B-A17B vs. utvalgte modeller

Modell	Kontekstvindu (opprinnelig)	Styrke	Typiske avveininger
Qwen3.5-397B-A17B	262K (opprinnelig)	Multimodal MoE, åpne vekter, 397B kapasitet med 17B aktive	Store modellartefakter, krever distribuert hosting for full ytelse
GPT-5.2 (representativ lukket)	~400K (rapportert for noen varianter)	Høy resonneringsnøyaktighet i én tett modell	Lukkede vekter, høyere inferenskostnad i skala
LLaMA‑stil dense 70B	~128K (varierer)	Enklere inferensstakk, lavere VRAM for dense‑kjøringer	Lavere parameterkapasitet relativt til MoEs globale kunnskap

Kjente begrensninger og operasjonelle hensyn

Minnefotavtrykk: Sparsom MoE krever fortsatt lagring av store vektfiler; hosting krever betydelig lagring og enhetsminne sammenlignet med en 17B tett klon.
Ingeniørmessig kompleksitet: Optimal gjennomstrømning krever nøye parallellisering (tensor/pipeline) og rammeverk som vLLM eller SGLang; naiv hosting på én GPU er upraktisk.
Tokenøkonomi: Selv om per‑token‑beregning er redusert, øker svært lange kontekster fortsatt I/O, KV‑cache‑størrelse og fakturering hos administrerte leverandører.
Sikkerhet og vern: Åpne vekter øker fleksibiliteten, men flytter ansvaret for sikkerhetsfiltrering, overvåking og distribusjonsvern til operatøren.

Representative brukstilfeller

Forskning og modellanalyse: Åpne vekter muliggjør reproduserbar forskning og fellesskapsdrevet evaluering.
Lokale multimodale tjenester: Bedrifter som trenger dataresidens kan distribuere og kjøre visjon+tekst‑arbeidslaster lokalt.
RAG og langdokument‑pipeliner: Opprinnelig lang‑kontekst‑støtte hjelper enkeltpass‑resonnering over store tekstmengder.
Kodeintelligens og agentverktøy: Analysere monorepoer, generere patcher og kjøre agentbaserte verktøykall‑sløyfer i kontrollerte miljøer.
Flerspråklige applikasjoner: Høy språkdekning for globale produkter.

Slik får du tilgang til og integrerer Qwen3.5-397B-A17B

Trinn 1: Registrer deg for API‑nøkkel

Logg inn på cometapi.com. Hvis du ikke er bruker ennå, registrer deg først. Logg inn i din CometAPI‑konsoll. Hent tilgangslegitimasjonen API‑nøkkel for grensesnittet. Klikk “Add Token” ved API‑token i personlige senteret, hent token‑nøkkelen: sk-xxxxx og send inn.

Trinn 2: Send forespørsler til Qwen3.5-397B-A17B API

Velg endepunktet “Qwen3.5-397B-A17B” for å sende API‑forespørselen og sett forespørselens body. Forespørselsmetode og body hentes fra vår nettsides API‑dokumentasjon. Vår nettside tilbyr også Apifox‑test for din bekvemmelighet. Erstatt <YOUR_API_KEY> med din faktiske CometAPI‑nøkkel fra kontoen din. Hvor det kalles: Chat‑format.

Sett inn spørsmålet eller forespørselen din i content‑feltet—dette er det modellen vil svare på. Prosesser API‑responsen for å hente det genererte svaret.

Trinn 3: Hent og verifiser resultater

Prosesser API‑responsen for å hente det genererte svaret. Etter prosessering svarer API‑et med oppgavestatus og utdata.

qwen3.5-397b-a17b