Alibabas Qwen-team har lansert Qwen3-Max-forhåndsvisning (instruksjon) — selskapets største modell hittil, med mer enn 1 billion parametere – og gjorde den umiddelbart tilgjengelig gjennom Qwen Chat, Alibaba Cloud Model Studio (API) og tredjeparts markedsplasser som CometAPI. Forhåndsvisningen retter seg mot resonnement, koding og arbeidsflyter med lange dokumenter ved å kombinere ekstrem skalering med et veldig stort kontekstvindu og kontekstbufring for å holde latensen lav for lange økter.
Viktige tekniske høydepunkter
- Massivt antall parametere (billioner+): Overgangen til en modell med over billioner parametere er utformet for å øke kapasiteten for kompleks mønsterlæring (flertrinnsresonnement, kodesyntese, dyp dokumentforståelse). Tidlige benchmarks utgitt av Qwen indikerer forbedrede resultater innen resonnement, koding og benchmark-suiter sammenlignet med Qwens tidligere toppmodeller.
- Ultralang kontekst og mellomlagring: Ocuco 262 XNUMX token vinduet lar team mate hele lange rapporter, kodebaser med flere filer eller lange chattehistorikker i én omgang. Støtte for kontekstbufring reduserer gjentatt beregning for tilbakevendende kontekst og kan redusere ventetid og kostnader for lengre økter.
- Flerspråklig + kodingsferdigheter: Qwen3-familien vektlegger tospråklig (kinesisk/engelsk) og bred flerspråklig støtte, pluss sterkere koding og strukturert utdatahåndtering – nyttig for kodeassistenter, automatisert rapportgenerering og tekstanalyse i stor skala.
- Designet for hastighet og kvalitet. Forhåndsvisningsbrukere beskriver «enorm» responshastighet og forbedret instruksjonsfølging og resonnement sammenlignet med tidligere Qwen3-varianter. Alibaba posisjonerer modellen som et flaggskip med høy gjennomstrømning for produksjonsklasse-, agent- og utviklerscenarioer.
Tilgjengelighet og tilgang
Alibaba Cloud-avgifter nivåbasert, tokenbasert Priser for Qwen3-Max-Preview (separate input- og output-priser). Fakturering skjer per million tokens og brukes på de faktiske tokensene som er forbrukt etter eventuell gratis kvote.
Alibabas publiserte forhåndsvisningspriser (USD) justeres nivåvis etter forespørsel inngang tokenvolum (de samme nivåene bestemmer hvilke enhetspriser som gjelder):
- 0–32 XNUMX inndatatokener: 0.861 USD / 1 million inndatatokener og 3.441 USD / 1 million utdatatokener.
- 32 128–XNUMX XNUMX inndatatokener: 1.434 USD / 1 million inndatatokener og 5.735 USD / 1 million utdatatokener.
- 128 252–XNUMX XNUMX inndatatokener: 2.151 USD / 1 million inndatatokener og 8.602 USD / 1 million utdatatokener.
CometAPI tilbyr en offisiell rabatt på 20 % for å hjelpe brukere med å ringe API-et. Se detaljer på Qwen3-Max-forhåndsvisning:
| Skriv inn tokens | $0.24 |
| Output tokens | $2.42 |
Qwen3-Max utvider Qwen3-familien (som har brukt hybriddesign som Mixture-of-Experts-varianter og flere aktive parameternivåer i tidligere versjoner). Alibabas tidligere Qwen3-utgivelser fokuserte på både "tenknings"- (trinn-for-trinn-resonnement) og "instruksjons"-moduser. Qwen3-Max er posisjonert som den nye toppmoderne instruksjonsvarianten i den linjen, noe som viser at den overgår selskapets tidligere best ytende produkt, Qwen3-235B-A22B-2507, og viser at 1T-parametermodellen er ledende på tvers av en rekke tester.
På SuperGPQA, AIME25, LiveCodeBench v6, Arena-Hard v2 og LiveBench (20241125) ligger Qwen3-Max-Preview konsekvent foran Claude Opus 4, Kimi K2 og Deepseek-V3.1.

Slik får du tilgang til og bruker Qwen3-Max (praktisk veiledning)
1) Prøv det i nettleseren (Qwen Chat)
Besøk Qwen Chat (offisielt Qwen web-/chat-grensesnitt) og velg Qwen3-Max-forhåndsvisning (Instruksjons)modell hvis vist i modellvelgeren. Dette er den raskeste måten å evaluere samtale- og instruksjonsoppgaver visuelt.
2) Tilgang via Alibaba Cloud (Model Studio / Cloud API)
- Logg inn på Alibaba Cloud → Modellstudio / ModellserveringOpprett en inferanseinstans eller velg det vertsbaserte modellens endepunkt for qwen3-max-forhåndsvisning (eller den merkede forhåndsvisningsversjonen).
- Autentiser ved hjelp av Alibaba Cloud Access Key / RAM-rollene dine og kall inferensendepunktet med en POST-forespørsel som inneholder ledeteksten din og eventuelle genereringsparametere (temperatur, maks. tokens osv.).
3) Bruk gjennom tredjeparts verter/aggregatorer
I følge dekningen er forhåndsvisningen tilgjengelig via CometAPI og andre API-aggregatorer som lar utviklere kalle flere hostede modeller med én API-nøkkel. Dette kan forenkle testing på tvers av leverandører, men verifisere latens, regional tilgjengelighet og datahåndteringspolicyer for hver vert.
Komme i gang
CometAPI er en enhetlig API-plattform som samler over 500 AI-modeller fra ledende leverandører – som OpenAIs GPT-serie, Googles Gemini, Anthropics Claude, Midjourney, Suno og flere – i ett enkelt, utviklervennlig grensesnitt. Ved å tilby konsistent autentisering, forespørselsformatering og svarhåndtering, forenkler CometAPI dramatisk integreringen av AI-funksjoner i applikasjonene dine. Enten du bygger chatboter, bildegeneratorer, musikkomponister eller datadrevne analysepipeliner, lar CometAPI deg iterere raskere, kontrollere kostnader og forbli leverandøruavhengig – alt samtidig som du utnytter de nyeste gjennombruddene på tvers av AI-økosystemet.
Konklusjon
Qwen3-Max-Preview plasserer Alibaba midt i blinken blant organisasjoner som sender billioner av modeller til kunder. Kombinasjonen av ekstrem kontekstlengde og et OpenAI-kompatibelt API senker integrasjonsbarrieren for bedrifter som trenger resonnement med lange dokumenter, kodeautomatisering eller agentorkestrering. Kostnad og forhåndsvisningsstabilitet er de viktigste adopsjonshensynene: organisasjoner vil ønske å pilotere med mellomlagring, strømming og batch-kall for å håndtere både latens og prising.

