Alibaba AI afslører Qwen3-Max: Qwen-model med billioner af parametre, CometAPI understøtter

Alibabas Qwen-team har udgivet Qwen3-Max-Forhåndsvisning (Instruktion) — virksomhedens hidtil største model, med mere end 1 billion parametre — og gjorde den tilgængelig med det samme via Qwen Chat, Alibaba Cloud Model Studio (API) og tredjepartsmarkedspladser som CometAPI. Forhåndsvisningen er målrettet ræsonnement, kodning og arbejdsgange med lange dokumenter ved at kombinere ekstrem skalering med et meget stort kontekstvindue og kontekstcaching for at holde latensen lav i lange sessioner.

Vigtige tekniske højdepunkter

Massivt antal parametre (billioner+): Overgangen til en model med over billioner parametre er designet til at øge kapaciteten til kompleks mønsterindlæring (flertrinsræsonnement, kodesyntese, dybdegående dokumentforståelse). Tidlige benchmarks udgivet af Qwen indikerer forbedrede resultater inden for ræsonnement, kodning og benchmark-suiter sammenlignet med Qwens tidligere topmodeller.
Ultralang kontekst og caching: 262k token vinduet lader teams indlæse hele lange rapporter, kodebaser med flere filer eller lange chathistorikker i én omgang. Understøttelse af kontekstcache reducerer gentagen beregning for tilbagevendende kontekst og kan reducere latenstid og omkostninger for længere sessioner.
Flersproget + kodningsevner: Qwen3-familien lægger vægt på tosproget (kinesisk/engelsk) og bred flersproget understøttelse, plus stærkere kodning og struktureret outputhåndtering – nyttigt til kodeassistenter, automatiseret rapportgenerering og tekstanalyse i stor skala.
Designet til hastighed og kvalitet. Brugere af forhåndsvisning beskriver en "blæsende" responshastighed og forbedret instruktionsfølgning og ræsonnement sammenlignet med tidligere Qwen3-varianter. Alibaba positionerer modellen som et flagskib med høj kapacitet til produktions-, agent- og udviklerscenarier.

Tilgængelighed og adgang

Alibaba Cloud-gebyrer niveaubaseret, tokenbaseret Priser for Qwen3-Max-Preview (separate input- og outputtakster). Fakturering sker pr. million tokens og anvendes på de faktisk forbrugte tokens efter enhver gratis kvote.

Alibabas offentliggjorte forhåndsvisningspriser (USD) justeres efter anmodning indgang tokenvolumen (de samme niveauer bestemmer hvilke enhedsrater der gælder):

0–32K inputtokens: $0.861 / 1 mio. input-tokens og $3.441 / 1 mio. output-tokens.
32–128 inputtokens: $1.434 / 1 mio. input-tokens og $5.735 / 1 mio. output-tokens.
128–252 inputtokens: $2.151 / 1 mio. input-tokens og $8.602 / 1 mio. output-tokens.

CometAPI tilbyder en officiel rabat på 20% for at hjælpe brugere med at ringe til API'en. Se detaljerne på Qwen3-Max-forhåndsvisning:


Indtast tokens	$0.24
Output tokens	$2.42

Qwen3-Max udvider Qwen3-familien (som har brugt hybriddesigns som Mixture-of-Experts-varianter og flere aktive parameterniveauer i tidligere builds). Alibabas tidligere Qwen3-udgivelser fokuserede på både "tænknings"- (trinvis ræsonnement) og "instruktions"-tilstande; Qwen3-Max er positioneret som den nye top-end instruktionsvariant i den serie, hvilket viser, at den overgår virksomhedens tidligere bedst ydende produkt, Qwen3-235B-A22B-2507, hvilket viser, at 1T-parametermodellen er førende på tværs af en række tests.

På SuperGPQA, AIME25, LiveCodeBench v6, Arena-Hard v2 og LiveBench (20241125) ligger Qwen3-Max-Preview konsekvent foran Claude Opus 4, Kimi K2 og Deepseek-V3.1.

Alibaba AI afslører Qwen3-Max: Qwen-model med billioner af parametre, CometAPI understøtter

Sådan får du adgang til og bruger Qwen3-Max (praktisk guide)

1) Prøv det i browseren (Qwen Chat)

Besøg Qwen Chat (officiel Qwen web-/chatgrænseflade) og vælg Qwen3-Max-forhåndsvisning (Instruktions)model, hvis den vises i modelvælgeren. Dette er den hurtigste måde at evaluere samtale- og instruktionsopgaver visuelt.

2) Adgang via Alibaba Cloud (Model Studio / Cloud API)

Log ind på Alibaba Cloud → Modelstudie / ModelserveringOpret en inferensinstans, eller vælg det hostede modelslutpunkt for qwen3-max-forhåndsvisning (eller den mærkede forhåndsvisningsversion).
Godkend ved hjælp af dine Alibaba Cloud Access Key / RAM-roller, og kald inferensslutpunktet med en POST-anmodning, der indeholder din prompt og eventuelle genereringsparametre (temperatur, maks. antal tokens osv.).

3) Brug gennem tredjepartshosts/aggregatorer

Ifølge dækningen er forhåndsvisningen tilgængelig via CometAPI og andre API-aggregatorer, der giver udviklere mulighed for at kalde flere hostede modeller med en enkelt API-nøgle. Dette kan forenkle test på tværs af udbydere, men verificere latenstid, regional tilgængelighed og datahåndteringspolitikker for hver vært.

Kom godt i gang

CometAPI er en samlet API-platform, der samler over 500 AI-modeller fra førende udbydere – såsom OpenAIs GPT-serie, Googles Gemini, Anthropics Claude, Midjourney, Suno og flere – i en enkelt, udviklervenlig grænseflade. Ved at tilbyde ensartet godkendelse, formatering af anmodninger og svarhåndtering forenkler CometAPI dramatisk integrationen af AI-funktioner i dine applikationer. Uanset om du bygger chatbots, billedgeneratorer, musikkomponister eller datadrevne analysepipelines, giver CometAPI dig mulighed for at iterere hurtigere, kontrollere omkostninger og forblive leverandøruafhængig – alt imens du udnytter de seneste gennembrud på tværs af AI-økosystemet.

Konklusion

Qwen3-Max-Preview placerer Alibaba helt i top blandt organisationer, der leverer billionskalamodeller til kunder. Kombinationen af ekstrem kontekstlængde og en OpenAI-kompatibel API sænker integrationsbarrieren for virksomheder, der har brug for lange dokumenter, kodeautomatisering eller agentorkestrering. Omkostninger og forhåndsvisningsstabilitet er de vigtigste overvejelser om implementering: Organisationer vil gerne afprøve caching, streaming og batch-kald for at styre både latenstid og prissætning.