ByteDance open source Seed-OSS-36B, en 36B-parameter LLM

CometAPI
AnnaAug 23, 2025
ByteDance open source Seed-OSS-36B, en 36B-parameter LLM

ByteDances Seed-team har udgivet Frø-OSS, en familie af store open source-sprogmodeller ledet af Frø-OSS-36B, en model med 36 milliarder parametre, der understøtter exceptionelt lange inputvinduer og distribueres under en Apache-2.0-licens. Kode- og modelkortene blev offentliggjort på GitHub og Hugging Face den 20. august 2025, og flere varianter - herunder en Base- og en Instruct-variant (plus versioner trænet med syntetiske data) - er øjeblikkeligt tilgængelige for udviklere.

Hvilken Seed-OSS blev udgivet

ByteDance Seed udgav tre Seed-OSS-varianter: Seed-OSS-36B-Base (udgivet i versioner med og uden syntetiske data) og Seed-OSS-36B-Instruct

Vigtige tekniske højdepunkter i Seed-OSS

  • Parameterantal: Hovedmodellen beskrives som en 36-milliard-parameter model. \
  • Meget langt kontekstvindue: ByteDance reklamerer med en ekstremt lang kontekstlængde — op til 512,000 tokens — rettet mod ræsonnement med lange dokumenter, kodebaser og arbejdsgange for agenter med flere dokumenter.
  • Træningsskala: Seed-OSS opnåede angiveligt stærk benchmark-ydeevne på trods af at være trænet på omtrent 12 billioner tokens, ifølge modeldokumentationen.

Seed-OSS-modelserien er baseret på den populære kausale sprogmodelarkitektur og anvender RoPE, GQA-opmærksomhedsmekanismen, RMS Norm og SwiGLU-aktiveringsfunktionen. Den nyligt udgivne Seed-OSS-36B-model kan prale af 36 milliarder parametre og er i stand til at håndtere 512 KB lang kontekst. På trods af kun at bruge 12 billioner træningsdata, opnår den imponerende ydeevne på flere populære benchmarks.

Seed-OSS-modelserien indeholder to versioner: Seed-OSS-36B-Base med syntetiske instruktionsdata og Seed-OSS-36B-Base-woSyn uden syntetiske instruktionsdata. Dette design giver ikke kun udviklere en højtydende basismodel, men tilbyder også forskere en bredere vifte af muligheder, hvilket sikrer, at validiteten af ​​deres forskning ikke kompromitteres af syntetiske data.

En nøglefunktion ved denne model er det fleksible "tænkebudget", der giver brugerne mulighed for dynamisk at justere inferenslængden efter behov. Denne funktion forbedrer inferenseffektiviteten betydeligt i virkelige applikationer. Derudover er Seed-OSS specifikt optimeret til inferensopgaver, hvilket sikrer forbedrede ræsonnementsevner, samtidig med at god generel ydeevne opretholdes.

Ved lanceringsarrangementet understregede Seed-teamet, at Seed-OSS-modellen ikke kun er egnet til akademisk forskning, men også bredt anvendelig til forskellige udviklingsopgaver, såsom agentbaserede intelligensopgaver som værktøjsbrug og problemløsning. Resultaterne af modeltræning og evaluering viser, at Seed-OSS opnår førende præstationer inden for open source på tværs af opgaver som besvarelse af vidensspørgsmål, matematisk ræsonnement og programmering.

Kom godt i gang

CometAPI er en samlet API-platform, der samler over 500 AI-modeller fra førende udbydere – såsom OpenAIs GPT-serie, Googles Gemini, Anthropics Claude, Midjourney, Suno og flere – i en enkelt, udviklervenlig grænseflade. Ved at tilbyde ensartet godkendelse, formatering af anmodninger og svarhåndtering forenkler CometAPI dramatisk integrationen af ​​AI-funktioner i dine applikationer. Uanset om du bygger chatbots, billedgeneratorer, musikkomponister eller datadrevne analysepipelines, giver CometAPI dig mulighed for at iterere hurtigere, kontrollere omkostninger og forblive leverandøruafhængig – alt imens du udnytter de seneste gennembrud på tværs af AI-økosystemet.

Den seneste integration med Seed-OSS vil snart blive vist på CometAPI, så følg med! Mens vi færdiggør upload af Seed-OSS-modellen, kan du udforske vores andre billedmodeller, som f.eks. DeepSeek V3.1 på din arbejdsgang eller prøv dem i AI Playground. Du kan udforske modellens muligheder i Legeplads og se API-vejledningen for detaljerede instruktioner. Før du får adgang, skal du sørge for at være logget ind på CometAPI og have fået API-nøglen. CometAPI tilbyder en pris, der er langt lavere end den officielle pris, for at hjælpe dig med integrationen.

Læs mere

500+ modeller i én API

Op til 20% rabat