ByteDance udostępnia kod źródłowy Seed-OSS-36B, 36-bajtowego modelu LLM

CometAPI
AnnaAug 23, 2025
ByteDance udostępnia kod źródłowy Seed-OSS-36B, 36-bajtowego modelu LLM

Zespół Seed z ByteDance wydał Seed-OSS, rodzina dużych modeli językowych o otwartym kodzie źródłowym, której przewodzi Seed-OSS-36B, model o 36 miliardach parametrów, obsługujący wyjątkowo długie okna wejściowe i dystrybuowany na licencji Apache-2.0. Kod i karty modelu zostały opublikowane na GitHubie i Hugging Face 20 sierpnia 2025 roku, a wiele wariantów – w tym Base i Instruct (oraz wersje trenowane z wykorzystaniem danych syntetycznych) – jest już dostępnych dla programistów.

Co zostało wydane w ramach Seed-OSS

ByteDance Seed wydało trzy warianty Seed-OSS: Seed-OSS-36B-Base (opublikowane w wersjach z danymi syntetycznymi i bez nich) i Seed-OSS-36B-Instruct

Najważniejsze cechy techniczne Seed-OSS

  • Liczba parametrów: Model tytułowy jest opisany jako 36 miliardów parametrów modelu. \
  • Bardzo długie okno kontekstowe: ByteDance reklamuje niezwykle dużą długość kontekstu — do 512,000 XNUMX tokenów — ukierunkowany na rozumowanie oparte na długich dokumentach, bazach kodów i przepływach pracy agentów obejmujących wiele dokumentów. \
  • Skala szkolenia: Według doniesień Seed-OSS osiągnął wysoką wydajność w testach, mimo że był trenowany na około 12 bilionów tokenów, zgodnie z dokumentacją modelu.

Seria modeli Seed-OSS opiera się na popularnej architekturze modelu języka przyczynowego i wykorzystuje RoPE, mechanizm uwagi GQA, normę RMS oraz funkcję aktywacji SwiGLU. Nowo wydany model Seed-OSS-36B oferuje 36 miliardów parametrów i jest w stanie obsłużyć 512 KB długiego kontekstu. Pomimo wykorzystania zaledwie 12 bilionów danych treningowych, osiąga imponującą wydajność w wielu popularnych testach porównawczych.

Seria modeli Seed-OSS obejmuje dwie wersje: Seed-OSS-36B-Base z syntetycznymi danymi instrukcji oraz Seed-OSS-36B-Base-woSyn bez syntetycznych danych instrukcji. Ta konstrukcja nie tylko zapewnia programistom wydajny model bazowy, ale także oferuje badaczom szerszy zakres opcji, gwarantując, że wiarygodność ich badań nie zostanie podważona przez syntetyczne dane.

Kluczową cechą tego modelu jest elastyczny „budżet myślenia”, który pozwala użytkownikom dynamicznie dostosowywać długość wnioskowania w zależności od potrzeb. Ta możliwość znacząco poprawia efektywność wnioskowania w rzeczywistych zastosowaniach. Co więcej, Seed-OSS jest zoptymalizowany pod kątem zadań wnioskowania, zapewniając ulepszone możliwości wnioskowania przy jednoczesnym zachowaniu dobrej ogólnej wydajności.

Podczas wydarzenia inauguracyjnego zespół Seed podkreślił, że model Seed-OSS nadaje się nie tylko do badań akademickich, ale także ma szerokie zastosowanie w różnych zadaniach programistycznych, takich jak zadania z zakresu inteligencji agentowej, takie jak korzystanie z narzędzi i rozwiązywanie problemów. Wyniki szkolenia i ewaluacji modelu pokazują, że Seed-OSS osiąga wiodącą wydajność w środowisku open source w takich zadaniach, jak odpowiadanie na pytania z zakresu wiedzy, rozumowanie matematyczne i programowanie.

Jak zacząć

CometAPI to ujednolicona platforma API, która agreguje ponad 500 modeli AI od wiodących dostawców — takich jak seria GPT firmy OpenAI, Gemini firmy Google, Claude firmy Anthropic, Midjourney, Suno i innych — w jednym, przyjaznym dla programistów interfejsie. Oferując spójne uwierzytelnianie, formatowanie żądań i obsługę odpowiedzi, CometAPI radykalnie upraszcza integrację możliwości AI z aplikacjami. Niezależnie od tego, czy tworzysz chatboty, generatory obrazów, kompozytorów muzycznych czy oparte na danych potoki analityczne, CometAPI pozwala Ci szybciej iterować, kontrolować koszty i pozostać niezależnym od dostawcy — wszystko to przy jednoczesnym korzystaniu z najnowszych przełomów w ekosystemie AI.

Najnowsza integracja Seed-OSS wkrótce pojawi się w CometAPI, więc bądźcie czujni! Podczas gdy finalizujemy przesyłanie modelu Seed-OSS, zapoznaj się z naszymi innymi modelami obrazów, takimi jak: DeepSeek V3.1 w swoim przepływie pracy lub wypróbuj je w AI Playground. Możesz zapoznać się z możliwościami modelu w Plac zabaw Zapoznaj się z przewodnikiem API, aby uzyskać szczegółowe instrukcje. Przed uzyskaniem dostępu upewnij się, że zalogowałeś się do CometAPI i uzyskałeś klucz API. CometAPI oferuje cenę znacznie niższą niż oficjalna, aby ułatwić integrację.

Czytaj więcej

500+ modeli w jednym API

Do 20% zniżki