ByteDance rende open source Seed-OSS-36B, un LLM con 36B parametri

CometAPI
AnnaAug 23, 2025
ByteDance rende open source Seed-OSS-36B, un LLM con 36B parametri

Il team Seed di ByteDance ha rilasciato Seed-OSS, una famiglia di modelli di linguaggio di grandi dimensioni open source guidata da Seme-OSS-36B, un modello da 36 miliardi di parametri che supporta finestre di input eccezionalmente lunghe e viene distribuito con licenza Apache-2.0. Il codice e le schede del modello sono stati pubblicati su GitHub e Hugging Face il 20 agosto 2025 e diverse varianti, tra cui una versione Base e una versione Instruct (oltre a versioni addestrate con dati sintetici), sono immediatamente disponibili per gli sviluppatori.

Che cosa è stato rilasciato Seed-OSS

ByteDance Seed ha rilasciato tre varianti di Seed-OSS: Seed-OSS-36B-Base (pubblicato in versioni con e senza dati sintetici) e Seed-OSS-36B-Instruct

Caratteristiche tecniche principali di Seed-OSS

  • Conteggio parametri: Il modello del titolo è descritto come un 36 miliardi di parametri modello.
  • Finestra di contesto molto lunga: ByteDance pubblicizza una lunghezza del contesto estremamente ampia: fino a 512,000 token — mirato al ragionamento su documenti lunghi, basi di codice e flussi di lavoro di agenti multi-documento.
  • Scala di allenamento: Secondo quanto riferito, Seed-OSS ha raggiunto ottime prestazioni di riferimento nonostante sia stato addestrato su circa 12 trilioni di token, secondo la documentazione del modello.

La serie di modelli Seed-OSS si basa sulla popolare architettura del modello linguistico causale e utilizza RoPE, il meccanismo di attenzione GQA, RMS Norm e la funzione di attivazione SwiGLU. Il modello Seed-OSS-36B, recentemente rilasciato, vanta 36 miliardi di parametri ed è in grado di gestire 512 KB di contesto lungo. Pur utilizzando solo 12 trilioni di dati di training, raggiunge prestazioni impressionanti su numerosi benchmark popolari.

La serie di modelli Seed-OSS include due versioni: Seed-OSS-36B-Base con dati di istruzioni sintetici e Seed-OSS-36B-Base-woSyn senza dati di istruzioni sintetici. Questa progettazione non solo fornisce agli sviluppatori un modello di base ad alte prestazioni, ma offre anche ai ricercatori una gamma più ampia di opzioni, garantendo che la validità della loro ricerca non sia compromessa dai dati sintetici.

Una caratteristica chiave di questo modello è il "budget di pensiero" flessibile, che consente agli utenti di adattare dinamicamente la lunghezza dell'inferenza in base alle esigenze. Questa capacità migliora significativamente l'efficienza dell'inferenza nelle applicazioni reali. Inoltre, Seed-OSS è specificamente ottimizzato per le attività di inferenza, garantendo capacità di ragionamento avanzate pur mantenendo buone prestazioni generali.

Durante l'evento di lancio, il team di Seed ha sottolineato che il modello Seed-OSS non è adatto solo alla ricerca accademica, ma è anche ampiamente applicabile a diverse attività di sviluppo, come quelle di intelligence basata su agenti, come l'utilizzo di strumenti e la risoluzione di problemi. I risultati dell'addestramento e della valutazione del modello dimostrano che Seed-OSS raggiunge prestazioni leader nell'open source in attività come la risposta a domande di conoscenza, il ragionamento matematico e la programmazione.

Iniziamo

CometAPI è una piattaforma API unificata che aggrega oltre 500 modelli di intelligenza artificiale (IA) di provider leader, come la serie GPT di OpenAI, Gemini di Google, Claude di Anthropic, Midjourney, Suno e altri, in un'unica interfaccia intuitiva per gli sviluppatori. Offrendo autenticazione, formattazione delle richieste e gestione delle risposte coerenti, CometAPI semplifica notevolmente l'integrazione delle funzionalità di IA nelle tue applicazioni. Che tu stia sviluppando chatbot, generatori di immagini, compositori musicali o pipeline di analisi basate sui dati, CometAPI ti consente di iterare più velocemente, controllare i costi e rimanere indipendente dal fornitore, il tutto sfruttando le più recenti innovazioni nell'ecosistema dell'IA.

L'ultima integrazione Seed-OSS apparirà presto su CometAPI, quindi rimanete sintonizzati! Mentre finalizziamo il caricamento del modello Seed-OSS, esplorate i nostri altri modelli di immagini come DeepSeek V3.1 sul tuo flusso di lavoro o provali nell'AI Playground. Puoi esplorare le capacità del modello in Parco giochi e consulta la guida API per istruzioni dettagliate. Prima di accedere, assicurati di aver effettuato l'accesso a CometAPI e di aver ottenuto la chiave API. CometAPI offre un prezzo molto più basso rispetto al prezzo ufficiale per aiutarti nell'integrazione.

Leggi di più

500+ Modelli in Una API

Fino al 20% di sconto