L'équipe Seed de ByteDance a publié Seed-OSS, une famille de grands modèles de langage open source dirigée par Graine-OSS-36B, un modèle de 36 milliards de paramètres prenant en charge des fenêtres d'entrée exceptionnellement longues et distribué sous licence Apache 2.0. Le code et les cartes du modèle ont été publiés sur GitHub et Hugging Face le 20 août 2025, et plusieurs variantes, dont une version Base et une version Instruct (ainsi que des versions entraînées avec des données synthétiques), sont immédiatement disponibles pour les développeurs.
Quel Seed-OSS a été publié
ByteDance Seed a publié trois variantes de Seed-OSS : Seed-OSS-36B-Base (publié dans des versions avec et sans données synthétiques) et Seed-OSS-36B-Instruct
Principaux points techniques de Seed-OSS
- Nombre de paramètres : Le modèle de titre est décrit comme un 36 milliards de paramètres modèle. \
- Fenêtre de contexte très longue : ByteDance annonce une longueur de contexte extrêmement grande — jusqu'à 512,000 XNUMX jetons — destiné au raisonnement sur de longs documents, aux bases de code et aux flux de travail d'agents multi-documents.
- Échelle de formation : Seed-OSS aurait atteint de solides performances de référence malgré une formation sur environ 12 XNUMX milliards de jetons, selon la documentation du modèle.
La série de modèles Seed-OSS repose sur l'architecture populaire des modèles de langage causal et utilise RoPE, le mécanisme d'attention GQA, la norme RMS et la fonction d'activation SwiGLU. Le nouveau modèle Seed-OSS-36B compte 36 milliards de paramètres et est capable de gérer 512 Ko de contexte long. Malgré seulement 12 XNUMX milliards de données d'entraînement, il atteint des performances impressionnantes sur de nombreux benchmarks populaires.
La série de modèles Seed-OSS comprend deux versions : Seed-OSS-36B-Base avec données d'instructions synthétiques et Seed-OSS-36B-Base-woSyn sans données d'instructions synthétiques. Cette conception offre non seulement aux développeurs un modèle de base performant, mais aussi aux chercheurs un plus large éventail d'options, garantissant ainsi que la validité de leurs recherches ne soit pas compromise par des données synthétiques.
L'une des principales caractéristiques de ce modèle est son « budget de réflexion » flexible, qui permet aux utilisateurs d'ajuster dynamiquement la durée de l'inférence selon leurs besoins. Cette fonctionnalité améliore considérablement l'efficacité de l'inférence dans les applications concrètes. De plus, Seed-OSS est spécifiquement optimisé pour les tâches d'inférence, garantissant des capacités de raisonnement améliorées tout en maintenant de bonnes performances générales.
Lors de l'événement de lancement, l'équipe Seed a souligné que le modèle Seed-OSS est non seulement adapté à la recherche universitaire, mais aussi largement applicable à diverses tâches de développement, telles que l'intelligence artificielle (IA) comme l'utilisation d'outils et la résolution de problèmes. Les résultats de l'entraînement et de l'évaluation du modèle démontrent que Seed-OSS atteint des performances de pointe en open source pour des tâches telles que la réponse à des questions de connaissances, le raisonnement mathématique et la programmation.
Pour commencer
CometAPI est une plateforme d'API unifiée qui regroupe plus de 500 modèles d'IA provenant de fournisseurs leaders, tels que la série GPT d'OpenAI, Gemini de Google, Claude d'Anthropic, Midjourney, Suno, etc., au sein d'une interface unique et conviviale pour les développeurs. En offrant une authentification, un formatage des requêtes et une gestion des réponses cohérents, CometAPI simplifie considérablement l'intégration des fonctionnalités d'IA dans vos applications. Que vous développiez des chatbots, des générateurs d'images, des compositeurs de musique ou des pipelines d'analyse pilotés par les données, CometAPI vous permet d'itérer plus rapidement, de maîtriser les coûts et de rester indépendant des fournisseurs, tout en exploitant les dernières avancées de l'écosystème de l'IA.
La dernière intégration Seed-OSS apparaîtra bientôt sur CometAPI, alors restez à l'écoute ! Pendant que nous finalisons le téléchargement du modèle Seed-OSS, explorez nos autres modèles d'images tels que Recherche profonde V3.1 sur votre flux de travail ou essayez-les dans l'IA Playground. Vous pouvez explorer les capacités du modèle dans cour de récréation Consultez le guide de l'API pour des instructions détaillées. Avant d'accéder à CometAPI, assurez-vous d'être connecté à CometAPI et d'avoir obtenu la clé API. CometAPI propose un prix bien inférieur au prix officiel pour faciliter l'intégration.
