ByteDance 的 Seed 团队发布了 Seed-OSS,这是一系列开源的大型语言模型,领衔的是 Seed-OSS-36B,一款拥有 360 亿参数、支持超长输入窗口并在 Apache-2.0 许可证下分发的模型。代码和模型卡已于 2025 年 8 月 20 日在 GitHub 和 Hugging Face 发布,多个变体——包括 Base 和 Instruct 风格(以及使用合成数据训练的版本)——已立即向开发者开放。
发布了哪些 Seed-OSS
ByteDance Seed 发布了三个 Seed-OSS 变体:Seed-OSS-36B-Base(提供含合成数据与不含合成数据两个版本)以及 Seed-OSS-36B-Instruct
Seed-OSS 的关键技术亮点
- 参数规模:旗舰模型为 360 亿参数。 \
- 超长上下文窗口:ByteDance 宣称上下文长度可达 512,000 token,面向长文档推理、代码库与多文档智能体工作流。 \
- 训练规模:据模型文档,Seed-OSS 在约 12 万亿 token 的训练数据下仍取得了强劲的基准表现。
Seed-OSS 模型系列基于流行的因果语言模型架构,采用 RoPE、GQA 注意力机制、RMS Norm 和 SwiGLU 激活函数。新发布的 Seed-OSS-36B 模型拥有 360 亿参数,能够处理 512KB 的长上下文。尽管仅使用约 12 万亿训练数据,仍在多项常用基准上表现出色。
Seed-OSS 模型系列包括两个版本:含合成指令数据的 Seed-OSS-36B-Base 和不含合成指令数据的 Seed-OSS-36B-Base-woSyn。该设计不仅为开发者提供高性能的基础模型,也为研究者提供更广泛的选择,确保研究有效性不受合成数据影响。
该模型的一项关键特性是灵活的“思考预算”,允许用户按需动态调整推理长度。这一能力显著提升了在真实应用中的推理效率。此外,Seed-OSS 针对推理任务进行了专门优化,在增强推理能力的同时保持良好的通用性能。
在发布会上,Seed 团队强调,Seed-OSS 不仅适用于学术研究,也广泛适用于各类开发任务,例如基于智能体的任务(如工具使用与问题求解)。模型训练与评估结果显示,Seed-OSS 在知识问答、数学推理与编程等任务的开源领域中取得领先表现。
入门
CometAPI 是一个统一的 API 平台,将来自领先提供商的 500+ 款 AI 模型(如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)聚合到一个对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理,CometAPI 显著简化了将 AI 能力集成到你的应用中的过程。无论你在构建聊天机器人、图像生成器、音乐创作工具,还是数据驱动的分析流水线,CometAPI 都能帮助你更快迭代、控制成本并保持不依赖特定厂商,同时获取整个 AI 生态的最新突破。
最新的集成 Seed-OSS 即将登陆 CometAPI,敬请期待!在我们完成 Seed-OSS 模型的上传期间,你可以在你的工作流中探索其他图像模型,例如 DeepSeek V3.1,或在 AI Playground 尝试它们。你可以在 Playground 中探索模型能力,并查阅 API 指南获取详细说明。访问前,请确保已登录 CometAPI 并获得 API 密钥。CometAPI 提供远低于官方价格的费用方案,帮助你完成集成。
