ByteDance с открытым исходным кодом Seed-OSS-36B, LLM с 36B-параметрами

CometAPI
AnnaAug 23, 2025
ByteDance с открытым исходным кодом Seed-OSS-36B, LLM с 36B-параметрами

Команда Seed компании ByteDance выпустила Seed-OSS, семейство моделей большого языка с открытым исходным кодом, возглавляемое Seed-OSS-36B, модель с 36 миллиардами параметров, поддерживающая исключительно длинные окна ввода и распространяемая по лицензии Apache-2.0. Код и карточки модели были опубликованы на GitHub и Hugging Face 20 августа 2025 года, и несколько вариантов, включая базовую версию и версию Instruct (а также версии, обученные на синтетических данных), уже доступны разработчикам.

Что Seed-OSS был выпущен

ByteDance Seed выпустила три варианта Seed-OSS: Seed-OSS-36B-Base (опубликовано в версиях с синтетическими данными и без них) и Seed-OSS-36B-Instruct

Основные технические особенности Seed-OSS

  • Количество параметров: Модель заголовка описывается как 36 миллиардов параметров модель. \
  • Очень длинное контекстное окно: ByteDance рекламирует чрезвычайно большую длину контекста — до 512,000 XNUMX токенов — нацелен на обоснование длинных документов, кодовые базы и рабочие процессы агентов с несколькими документами. \
  • Шкала обучения: Сообщается, что Seed-OSS достигла высоких показателей производительности, несмотря на то, что обучалась примерно на 12 триллионов токенов, согласно документации модели.

Серия моделей Seed-OSS основана на популярной архитектуре каузальной языковой модели и использует RoPE, механизм внимания GQA, RMS Norm и функцию активации SwiGLU. Новая модель Seed-OSS-36B может похвастаться 36 миллиардами параметров и способна обрабатывать 512 КБ длинного контекста. Несмотря на использование всего 12 триллионов обучающих данных, она демонстрирует впечатляющие результаты в нескольких популярных бенчмарках.

Серия моделей Seed-OSS включает две версии: Seed-OSS-36B-Base с данными синтетических инструкций и Seed-OSS-36B-Base-woSyn без данных синтетических инструкций. Эта конструкция не только предоставляет разработчикам высокопроизводительную базовую модель, но и предоставляет исследователям более широкий спектр возможностей, гарантируя, что валидность их исследований не будет поставлена ​​под угрозу синтетическими данными.

Ключевой особенностью этой модели является гибкий «бюджет мышления», позволяющий пользователям динамически корректировать длительность вывода по мере необходимости. Эта возможность значительно повышает эффективность вывода в реальных приложениях. Более того, Seed-OSS специально оптимизирован для задач вывода, обеспечивая расширенные возможности рассуждений при сохранении высокой общей производительности.

На презентации команда Seed подчеркнула, что модель Seed-OSS подходит не только для академических исследований, но и широко применима к различным задачам разработки, таким как задачи агентного интеллекта, такие как использование инструментов и решение проблем. Результаты обучения и оценки модели показывают, что Seed-OSS демонстрирует лидирующие показатели среди решений с открытым исходным кодом в таких задачах, как ответы на вопросы, математические рассуждения и программирование.

Первые шаги

CometAPI — это унифицированная платформа API, которая объединяет более 500 моделей ИИ от ведущих поставщиков, таких как серия GPT OpenAI, Gemini от Google, Claude от Anthropic, Midjourney, Suno и других, в единый, удобный для разработчиков интерфейс. Предлагая последовательную аутентификацию, форматирование запросов и обработку ответов, CometAPI значительно упрощает интеграцию возможностей ИИ в ваши приложения. Независимо от того, создаете ли вы чат-ботов, генераторы изображений, композиторов музыки или конвейеры аналитики на основе данных, CometAPI позволяет вам выполнять итерации быстрее, контролировать расходы и оставаться независимыми от поставщика — и все это при использовании последних достижений в экосистеме ИИ.

Последняя интеграция Seed-OSS скоро появится на CometAPI, поэтому следите за новостями! Пока мы завершаем загрузку модели Seed-OSS, изучите другие наши модели изображений, такие как ДипСик V3.1 В вашем рабочем процессе или попробуйте их в AI Playground. Вы можете изучить возможности модели в Детская Площадка Подробные инструкции см. в руководстве по API. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагает цену значительно ниже официальной, чтобы помочь вам с интеграцией.

Читать далее

500+ моделей в одном API

Скидка до 20%