El equipo Seed de ByteDance ha lanzado Semilla-OSS, una familia de modelos de lenguaje grandes de código abierto liderada por Semilla-OSS-36B, un modelo de 36 mil millones de parámetros que admite ventanas de entrada excepcionalmente largas y se distribuye bajo la licencia Apache-2.0. El código y las tarjetas del modelo se publicaron en GitHub y Hugging Face el 20 de agosto de 2025, y múltiples variantes, incluyendo una versión Base y una Instruct (además de versiones entrenadas con datos sintéticos), están disponibles de inmediato para los desarrolladores.
¿Qué Seed-OSS se lanzó?
ByteDance Seed lanzó tres variantes de Seed-OSS: Seed-OSS-36B-Base (publicado en versiones con y sin datos sintéticos) y Seed-OSS-36B-Instruct
Aspectos técnicos clave de Seed-OSS
- Recuento de parámetros: El modelo principal se describe como un 36 mil millones de parámetros modelo. \
- Ventana de contexto muy larga: ByteDance anuncia una longitud de contexto extremadamente grande: hasta 512,000 tokens — destinado al razonamiento de documentos largos, bases de código y flujos de trabajo de agentes de múltiples documentos.
- Escala de entrenamiento: Se informa que Seed-OSS alcanzó un sólido rendimiento de referencia a pesar de haber sido entrenado aproximadamente 12 billones de tokens, según la documentación del modelo.
La serie de modelos Seed-OSS se basa en la popular arquitectura de modelos de lenguaje causal y utiliza RoPE, el mecanismo de atención GQA, RMS Norm y la función de activación SwiGLU. El nuevo modelo Seed-OSS-36B cuenta con 36 mil millones de parámetros y es capaz de gestionar 512 KB de contexto extenso. A pesar de utilizar solo 12 billones de datos de entrenamiento, alcanza un rendimiento impresionante en múltiples pruebas de referencia populares.
La serie de modelos Seed-OSS incluye dos versiones: Seed-OSS-36B-Base con datos de instrucciones sintéticas y Seed-OSS-36B-Base-woSyn sin datos de instrucciones sintéticas. Este diseño no solo proporciona a los desarrolladores un modelo base de alto rendimiento, sino que también ofrece a los investigadores una gama más amplia de opciones, garantizando que la validez de su investigación no se vea comprometida por los datos sintéticos.
Una característica clave de este modelo es su flexible presupuesto de pensamiento, que permite a los usuarios ajustar dinámicamente la longitud de la inferencia según sea necesario. Esta capacidad mejora significativamente la eficiencia de la inferencia en aplicaciones del mundo real. Además, Seed-OSS está específicamente optimizado para tareas de inferencia, lo que garantiza una mayor capacidad de razonamiento y mantiene un buen rendimiento general.
En el evento de lanzamiento, el equipo de Seed enfatizó que el modelo Seed-OSS no solo es adecuado para la investigación académica, sino que también se aplica ampliamente a diversas tareas de desarrollo, como tareas de inteligencia basada en agentes, como el uso de herramientas y la resolución de problemas. Los resultados del entrenamiento y la evaluación del modelo demuestran que Seed-OSS alcanza un rendimiento líder en código abierto en tareas como la respuesta a preguntas de conocimiento, el razonamiento matemático y la programación.
Primeros Pasos
CometAPI es una plataforma API unificada que integra más de 500 modelos de IA de proveedores líderes, como la serie GPT de OpenAI, Gemini de Google, Claude de Anthropic, Midjourney, Suno y más, en una única interfaz intuitiva para desarrolladores. Al ofrecer autenticación, formato de solicitudes y gestión de respuestas consistentes, CometAPI simplifica drásticamente la integración de las capacidades de IA en sus aplicaciones. Ya sea que esté desarrollando chatbots, generadores de imágenes, compositores musicales o canales de análisis basados en datos, CometAPI le permite iterar más rápido, controlar costos y mantenerse independiente del proveedor, todo mientras aprovecha los últimos avances del ecosistema de IA.
La última integración Seed-OSS aparecerá pronto en CometAPI, ¡así que estad atentos! Mientras finalizamos la carga del modelo Seed-OSS, explora nuestros otros modelos de imágenes, como Búsqueda profunda V3.1 en su flujo de trabajo o pruébelos en el AI Playground. Puede explorar las capacidades del modelo en el Playground Consulte la guía de la API para obtener instrucciones detalladas. Antes de acceder, asegúrese de haber iniciado sesión en CometAPI y obtenido la clave API. CometAPI ofrece un precio mucho menor al oficial para facilitar la integración.
