gpt-oss-20b - это портативная модель рассуждений с открытым весом предлагающий производительность уровня o3‑mini, использование удобного для агента инструмента, и полный поддержка цепочки мыслей по разрешительной лицензии. Хотя он не такой мощный, как аналог на 120 Б, он идеально подходит для развертывания на устройстве, с низкой задержкой и с учетом конфиденциальностиРазработчики должны взвесить его известные композиционные ограничения, особенно при выполнении задач, требующих больших знаний, и соответствующим образом адаптировать меры безопасности.
Основная информация
gpt-oss-20b - это Модель рассуждений с открытым весом и 21 миллиардом параметров выпущенный OpenAI под Лицензия Apache 2.0, Что позволяет полный доступ для загрузки, настройки и распространенияЭто первый выпуск модели OpenAI с открытым весом с тех пор. GPT‑2 в 2019 году и оптимизирован для развертывание на границе и локальный вывод на системах с ≥ 16 ГБ видеопамяти.
- Параметры: Всего 21 миллиард, из которых 3.6 миллиарда активны на каждый токен
- Архитектура: Трансформатор с смесь экспертов (МО)
- Контекстное окно: До 128 000 токенов за понимание длинной формы
- Лицензия: Apache 2.0, обеспечивающий неограниченное академическое и коммерческое использование ().
Особенности и техническая архитектура
Технические характеристики модели
- Параметры: всего 21 Б, 3.6 B активных на токен через архитектуру «Смесь экспертов» (MoE) с 32 эксперта на слой, 4 активных на токен .
- Слои: 24, контекстное окно до 128 тысяч токенов, максимальный выход токенов до 32K в некоторых развертываниях.
- Внимание и память: Чередование плотных и разреженных моделей внимания; групповое внимание по нескольким запросам (размер группы = 8) для эффективности вывода.
Управление обучением и рассуждением
- Обучение по англоязычным текстам с упором на STEM, кодирование и общие знания.
- Поддержка цепочка мыслей (ЦМ) рассуждения и регулируемые уровни рассуждения (Низкий, Средний, Высокий) в зависимости от сложности задачи.
Тестовая производительность
- Совпадает или превосходит производительность модели o3‑mini от OpenAI на таких бенчмарках, как MMLU, AIME, HLE, HealthBench, Codeforces, Tau‑Bench даже в меньшем размере.
- Превосходит фирменные модели, такие как OpenAI o1, GPT‑4o и o4‑mini в здравоохранении и математическом мышлении задачи на высокий уровень рассуждения.
- По сравнению с более крупным GPT‑OSS‑120B (117 Б) он уступает в задачах, требующих глубокого символьного мышления или обширных знаний (например, GPQA), но остается эффективным в областях кодирования и здравоохранения.
The 20 B вариант также впечатляет: он соперничает о3-мини в том же пакете, несмотря на его меньшие размеры, демонстрируя эффективное масштабирование возможностей рассуждений с помощью MoE.
- MMLU (Массовое многозадачное понимание языка): точность ~88%
- Codeforces Elo (кодирование рассуждений): ~ 2205
- AIME (математический конкурс с инструментами): ~87.9%
- HealthBench: Значительно превосходит o4-mini в задачах клинического контроля качества и диагностики
- Tau-Bench (Розничная торговля + Задачи на рассуждение): ~62% в среднем
Версия модели и сравнение
| Модель | Параметры | Активные параметры | Необходимость оборудования | Тестовая производительность |
|---|---|---|---|---|
gpt-oss-20b | 21 Б | 3.6 Б | ≥ 16 ГБ видеопамяти или на устройстве | Сравним с o3‑мини |
| gpt‑oss‑120b | 117 Б | 5.1 Б | 80 ГБ+ графический процессор | Соответствует или превосходит o4‑мини |
Разработан как легкий аналог gpt‑oss‑120BGPT‑OSS‑20B обеспечивает портативность, сохраняя при этом высокую производительность задач в условиях ограниченных ресурсов. Он выделяется на фоне проприетарных моделей OpenAI своей открытостью и возможностью настройки.
ограничения
- Более низкий уровень запоминания знаний на сложных задачах, таких как GPQA, по сравнению с более крупными моделями.
- Отчеты пользователей указывают на изменчивость в реальной производительности, особенно при кодировании или подсказках общего характера; некоторые связывают это с ранним внедрением или неправильным использованием подсказок.
- Риски безопасности и неправильного использования: Хотя OpenAI оценила состязательные тонко настроенные варианты gpt-oss, даже они не достигли высоких возможностей в областях биорисков или кибербезопасности; тем не менее, пользователям, развертывающим крупномасштабные сценарии использования, могут потребоваться дополнительные меры безопасности.
Случаи использования
OpenAI разработал GPT‑OSS для поддержки широкий спектр вариантов использования, от потребительских приложений до аналитики корпоративного уровня. Вариант 20B оптимизирован для локального выполнения и может работать на устройствах с минимальными требованиями 16GB оперативной памяти, Такие, как высокопроизводительные ноутбуки или MacBook с чипами серии M. GPT‑OSS‑20B идеально подходит для:
- Локальный/офлайновый вывод на ПК с ОС Windows (через Windows AI Foundry), macOS или периферийных устройствах на базе Snapdragon.
- Агентские рабочие процессы: выполнение кода, использование инструментов, браузерные агенты или автономные помощники в условиях ограниченной пропускной способности.
- Быстрое прототипирование и тонкая настройка, особенно для разработчиков, работающих без облачной инфраструктуры или с ограничениями конфиденциальности.
Другие сравнения моделей
gpt-oss-20bпротив o3‑mini / o4‑mini: GPT‑OSS‑20B соперничает с o3‑mini по точности и связности рассуждений; он более эффективен и открыт, чем o4‑mini, но уступает по производительности gpt‑oss‑120B при решении сложных задач на рассуждение.gpt-oss-20bпротив LLaMA 4, GLM‑4.5, DeepSeek: GPT‑OSS‑20B обеспечивает полную прозрачность открытого веса в Apache 2.0, в отличие от полуоткрытых моделей; но пользователи сообщают, что в некоторых случаях предпочитают GLM‑4.5‑AIR по качеству рассуждений.
Как позвонить gpt-oss-20b API от CometAPI
gpt-oss-20b Цены на API в CometAPI, скидка 20% от официальной цены:
| Входные токены | $0.08 |
| Выходные токены | $0.32 |
Необходимые шаги
- Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
- Получите ключ API-интерфейса для доступа к учетным данным. Нажмите «Добавить токен» в API-токене в персональном центре, получите ключ токена: sk-xxxxx и отправьте.
- Получите URL этого сайта: https://api.cometapi.com/
Используйте метод
- Выберите "
gpt-oss-20b” конечная точка для отправки запроса API и установки тела запроса. Метод запроса и тело запроса получены из нашего веб-сайта API doc. Наш веб-сайт также предоставляет тест Apifox для вашего удобства. - Заменять с вашим реальным ключом CometAPI из вашей учетной записи.
- Введите свой вопрос или запрос в поле «Контент» — на него ответит модель.
- . Обработайте ответ API, чтобы получить сгенерированный ответ.
CometAPI предоставляет полностью совместимый REST API для беспроблемной миграции. Ключевые детали API документ:
- Основные параметры:
prompt,max_tokens_to_sample,temperature,stop_sequences - Конечная точка: https://api.cometapi.com/v1/chat/completions
- Параметр модели:
gpt-oss-20b - Аутентификация:
Bearer YOUR_CometAPI_API_KEY - Тип содержимого:
application/json.
Пример вызова API
Несмотря на открытость, модели GPT‑OSS доступны через API, такие как CometAPI и другие. gpt‑oss‑20Bтипичный вызов CometAPI выглядит так:
POST https://api.cometapi.com/v1/chat/completions
{
"model": "gpt-oss-20b",
"messages": [{ "role": "system", "content": "Reasoning: high" },
{ "role": "user", "content": "Solve bilateral integral…" }],
"max_tokens": 2048,
"temperature": 0.0
}
Это поддерживает вызов функций, структурированные схемы вывода, интеграцию инструментов и управление рассуждениями с помощью системных подсказок.
См. также ГПТ-ОСС-120Б


