GPT-OSS-120B API

CometAPI
AnnaAug 7, 2025
GPT-OSS-120B API

OpenAI gpt-oss-120b әзірлеушілерді ұсынатын GPT-2-ден бері ұйымның бірінші ашық салмақты шығарылымын белгілейді Мөлдір, теңшелетін, және өнімділігі жоғары астында AI мүмкіндіктері Apache 2.0 лицензиясы. Талғампаздарға арналған Дәлелдеу және агенттік қолданбалар үшін бұл модель жергілікті орналастыруға және тереңдетілген дәлдікке мүмкіндік беретін озық үлкен тілді технологияларға қолжетімділікті демократияландырады.

Негізгі мүмкіндіктер және дизайн философиясы

GPT‑OSS үлгілері жалпы мақсаттағы, тек мәтіндік LLM ретінде жасалған. Олар жоғары деңгейдегі когнитивтік тапсырмаларды, соның ішінде математикалық пайымдауды, құрылымдық талдауды және тілді түсінуді қолдайды. GPT‑4 сияқты жабық коммерциялық үлгілерден айырмашылығы, GPT‑OSS модель салмақтарын толық жүктеп алуға және пайдалануға мүмкіндік береді, бұл зерттеушілер мен әзірлеушілерге модельдерді толығымен өз инфрақұрылымында тексеруге, дәл реттеуге және орналастыруға бұрын-соңды болмаған рұқсат береді.

Негізгі ақпарат

  • Параметрлер: барлығы 117 млрд, 5.1 млрд белсенді арқылы Сарапшылар қоспасы (ММ)
  • Лицензия: Apache 2.0 шектеусіз коммерциялық және академиялық пайдалануға арналған
  • Мәтінмәндік терезе: Дейін 128 мың токен, ұзақ пішінді енгізулерді және көп құжатты негіздеуді қолдау
  • Ой тізбегі: Толық КТ аудиторлық және нақты бақылауға арналған нәтижелер
  • Құрылымдық шығыстар: JSON, XML және теңшелетін схемаларға арналған жергілікті қолдау.

Техникалық Толығырақ

GPT-OSS пайдаланады a түрлендіру омыртқасы а Сарапшылар қоспасы (ММ) сирек белсендіруге қол жеткізу және қорытынды шығындарды азайту үшін архитектура. The gpt-oss-120b моделін қамтиды 128 сарапшылары бойынша таратылады 36 қабаты, белсендіру Әр токенге 4 сарапшы (5.1 B белсенді параметрлер), ал gpt-oss-20b пайдаланады 32 сарапшылары үстінде 24 қабаты, белсендіру Әр токенге 4 сарапшы (3.6 B белсенді параметрлер). Жұмыс істейді ауыспалы тығыз және жергілікті жолақты сирек назар, топтастырылған көп сұраулы зейін (топ өлшемі 8) және қолдау a 128 к таңбалауыш мәтінмәндік терезе — бүгінгі күнге дейін ашық салмақтағы ұсыныстарда теңдесі жоқ. Жад тиімділігі **4-биттік аралас дәлдіктегі кванттау ** арқылы одан әрі жақсарады, бұл тауарлық жабдықта үлкен контексттерді қосуға мүмкіндік береді.

GPT‑OSS үлгілері белгілі деректер жинақтарымен қатаң салыстырудан өтті, бұл ұқсас өлшемді меншікті үлгілермен салыстырғанда бәсекеге қабілетті (егер жоғары болмаса) өнімділігін көрсетті.

Бенчмаркинг және өнімділікті бағалау

Стандартты көрсеткіштер бойынша, gpt-oss-120b OpenAI меншік құқығына сәйкес келеді немесе асып түседі o4-мини Модель:

  • MMLU (көп тапсырмалы тілді түсіну): ~88% дәлдік
  • Codeforces Elo (кодтау дәлелі): ~2205
  • AIME (құралдармен математикалық жарыс): ~87.9%
  • HealthBench: Клиникалық QA және диагностика тапсырмаларында o4-mini-ден айтарлықтай асып түседі
  • Tau-Bench (Бөлшек сауда + Ой қозғау тапсырмалары): орта есеппен ~62%

Үлгі нұсқасы

  • Әдепкі нұсқа: gpt-oss-120b (v1.0)
  • Белсенді параметрлер: 5.1 B (динамикалық MoE таңдау)
  • Кейінгі шығарылымдар: жақсарту үшін жоспарланған патчтар қауіпсіздік сүзгілері және мамандандырылған доменді дәл баптау

шектеулер

Қуаттылығына қарамастан, GPT‑OSS үлгілері белгілі бір шектеулермен келеді:

  • Тек мәтіндік интерфейс: GPT-4o немесе Gemini-ден айырмашылығы, GPT‑OSS мультимодальды кірістерді (суреттер, аудио, бейне) қолдамайды.
  • Жаттығудың мөлдірлігі жоқ: OpenAI пайдаланылған нақты деректер жиыны туралы мәліметтерді жарияламады, бұл академиялық қайталану немесе біржақты аудитке қатысты алаңдаушылық тудыруы мүмкін.
  • Өнімділік сәйкессіздігі: Кейбір қауымдастық эталондары (мысалы, Simple-Bench) нақты дәлелдеу сынақтарында нашар нәтижелер туралы хабарлайды (22b үшін кейбір тапсырмаларда ~120%), өнімділік домендерде айтарлықтай өзгеруі мүмкін.
  • Аппараттық шектеулер: 120B моделі жергілікті қорытынды жасау үшін маңызды есептеуді қажет етеді, бұл оны GPU қатынасы жоқ кездейсоқ әзірлеушілер үшін қолжетімсіз етеді.
  • Қауіпсіздік айырбастары: Қарама-қайшылықты дәл баптау сценарийлері бойынша сыналғанымен, салмағының ашықтығы бұл үлгілердің әлі де дұрыс реттелмесе, мысалы, спам, қате ақпарат немесе модель джейлбрейктері үшін пайдаланылуы мүмкін дегенді білдіреді.

Дегенмен, OpenAI gpt‑oss үлгілері туралы хабарлайды ағымдағы шекаралық деңгейдегі қауіпсіздік тәуекелдерін көтермеңіз, әсіресе биоқауіпсіздік немесе киберқауіпсіздік домендерінде.

Қалай қоңырау шалуға болады gpt-oss-120b CometAPI ұсынған API

gpt-oss-120b CometAPI ішіндегі API бағасы, ресми бағадан 20% жеңілдік:

Енгізу токендері$0.16
Шығару белгілері$0.80

Қажетті қадамдар

  • Жүйеге кіріңіз cometapi.com. Егер сіз әлі біздің пайдаланушы болмасаңыз, алдымен тіркеліңіз
  • Интерфейстің кіру тіркелгі деректерінің API кілтін алыңыз. Жеке орталықтағы API токеніндегі «Токенді қосу» түймесін басыңыз, таңбалауыш кілтін алыңыз: sk-xxxxx және жіберіңіз.
  • Осы сайттың URL мекенжайын алыңыз: https://api.cometapi.com/

Пайдалану әдісі

  1. «gpt-oss-120b” API сұрауын жіберуге және сұраудың негізгі бөлігін орнатуға арналған соңғы нүкте. Сұрау әдісі мен сұрау мәтіні біздің веб-сайт API құжатынан алынған. Біздің веб-сайт сізге ыңғайлы болу үшін Apifox сынағын да ұсынады.
  2. Ауыстыру тіркелгіңізден нақты CometAPI кілтімен.
  3. Мазмұн өрісіне сұрағыңызды немесе сұрауыңызды енгізіңіз — үлгі осыған жауап береді.
  4. . Жасалған жауапты алу үшін API жауабын өңдеңіз.

CometAPI үздіксіз тасымалдау үшін толық үйлесімді REST API қамтамасыз етеді. Негізгі мәліметтер  API құжаты:

  • Соңғы нүкте: https://api.cometapi.com/v1/chat/completions
  • Үлгі параметрі: gpt-oss-120b
  • Түпнұсқалық растама: Bearer YOUR_CometAPI_API_KEY
  • Мазмұн түрі: application/json .
  • Негізгі параметрлерpromptmax_tokens_to_sampletemperaturestop_sequences

GPT‑OSS толығымен офлайн режимде пайдаланылуы мүмкін болғанымен, ол қолдайды OpenAI-үйлесімді чат API интерфейстері Hugging Face немесе AWS Bedrock сияқты қызметтерде орналастырылған кезде.

Мұнда Python арқылы біріктіру үлгісі берілген:

from openai import OpenAI
import os

client = OpenAI(
    base_url="https://api.cometapi.com/v1/chat/completions",  # or AWS/Azure provider

    api_key=cometapi_key
)

response = client.chat.completions.create(
    model="gpt-oss-120b",
    messages=[
        {"role": "user", "content": "Explain how quantum tunneling works."}
    ]
)

print(response.choices.message.content)

Немесе үлгілерді жергілікті түрде сияқты құралдарды пайдаланып іске қосуға болады LMDeploy, **Мәтінді құру қорытындысы (TGI)**немесе vLLM.

Сондай-ақ, қараңыз GPT-OSS-20B

SHARE THIS BLOG

Толығырақ оқу

500+ модель бір API-да

20%-ға дейін жеңілдік