GPT-OSS-20B API

gpt-oss-20b ہے ایک پورٹیبل، کھلے وزن کا استدلال ماڈل کی پیشکش o3-منی سطح کی کارکردگی, ایجنٹ دوستانہ آلے کا استعمال، اور مکمل چین کی سوچ کی حمایت ایک قابل اجازت لائسنس کے تحت۔ اگرچہ یہ اپنے 120 بی ہم منصب کی طرح طاقتور نہیں ہے، لیکن یہ منفرد طور پر موزوں ہے۔ ڈیوائس پر، کم تاخیر، اور رازداری کے لیے حساس تعیناتیاں. ڈویلپرز کو اس کا معلوم وزن کرنا چاہیے۔ ساختی حدودخاص طور پر علم سے بھرپور کاموں پر، اور اس کے مطابق حفاظتی احتیاطی تدابیر۔

بنیادی معلومات

gpt-oss-20b ہے ایک 21 بلین پیرامیٹر اوپن ویٹ ریجننگ ماڈل کے تحت اوپن اے آئی کے ذریعہ جاری کیا گیا ہے۔ اپاچی 2.0 لائسنس، کو چالو کرنے کے ڈاؤن لوڈ، فائن ٹیوننگ، اور دوبارہ تقسیم کے لیے مکمل وزن تک رسائی. یہ اوپن اے آئی کی پہلی اوپن ویٹ ماڈل ریلیز کے بعد نشان زد کرتا ہے۔ 2 میں GPT-2019 اور اس کے لیے موزوں ہے۔ کنارے کی تعیناتی اور مقامی تخمینہ کے ساتھ نظام پر ≥ 16 GB VRAM.

پیرامیٹر: کل 21 بلین، جن میں سے 3.6 بلین فی ٹوکن فعال ہیں۔
فن تعمیر: ٹرانسفارمر کے ساتھ ماہرین کا مرکب (MoE)
سیاق و سباق کی کھڑکی: طویل شکل کی تفہیم کے لیے 128 000 ٹوکنز تک
اجازت نامے: Apache 2.0، غیر محدود تعلیمی اور تجارتی استعمال () کو فعال کرتا ہے۔

خصوصیات اور تکنیکی فن تعمیر

ماڈل نردجیکرن

پیرامیٹر: 21 B کل، 3.6 B ایکٹو فی ٹوکن مکسچر آف ایکسپرٹس (MoE) فن تعمیر کے ساتھ 32 ماہرین فی پرت, 4 فعال فی ٹوکن .
تہوں: 24، سیاق و سباق کی کھڑکی تک 128K ٹوکن، زیادہ سے زیادہ آؤٹ پٹ ٹوکنز تک 32K کچھ تعیناتیوں میں
توجہ اور یادداشت: باری باری گھنے + ویرل توجہ کے پیٹرن؛ تخمینہ کی کارکردگی کے لیے گروپ کردہ کثیر استفسار کی توجہ (گروپ سائز = 8)۔

ٹریننگ اور ریزننگ کنٹرولز

STEM، کوڈنگ، عمومی علم پر فوکس کرنے والے انگریزی کے غالب متن پر تربیت یافتہ۔
کی حمایت کرتا ہے سوچ کا سلسلہ (CoT) استدلال اور سایڈست استدلال کی سطح (کم، درمیانہ، اعلی) کام کی پیچیدگی پر منحصر ہے۔

بینچ مارک کارکردگی

میچ یا OpenAI کے o3-mini ماڈل کی کارکردگی سے زیادہ ہے۔ جیسے بینچ مارکس پر MMLU, AIME, HLE, HealthBench, Codeforces, Tau-Bench یہاں تک کہ اس کے چھوٹے سائز میں.
ملکیتی ماڈلز کو بہتر کرتا ہے جیسے صحت اور ریاضی کے استدلال میں OpenAI o1، GPT-4o، اور o4-mini اعلی استدلال کی سطح پر کام
بڑے GPT‑OSS‑120B (117 B) کے مقابلے میں، یہ گہرے علامتی استدلال یا وسیع علم (جیسے GPQA) پر انحصار کرنے والے کاموں میں آگے بڑھتا ہے، لیکن کوڈنگ اور ہیلتھ ڈومینز میں موثر رہتا ہے۔

۔ 20 B متغیر بھی متاثر کرتا ہے: یہ حریف ہے۔ o3-mini ایک ہی سوٹ میں اس کے چھوٹے نقشوں کے باوجود، MoE کے ساتھ استدلال کی صلاحیتوں کی موثر اسکیلنگ کو ظاہر کرتا ہے۔

ایم ایم ایل یو (بڑے پیمانے پر ملٹی ٹاسک لینگویج اسٹینڈنگ): ~88% درستگی
Codeforces Elo (کوڈنگ استدلال): ~ 2205،XNUMX
AIME (ٹولز کے ساتھ ریاضی کا مقابلہ): ~87.9%
ہیلتھ بینچ: کلینکل QA اور تشخیصی کاموں میں نمایاں طور پر o4-mini سے بہتر کارکردگی کا مظاہرہ کرتا ہے۔
Tau-Bench (خوردہ + استدلال کے کام): ~62% اوسط

ماڈل ورژن اور موازنہ

ماڈل	پیرمز	ایکٹو پیرمز	ہارڈ ویئر کی ضرورت	بینچ مارک کارکردگی
`gpt-oss-20b`	21 بی	3.6 بی	≥ 16 GB GPU یا آن ڈیوائس	سے موازنہ o3-mini
gpt-oss-120b	117 بی	5.1 بی	80 GB+ GPU	مماثل یا اس سے زیادہ o4-mini

کو ہلکا پھلکا ہم منصب کے طور پر ڈیزائن کیا گیا ہے۔ gpt-oss-120B, GPT‑OSS‑20B مضبوط کام کی کارکردگی کو برقرار رکھتے ہوئے پورٹیبلٹی پیش کرتا ہے جہاں وسائل محدود ہیں۔ یہ کھلے عام قابل رسائی اور ٹیون ایبل ہونے کی وجہ سے ملکیتی OpenAI ماڈلز کے خلاف کھڑا ہے۔

حدود

کم علم کی یاد بڑے ماڈلز کے مقابلے GPQA جیسے پیچیدہ کاموں پر۔
صارفین سے رپورٹس حقیقی دنیا کی کارکردگی میں تغیر کی نشاندہی کریں، خاص طور پر کوڈنگ یا عمومی علم کے اشارے کے لیے؛ کچھ اس کی وجہ ابتدائی نفاذ یا فوری غلط استعمال کو قرار دیتے ہیں۔
حفاظت اور غلط استعمال کے خطرات: جب کہ OpenAI نے مخالفانہ فائن ٹیونڈ gpt-oss مختلف حالتوں کا جائزہ لیا، یہاں تک کہ وہ بھی بائیورک یا سائبر ڈومینز میں اعلیٰ صلاحیت تک نہیں پہنچے۔ پھر بھی، بڑے پیمانے پر استعمال کے معاملات کو تعینات کرنے والے صارفین کو اضافی حفاظتی اقدامات کی ضرورت پڑ سکتی ہے۔

مقدمات کا استعمال کریں

OpenAI نے ایک کو سپورٹ کرنے کے لیے GPT-OSS کو انجینئر کیا ہے۔ استعمال کے معاملات کا وسیع میدانصارفین کی ایپس سے لے کر انٹرپرائز گریڈ کے تجزیات تک۔ 20B ویریئنٹ کو مقامی عمل درآمد کے لیے بہتر بنایا گیا ہے، جو کم سے کم ڈیوائسز پر چلانے کے قابل ہے۔ RAM کے 16GB، جیسے اعلی درجے کے لیپ ٹاپس یا ایم سیریز چپس کے ساتھ میک بکس. GPT‑OSS‑20B ان کے لیے مثالی ہے:

مقامی/آف لائن اندازہ ونڈوز پی سی پر (ونڈوز اے آئی فاؤنڈری کے ذریعے)، میک او ایس، یا اسنیپ ڈریگن پر مبنی ایج ڈیوائسز۔
ایجنٹ ورک فلو: کوڈ پر عمل درآمد، ٹول کا استعمال، براؤزر پر مبنی ایجنٹس، یا محدود بینڈوڈتھ سیٹنگز میں خود مختار معاون۔
ریپڈ پروٹو ٹائپنگ اور فائن ٹیوننگخاص طور پر کلاؤڈ انفراسٹرکچر کے بغیر یا رازداری کی رکاوٹوں کے ساتھ کام کرنے والے ڈویلپرز کے لیے۔

دیگر ماڈل موازنہ

gpt-oss-20bبمقابلہ o3‑mini / o4‑mini: درستگی اور ہم خیال استدلال میں GPT-OSS-20B حریف o3‑mini؛ یہ o4‑mini سے زیادہ موثر اور کھلا ہے لیکن اس کے مقابلے میں کم کارکردگی کا مظاہرہ کرتا ہے۔ gpt-oss-120B استدلال کے کاموں کا مطالبہ کرنے پر۔
gpt-oss-20b بمقابلہ LLaMA 4، GLM‑4.5، DeepSeek: GPT‑OSS‑20B Apache 2.0 کے تحت مکمل اوپن ویٹ شفافیت لاتا ہے، سیمی اوپن ماڈلز کے برعکس۔ لیکن صارفین کچھ معاملات میں استدلال کے معیار پر GLM-4.5-AIR کو ترجیح دیتے ہوئے رپورٹ کرتے ہیں۔

کال کیسے کریں؟ gpt-oss-20b CometAPI سے API

`gpt-oss-20b` CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ:


ان پٹ ٹوکنز	$0.08
آؤٹ پٹ ٹوکنز	$0.32

مطلوبہ اقدامات

داخل ہوجاو cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔
انٹرفیس کی رسائی کی سند API کلید حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔
اس سائٹ کا یو آر ایل حاصل کریں: https://api.cometapi.com/

طریقہ استعمال کریں

منتخب کریں “gpt-oss-20bAPI کی درخواست بھیجنے اور درخواست کا باڈی سیٹ کرنے کے لیے اینڈ پوائنٹ۔ درخواست کا طریقہ اور درخواست کا باڈی ہماری ویب سائٹ API دستاویز سے حاصل کیا جاتا ہے۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔
بدل دیں۔ آپ کے اکاؤنٹ سے اپنی اصل CometAPI کلید کے ساتھ۔
مواد کے خانے میں اپنا سوال یا درخواست داخل کریں—یہ وہی ہے جس کا ماڈل جواب دے گا۔
. تیار کردہ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔

CometAPI مکمل طور پر ہم آہنگ REST API فراہم کرتا ہے — بغیر کسی رکاوٹ کے منتقلی کے لیے۔ کی اہم تفصیلات API دستاویز:

بنیادی پیرامیٹرز: prompt, max_tokens_to_sample, temperature, stop_sequences
اختتامی نقطہ: https://api.cometapi.com/v1/chat/completions
ماڈل پیرامیٹر: "gpt-oss-20b"
توثیق: Bearer YOUR_CometAPI_API_KEY
مواد کی قسم: application/json .

API کال کی مثال

اگرچہ اوپن ویٹ، GPT-OSS ماڈلز تک APIs جیسے CometAPI، اور دیگر کے ذریعے رسائی حاصل کی جا سکتی ہے۔ کے لیے gpt-oss-20BCometAPI کو ایک عام کال اس طرح نظر آتی ہے:

POST  https://api.cometapi.com/v1/chat/completions
{
  "model": "gpt-oss-20b",
  "messages": [{ "role": "system", "content": "Reasoning: high" },
               { "role": "user", "content": "Solve bilateral integral…" }],
  "max_tokens": 2048,
  "temperature": 0.0
}

یہ فنکشن کالنگ، سٹرکچرڈ آؤٹ پٹ اسکیموں، ٹول انٹیگریشنز، اور سسٹم پرامپٹ کے ذریعے استدلال کنٹرول کو سپورٹ کرتا ہے۔

یہ بھی دیکھتے ہیں GPT-OSS-120B

بنیادی معلومات

خصوصیات اور تکنیکی فن تعمیر

ماڈل نردجیکرن

ٹریننگ اور ریزننگ کنٹرولز

بینچ مارک کارکردگی

ماڈل ورژن اور موازنہ

حدود

مقدمات کا استعمال کریں

دیگر ماڈل موازنہ

کال کیسے کریں؟ gpt-oss-20b CometAPI سے API

`gpt-oss-20b` CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ:

مطلوبہ اقدامات

طریقہ استعمال کریں

API کال کی مثال

مزید پڑھیں

500+ ماڈلز ایک API میں

GPT-OSS-20B API

بنیادی معلومات

خصوصیات اور تکنیکی فن تعمیر

ماڈل نردجیکرن

ٹریننگ اور ریزننگ کنٹرولز

بینچ مارک کارکردگی

ماڈل ورژن اور موازنہ

حدود

مقدمات کا استعمال کریں

دیگر ماڈل موازنہ

کال کیسے کریں؟ gpt-oss-20b CometAPI سے API

gpt-oss-20b CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ:

مطلوبہ اقدامات

طریقہ استعمال کریں

API کال کی مثال

مزید پڑھیں

500+ ماڈلز ایک API میں

`gpt-oss-20b` CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ: