ماڈلزسپورٹانٹرپرائزبلاگ
500+ AI ماڈل API، تمام ایک API میں۔ صرف CometAPI میں
ماڈلز API
ڈویلپر
فوری آغازدستاویزاتAPI ڈیش بورڈ
وسائل
AI ماڈلزبلاگانٹرپرائزتبدیلیوں کا ریکارڈہمارے بارے میں
2025 CometAPI۔ تمام حقوق محفوظ ہیں۔رازداری کی پالیسیخدمات کی شرائط
Home/Models/OpenAI/GPT-5 mini
O

GPT-5 mini

ان پٹ:$0.2/M
آؤٹ پٹ:$1.6/M
سیاق و سباق:400K
زیادہ سے زیادہ آؤٹ پٹ:128K
GPT-5 mini، OpenAI کی GPT-5 فیملی کا ایک رکن ہے جسے لاگت اور تاخیر کے لحاظ سے بہتر بنایا گیا ہے، اور اس کا مقصد بڑے پیمانے پر پروڈکشن استعمال کے لیے نمایاں طور پر کم لاگت پر GPT-5 کی ملٹی موڈل اور ہدایات پر عمل کرنے کی بیشتر قوتیں فراہم کرنا ہے۔ یہ اُن ماحولوں کو ہدف بناتا ہے جہاں تھروپٹ، فی ٹوکن قابلِ پیش گوئی قیمت، اور تیز رفتار جوابات بنیادی پابندیاں ہوں، جبکہ ساتھ ہی مضبوط عمومی صلاحیتیں بھی فراہم کرتا ہے۔
نیا
تجارتی استعمال
Playground
خلاصہ
خصوصیات
قیمت
API

بنیادی معلومات اور کلیدی خصوصیات

GPT-5 mini، OpenAI کے GPT-5 خاندان کا لاگت اور لیٹنسی کے لحاظ سے بہتر بنایا گیا رکن ہے، جسے بڑے پیمانے کی پروڈکشن میں استعمال کے لیے خاصی کم لاگت پر GPT-5 کی ملٹی موڈل اور ہدایت پر عمل کرنے کی مضبوط صلاحیتیں فراہم کرنے کے لیے تیار کیا گیا ہے۔ یہ اُن ماحولوں کو ہدف بناتا ہے جہاں بنیادی تقاضے throughput، predictable per-token pricing اور fast responses ہوں، جبکہ ساتھ ہی عمومی مقاصد کے لیے مضبوط صلاحیتیں بھی فراہم کی جائیں۔

  • ماڈل کا نام: gpt-5-mini
  • کانٹیکسٹ ونڈو: 400 000 ٹوکنز
  • زیادہ سے زیادہ آؤٹ پٹ ٹوکنز: 128 000
  • کلیدی خصوصیات: رفتار، throughput، لاگت کی افادیت، مختصر پرامپٹس کے لیے قطعی نتائج

gpt-5-mini کیسے کام کرتا ہے؟

Optimized inference path & deployment. عملی اسپیڈ اپس kernel fusion، tensor parallelism tuned for a smaller graph اور ایسے انفرنس رن ٹائم سے آتی ہیں جو ڈیولپر کے گہری غوروفکر کی درخواست نہ کرنے پر مختصر اندرونی “thinking” لوپس کو ترجیح دیتا ہے۔ اسی وجہ سے mini فی کال کم کمپیوٹ اور زیادہ ٹریفک میں قابلِ پیش گوئی لیٹنسی حاصل کرتا ہے۔ یہ سمجھوتہ دانستہ ہے: lower compute per forward pass → lower cost and lower average latency۔

Developer controls. GPT-5 mini ایسے پیرا میٹرز ظاہر کرتا ہے جیسے verbosity (تفصیل/طول کو کنٹرول کرتا ہے) اور reasoning_effort (رفتار بمقابلہ گہرائی کا توازن)، نیز مضبوط tool-calling سپورٹ (فنکشن کالز، متوازی ٹول چینز، اور structured error handling)، جس سے پروڈکشن سسٹمز درستگی اور لاگت کو عین مطابق ٹیون کر سکتے ہیں۔

بینچ مارک کارکردگی — نمایاں اعداد و شمار اور تشریح

GPT-5 mini عموماً عمومی بینچ مارکس پر GPT-5 high کے تقریباً ~85–95% کے اندر بیٹھتا ہے جبکہ لیٹنسی/قیمت میں واضح بہتری دیتا ہے۔ پلیٹ فارم لانچ مواد میں GPT-5 high کے لیے بہت بلند مطلق اسکورز دکھائے گئے ہیں (AIME ≈ 94.6% ٹاپ ویریئنٹ کے لیے رپورٹ)، اور mini کچھ کم مگر اپنی قیمت کے لحاظ سے اب بھی صنعت میں نمایاں ہے۔

متعدد معیاری اور داخلی بینچ مارکس میں، GPT-5 mini نے درج ذیل کارکردگی حاصل کی:

  • ذہانت (AIME ’25): 91.1% (بمقابلہ 94.6% برائے GPT-5 high)
  • ملٹی موڈل (MMMU): 81.6% (بمقابلہ 84.2% برائے GPT-5 high)
  • کوڈنگ (SWE-bench Verified): 71.0% (بمقابلہ 74.9% برائے GPT-5 high)
  • ہدایات کی پیروی (Scale MultiChallenge): 62.3% (بمقابلہ 69.6%)
  • فنکشن کالنگ (τ²-bench telecom): 74.1% (بمقابلہ 96.7%)
  • ہیلوسینیشن ریٹس (LongFact-Concepts): 0.7% (کم ہونا بہتر ہے)([OpenAI][4])

یہ نتائج GPT-5 mini کی کارکردگی، لاگت اور رفتار کے درمیان مضبوط توازن کو ظاہر کرتے ہیں۔

حدود

معروف حدود: GPT-5 mini میں مکمل GPT-5 کے مقابلے میں گہری استدلال کی صلاحیت کم، مبہم پرامپٹس کے لیے زیادہ حساسیت، اور ہیلوسینیشن کے باقی ماندہ خطرات شامل ہیں۔

  • گہری استدلال میں کمی: کئی مراحل اور طویل افق کے استدلالی کاموں کے لیے مکمل ریزننگ ماڈل یا “thinking” ویریئنٹس mini سے بہتر ہیں۔
  • ہیلوسینیشن اور حد سے زیادہ اعتماد: Mini چھوٹے ماڈلز کے مقابلے میں ہیلوسینیشن کم کرتا ہے لیکن اسے مکمل ختم نہیں کرتا؛ حساس فلووز (قانونی، طبی، تعمیل) میں آؤٹ پٹس کی توثیق ضروری ہے۔
  • سیاقی حساسیت: بہت طویل اور باہمی طور پر انحصار کرنے والے کانٹیکسٹ چینز کے لیے بڑے کانٹیکسٹ ونڈوز والے مکمل GPT-5 ویریئنٹس یا “thinking” ماڈل بہتر ہیں۔
  • سیفٹی اور پالیسی حدود: دیگر GPT-5 ماڈلز کی طرح یہی حفاظتی گارڈرَیلز اور ریٹ/استعمال کی حدیں لاگو ہیں؛ حساس کاموں میں انسانی نگرانی درکار ہے۔

gpt-5-mini کیا کرتا ہے؟

  • ہائی-والیوم مکالماتی ایجنٹس: کم لیٹنسی، قابلِ پیش گوئی لاگت۔
  • دستاویز اور ملٹی موڈل خلاصہ سازی: طویل سیاق کا خلاصہ، تصویر+متن رپورٹس۔
  • ڈیولپر ٹولنگ اسکیل پر: CI کوڈ چیکس، خودکار ریویو، ہلکی پھلکی کوڈ جنریشن۔
  • ایجنٹ آرکسٹریشن: جب گہری استدلال درکار نہ ہو تو متوازی چینز کے ساتھ ٹول کالنگ۔

میں gpt-5-mini API کا استعمال کیسے شروع کروں؟

درکار اقدامات

  • cometapi.com میں لاگ اِن کریں۔ اگر آپ ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں
  • انٹرفیس کی رسائی کے لیے API کلید حاصل کریں۔ پرسنل سینٹر میں API token پر “Add Token” پر کلک کریں، ٹوکن کلید حاصل کریں: sk-xxxxx اور جمع کرائیں۔
  • اس سائٹ کا یو آر ایل حاصل کریں: https://api.cometapi.com/

استعمال کا طریقہ

  1. “gpt-5-mini“ / "gpt-5-mini-2025-08-07" اینڈ پوائنٹ منتخب کریں، API ریکویسٹ بھیجیں اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ کا طریقہ اور ریکویسٹ باڈی ہماری ویب سائٹ کے API ڈاک سے حاصل کیے جائیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔
  2. <YOUR_API_KEY> کو اپنے اکاؤنٹ کی اصل CometAPI کلید سے تبدیل کریں۔
  3. اپنے سوال یا درخواست کو کنٹینٹ فیلڈ میں درج کریں — ماڈل اسی کا جواب دے گا۔
  4. . API کے جواب کو پراسس کریں تاکہ تیار کردہ جواب حاصل ہو سکے۔

CometAPI مائیگریشن کو آسان بنانے کے لیے مکمل طور پر ہم آہنگ REST API فراہم کرتا ہے۔ کلیدی تفصیلات یہاں دیکھیے API doc:

  • Core Parameters: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Model Parameter: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
  • Authentication:  Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

API کال ہدایات: gpt-5-chat-latest کو معیاری /v1/chat/completions format استعمال کرتے ہوئے کال کرنا چاہیے۔ دیگر ماڈلز (gpt-5، gpt-5-mini، gpt-5-nano، اور اُن کی مورخہ ورژنز) کے لیے the /v1/responses format کی سفارش کی جاتی ہے۔ فی الحال دو موڈ دستیاب ہیں۔

GPT-5 mini کے لیے خصوصیات

[ماڈل کا نام] کی اہم خصوصیات دریافت کریں، جو کارکردگی اور قابل استعمال کو بہتر بنانے کے لیے ڈیزائن کی گئی ہیں۔ جانیں کہ یہ صلاحیتیں آپ کے منصوبوں کو کیسے فائدہ پہنچا سکتی ہیں اور صارف کے تجربے کو بہتر بنا سکتی ہیں۔

GPT-5 mini کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔
Comet قیمت (USD / M Tokens)سرکاری قیمت (USD / M Tokens)رعایت
ان پٹ:$0.2/M
آؤٹ پٹ:$1.6/M
ان پٹ:$0.25/M
آؤٹ پٹ:$2/M
-20%

GPT-5 mini کے لیے نمونہ کوڈ اور API

GPT-5 mini، OpenAI کے فلیگ شپ GPT-5 ماڈل کا ہلکا، لاگت کے لحاظ سے بہتر بنایا گیا ویریئنٹ ہے، جسے کم تاخیر اور کم خرچ کے ساتھ اعلیٰ معیار کی استدلالی اور ملٹی موڈل صلاحیتیں فراہم کرنے کے لیے ڈیزائن کیا گیا ہے۔
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-mini",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-mini",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

مزید ماڈلز

A

Claude Opus 4.6

ان پٹ:$4/M
آؤٹ پٹ:$20/M
Claude Opus 4.6، Anthropic کے “Opus” کلاس کا بڑا لسانی ماڈل ہے، جو فروری 2026 میں جاری کیا گیا۔ اسے علمی کام اور تحقیقی ورک فلوز کے لیے ایک بھروسہ مند مرکزی حل کے طور پر پیش کیا گیا ہے — اور یہ طویل سیاق میں استدلال، کئی مرحلوں پر مشتمل منصوبہ بندی، ٹولز کے استعمال (جن میں ایجنٹ پر مبنی سافٹ ویئر ورک فلوز بھی شامل ہیں)، اور کمپیوٹر کے استعمال سے متعلق کام جیسے خودکار سلائیڈ اور اسپریڈشیٹ کی تیاری کو بہتر بناتا ہے۔
A

Claude Sonnet 4.6

ان پٹ:$2.4/M
آؤٹ پٹ:$12/M
Claude Sonnet 4.6 ہمارا اب تک کا سب سے زیادہ قابل Sonnet ماڈل ہے۔ یہ کوڈنگ، کمپیوٹر کے استعمال، طویل سیاقی استدلال، ایجنٹ منصوبہ بندی، دانش پر مبنی کام، اور ڈیزائن کے حوالے سے ماڈل کی صلاحیتوں کا مکمل اپ گریڈ ہے۔ Sonnet 4.6 میں بیٹا مرحلے میں 1M ٹوکن کانٹیکسٹ ونڈو کی خصوصیت بھی ہے۔
O

GPT-5.4 nano

ان پٹ:$0.16/M
آؤٹ پٹ:$1/M
GPT-5.4 nano اُن کاموں کے لیے تیار کیا گیا ہے جن میں رفتار اور لاگت سب سے زیادہ اہمیت رکھتی ہیں، مثلاً درجہ بندی، ڈیٹا استخراج، رینکنگ، اور ذیلی ایجنٹس۔
O

GPT-5.4 mini

ان پٹ:$0.6/M
آؤٹ پٹ:$3.6/M
GPT-5.4 mini، GPT-5.4 کی صلاحیتوں کو ایک تیز تر، زیادہ مؤثر ماڈل میں لے آتا ہے جو زیادہ حجم کے ورک لوڈز کے لیے ڈیزائن کیا گیا ہے۔
A

Claude Mythos Preview

A

Claude Mythos Preview

جلد آ رہا ہے
ان پٹ:$60/M
آؤٹ پٹ:$240/M
Claude Mythos Preview اب تک ہمارا سب سے طاقتور فرنٹیئر ماڈل ہے، اور کئی تشخیصی بینچ مارکس پر اسکورز میں ایک نمایاں چھلانگ دکھاتا ہے، ہمارے سابقہ فرنٹیئر ماڈل Claude Opus 4.6 کے مقابلے میں۔
X

mimo-v2-pro

ان پٹ:$0.8/M
آؤٹ پٹ:$2.4/M
MiMo-V2-Pro، Xiaomi کا فلیگ شپ فاؤنڈیشن ماڈل ہے، جس میں 1T سے زیادہ کل پیرا میٹرز اور 1M کی کانٹیکسٹ لمبائی ہے، اور اسے ایجنٹ پر مبنی منظرناموں کے لیے گہرائی سے بہتر بنایا گیا ہے۔ یہ OpenClaw جیسے عمومی ایجنٹ فریم ورکس کے ساتھ انتہائی مطابقت پذیر ہے۔ معیاری PinchBench اور ClawBench بنچ مارکس میں یہ عالمی سطح پر اعلیٰ ترین درجے میں شمار ہوتا ہے، اور اس کی محسوس شدہ کارکردگی Opus 4.6 کے قریب پہنچتی ہے۔ MiMo-V2-Pro کو ایجنٹ سسٹمز کے دماغ کے طور پر کام کرنے کے لیے بنایا گیا ہے، جو پیچیدہ ورک فلو کو ہم آہنگ و منظم کرتا ہے، پروڈکشن انجینئرنگ کے کاموں کو آگے بڑھاتا ہے، اور نتائج قابلِ اعتماد طور پر فراہم کرتا ہے۔