2026 میں بہترین AI API گیٹ ویز: CometAPI، Portkey، LiteLLM، اور Cloudflare کا موازنہ

AI API گیٹ وے کا انتخاب اب وہ مسئلہ نہیں رہا جو دو سال پہلے تھا۔ 2024 میں، زیادہ تر ڈویلپرز یا تو براہِ راست OpenAI کو کال کرتے تھے یا مقامی طور پر LiteLLM چلاتے تھے۔ اب میزبان آپشنز موجود ہیں جن میں پرائسنگ ڈیش بورڈز، ہر کلید کے لیے کریڈٹ حدیں، اور ماڈل کیٹلاگ شامل ہیں جو درجنوں فراہم کنندگان تک پھیلے ہوئے ہیں۔ یہ زمرہ اتنا پھیل چکا ہے کہ غلط انتخاب بعد میں حقیقی انٹیگریشن کام کو واپس لینا پڑ سکتا ہے۔

یہ مضمون ان چار گیٹ ویز کا موازنہ کرتا ہے جو ڈویلپر گفتگو میں بار بار سامنے آتے ہیں: CometAPI، Portkey، LiteLLM، اور Cloudflare AI Gateway۔ مقصد کسی ایک فاتح کا انتخاب کرنا نہیں — ہر ایک مختلف صورتحال میں مناسب ہے — بلکہ یہ واضح کرنا ہے کہ ہر ٹول حقیقتاً کیا کرتا ہے تاکہ آپ اسے اپنے استعمال کے مطابق ملا سکیں۔

ماڈل ناموں پر نوٹ: اس مضمون میں استعمال ہونے والے ماڈل شناخت کار (مثلاً gpt-5.4, claude-opus-4-7) CometAPI پلیٹ فارم کے شناخت کار ہیں۔ یہ OpenAI یا Anthropic کے باضابطہ نام نہیں ہیں، جن کے اپنے نام رکھنے کے طریقے مختلف ہیں۔

یہ ٹولز حقیقتاً کیا کرتے ہیں

فیچرز کا موازنہ کرنے سے پہلے، یہ واضح کرنا مفید ہے کہ AI API گیٹ وے کیا کرتا ہے۔ کم از کم: یہ آپ کی ایپلیکیشن اور ایک یا ایک سے زیادہ AI پرووائیڈرز کے درمیان بیٹھتا ہے، ریکویسٹ فارورڈ کرتا ہے اور ریسپانس واپس بھیجتا ہے۔ اس کم از کم سے آگے، گیٹ ویز میں نمایاں فرق آتے ہیں۔

کچھ گیٹ ویز — مثال کے طور پر Cloudflare AI Gateway — بنیادی طور پر پاس تھرو لیئر ہوتے ہیں جو آپ کی API کلید یا قیمتوں کو چھیڑے بغیر لاگنگ اور کیشنگ شامل کرتے ہیں۔ دیگر، جیسے CometAPI، ری سیلر کے طور پر کام کرتے ہیں: آپ انہیں ادائیگی کرتے ہیں، وہ بنیادی پرووائیڈر کو ادائیگی کرتے ہیں، اور قیمت کا فرق اُن کی ویلیو پروپوزیشن کا حصہ ہوتا ہے۔ LiteLLM پھر مختلف ہے — یہ وہ سافٹ ویئر ہے جو آپ خود چلاتے ہیں، کوئی ہوسٹڈ سروس نہیں۔

اس امتیاز کو سمجھنا کسی بھی خاص فیچر کا جائزہ لینے سے پہلے اہم ہے۔

فیچر موازنہ

ذیل کی جدول مئی 2026 تک ہر پروڈکٹ کی آفیشل دستاویزات یا عوامی ڈیش بورڈ سے معلومات استعمال کرتی ہے۔ جن فیچرز کے سامنے ڈیش (—) ہے وہ اس وقت آفیشل ذرائع میں تصدیق نہیں ہو سکے تھے۔

فیچر	CometAPI	Portkey	LiteLLM	Cloudflare AI Gateway
تعیناتی	ہوسٹڈ (SaaS)	ہوسٹڈ + سیلف ہوسٹ	سیلف ہوسٹڈ (اوپن سورس)	ہوسٹڈ (Cloudflare ایج)
ماڈل کیٹلاگ	500+ ماڈلز، متعدد فراہم کنندگان	1,600+ LLMs متحدہ API کے ذریعے	آپ کی کنفیگریشن پر منحصر	OpenAI, Anthropic, Workers AI
قیمت کا ماڈل	ری سیلر (ادائیگی CometAPI کو)	پاس تھرو + پلیٹ فارم فیس	صرف انفراسٹرکچر لاگت	پاس تھرو (فری ٹئیر دستیاب)
OpenAI مطابقت پذیر API	ہاں (api.cometapi.com/v1)	ہاں (api.portkey.ai/v1)	ہاں (لوکل یا ریموٹ)	ہاں (گیٹ وے URL کے ذریعے)
ہر کلید کے لیے کریڈٹ حدیں	ہاں (ڈیش بورڈ)	ہاں	ہاں (کنفیگ کے ذریعے)	—
گروپ بنیاد قیمت تناسب	ہاں (0.8x ڈیفالٹ، 0.1x داخلی)	—	—	—
ریکویسٹ لاگنگ	ہاں (4 لاگ اقسام)	ہاں	ہاں	ہاں
کامیابی کی شرح مانیٹرنگ	ہاں (30 دن کا اپ ٹائم ویو)	ہاں	ہاں	ہاں
فری ٹئیر	ہاں (نئے اکاؤنٹس)	ہاں	اوپن سورس (انفرا لاگت)	ہاں
سیلف ہوسٹنگ آپشن	نہیں (انٹرپرائز: ڈیڈی کیٹڈ سرور)	ہاں	ہاں (بنیادی استعمال)	نہیں

ذرائع: CometAPI ڈیش بورڈ, Portkey ہوم پیج, LiteLLM GitHub, Cloudflare AI Gateway دستاویزات

ہر گیٹ وے سے کنیکٹ کرنا

چاروں گیٹ ویز OpenAI مطابقت پذیر اینڈ پوائنٹ فراہم کرتے ہیں، یعنی ایک ہی کلائنٹ اسٹرکچر سب کے لیے کام کرتا ہے — آپ صرف base_url، اسناد، اور Portkey کے معاملے میں ماڈل بتانے کا طریقہ بدلتے ہیں۔

Python

import osfrom openai import OpenAIdef require_env(name: str) -> str:    """Raise a clear error if a required environment variable is missing."""    val = os.environ.get(name)    if not val:        raise ValueError(f"Missing required environment variable: {name}")    return val# ── CometAPI ────────────────────────────────────────────────────────────────# Hosted reseller with 500+ models. Use CometAPI model identifiers (e.g. "gpt-5.4").cometapi_client = OpenAI(    base_url="https://api.cometapi.com/v1",    api_key=require_env("COMETAPI_KEY"),)# ── Portkey ─────────────────────────────────────────────────────────────────# Hosted gateway with observability and 1,600+ LLMs.# Route to a provider by prefixing the model name: "@openai/gpt-4o", "@anthropic/claude-3-5-sonnet", etc.# x-portkey-api-key is required; it authenticates requests to Portkey's gateway.portkey_client = OpenAI(    base_url="https://api.portkey.ai/v1",    api_key=require_env("PORTKEY_API_KEY"),    default_headers={        "x-portkey-api-key": require_env("PORTKEY_API_KEY"),    },)# ── LiteLLM ──────────────────────────────────────────────────────────────────# Self-hosted proxy. Provider credentials (OPENAI_API_KEY etc.) are set server-side.# By default the proxy does not validate the client API key — "anything" works.# If you have enabled virtual keys on your LiteLLM instance, pass a virtual key instead.litellm_client = OpenAI(    base_url=os.environ.get("LITELLM_BASE_URL", "http://localhost:4000"),    api_key=os.environ.get("LITELLM_API_KEY", "anything"),)# ── Cloudflare AI Gateway ───────────────────────────────────────────────────# URL-based pass-through. Keep your real provider API key — Cloudflare does not replace it.cf_account_id = require_env("CF_ACCOUNT_ID")cf_gateway_id = require_env("CF_GATEWAY_ID")cloudflare_client = OpenAI(    base_url=(        f"https://gateway.ai.cloudflare.com/v1"        f"/{cf_account_id}/{cf_gateway_id}/openai"    ),    api_key=require_env("OPENAI_API_KEY"),)def ask(client: OpenAI, model: str, question: str) -> str:    """    Minimal wrapper showing the common call pattern across all four gateways.    Model format varies by gateway:      CometAPI:   "gpt-5.4", "claude-opus-4-7", etc. (CometAPI identifiers)      Portkey:    "@openai/gpt-4o", "@anthropic/claude-3-5-sonnet", etc.      LiteLLM:    whatever model names you configured in your proxy      Cloudflare: standard OpenAI model names, e.g. "gpt-4o"    This function does not handle finish_reason, tool_calls, or provider errors.    For production error handling, see: How to Debug Failed AI API Generations.    """    response = client.chat.completions.create(        model=model,        messages=[{"role": "user", "content": question}],    )    return response.choices[0].message.content or ""

Node.js

import OpenAI from "openai";function requireEnv(name) {  const val = process.env[name];  if (!val) throw new Error(`Missing required environment variable: ${name}`);  return val;}// ── CometAPI ────────────────────────────────────────────────────────────────const cometClient = new OpenAI({  baseURL: "https://api.cometapi.com/v1",  apiKey: requireEnv("COMETAPI_KEY"),});// ── Portkey ─────────────────────────────────────────────────────────────────// Route to a provider by prefixing the model: "@openai/gpt-4o", "@anthropic/claude-3-5-sonnet"const portkeyClient = new OpenAI({  baseURL: "https://api.portkey.ai/v1",  apiKey: requireEnv("PORTKEY_API_KEY"),  defaultHeaders: {    "x-portkey-api-key": requireEnv("PORTKEY_API_KEY"),  },});// ── LiteLLM ──────────────────────────────────────────────────────────────────// Self-hosted. Default mode accepts any API key value.// Set LITELLM_BASE_URL if your server runs on a different host or port.const litellmClient = new OpenAI({  baseURL: process.env.LITELLM_BASE_URL ?? "http://localhost:4000",  apiKey: process.env.LITELLM_API_KEY ?? "anything",});// ── Cloudflare AI Gateway ───────────────────────────────────────────────────const cfClient = new OpenAI({  baseURL: `https://gateway.ai.cloudflare.com/v1/${requireEnv("CF_ACCOUNT_ID")}/${requireEnv("CF_GATEWAY_ID")}/openai`,  apiKey: requireEnv("OPENAI_API_KEY"),});/** * Minimal wrapper showing the common call pattern. * Model format varies by gateway — see Python example above for details. * Does not handle finish_reason or error recovery; add those for production use. */async function ask(client, model, question) {  const response = await client.chat.completions.create({    model,    messages: [{ role: "user", content: question }],  });  return response.choices[0].message.content ?? "";}

چاروں میں کنیکشن پیٹرن ایک جیسا ہے۔ معنی خیز فرق دوسری جگہ سامنے آتے ہیں: آپ کیا دیکھ سکتے ہیں، کیا کنٹرول کر سکتے ہیں، اور جب کچھ بریک ہو تو کیا ہوتا ہے۔

ہر ٹول کس میں واقعی اچھا ہے

CometAPI

CometAPI کی بنیادی پیشکش 500 سے زائد ماڈل اینڈ پوائنٹس کے ساتھ ایک ہوسٹڈ کیٹلاگ ہے، جس میں ٹیکسٹ ماڈلز کے ساتھ ساتھ امیج اور ویڈیو جنریشن ماڈلز بھی شامل ہیں۔ قیمت گروپ پر مبنی تناسبی نظام سے چلتی ہے — ڈیفالٹ گروپ CometAPI کے بیس ریٹس پر 0.8x ملٹی پلائر لاگو کرتا ہے۔ آپ داخلی استعمال (0.1x) بمقابلہ ادائیگی کرنے والے صارفین کے لیے مختلف تناسبی گروپس کنفیگر کر سکتے ہیں، جس سے علیحدہ اکاؤنٹس کے بغیر تہہ دار پروڈکٹ بنانا عملی ہو جاتا ہے۔

ڈیش بورڈ آپ کو چار قسم کے لاگز دیتا ہے (معیاری API کالز، امیج جنریشن، ویڈیو جنریشن، Midjourney)، 30 دن کا اپ ٹائم ویو، اور ہر کلید کے لیے کریڈٹ حدیں۔ کریڈٹ حدیں آپ کو کلائنٹس یا کنٹریکٹرز کو API کلیدیں دینے کی اجازت دیتی ہیں جس میں خرچ پر سخت حد مقرر ہو، جو مشترکہ اکاؤنٹ تک رسائی تقسیم کرنے میں ایک حقیقی مسئلہ حل کرتی ہے۔

CometAPI کیا فراہم نہیں کرتا: سیلف ہوسٹنگ (انٹرپرائز صارفین ڈیڈی کیٹڈ سرور کی درخواست کر سکتے ہیں، مگر یہ معیاری سیلف ہوسٹڈ آپشن نہیں)، گیٹ وے لیول پر ریٹ لمٹنگ، یا SSO۔

موزوں ترین: انڈی ڈویلپرز اور چھوٹی ٹیمیں جو ایک API کلید اور ایک بلنگ رشتے کے ساتھ — امیج اور ویڈیو سمیت — کئی ماڈلز پر روٹنگ چاہتی ہیں، اور جنہیں ہر کلید کی بجٹ کنٹرولز درکار ہوں۔

Portkey

Portkey ایک ہوسٹڈ گیٹ وے ہے جو آبزرویبلٹی کے گرد بنایا گیا ہے۔ یہ آپ کو متحدہ API کے ذریعے 1,600+ LLMs تک رسائی دیتا ہے، جہاں روٹنگ پرووائیڈر کو ماڈل نام کے ساتھ پری فکس کر کے کی جاتی ہے (@openai/gpt-4o, @anthropic/claude-3-5-sonnet)۔ اس کا مطلب ہے آپ کو ہر پرووائیڈر کے لیے الگ کلائنٹ کنفیگریشن کی ضرورت نہیں — ایک Portkey کلائنٹ سب کو ہینڈل کرتا ہے، اور آپ ماڈل اسٹرنگ بدل دیتے ہیں۔

روٹنگ سے آگے، Portkey ریکویسٹ ٹریسنگ، پرامپٹ ورژننگ، اور فالبیک روٹنگ فراہم کرتا ہے جسے آپ ڈیش بورڈ میں کنفیگر کرتے ہیں نہ کہ کوڈ میں۔ سیلف ہوسٹنگ آپشن کا مطلب ہے کہ اگر کمپلائنس درکار ہو تو آپ Portkey کو اپنی انفراسٹرکچر پر چلا سکتے ہیں۔

Portkey کے اوپن سورس گیٹ وے کی GitHub ریپوزٹری فعال طور پر برقرار رکھی جاتی ہے — کسی مخصوص عدد پر انحصار کرنے کے بجائے موجودہ اسٹار کاؤنٹ براہِ راست چیک کریں، کیونکہ یہ کثرت سے بدلتا ہے۔

موزوں ترین: ٹیمیں جنہیں آڈٹ ٹریل، ایک ہی کلائنٹ کنفیگریشن سے ملٹی پرووائیڈر روٹنگ، یا ڈویلپرز میں API کلید کے ایکسپوژر کو منیج کرنا ہو۔

LiteLLM

LiteLLM ایک Python پیکیج اور پراکسی سرور ہے، کوئی ہوسٹڈ سروس نہیں۔ آپ اسے خود چلاتے ہیں۔ یہ ایک اہم فرق ہے: کوئی تیسرا فریق آپ کی ریکویسٹ ہینڈل نہیں کر رہا یا آپ کی API کلیدیں محفوظ نہیں رکھ رہا۔ پرووائیڈر اسناد (آپ کی حقیقی OpenAI کلید، Anthropic کلید وغیرہ) سرور سائیڈ ماحول متغیّرات کے طور پر سیٹ کی جاتی ہیں؛ کلائنٹ صرف لوکل پراکسی کی طرف اشارہ کرتا ہے۔

ڈیفالٹ طور پر، LiteLLM کلائنٹ کی بھیجی گئی API کلید کی توثیق نہیں کرتا — کوئی بھی ویلیو چل جاتی ہے۔ اگر آپ نے اپنے LiteLLM انسٹینس پر ورچوئل کی مینجمنٹ فعال کر لی ہے، تو کلائنٹس ورچوئل کیز پاس کرتے ہیں جنہیں LiteLLM اپنے ڈیٹا بیس کے خلاف ویلیڈیٹ کرتا ہے۔ ہر صورت میں، پراکسی OpenAI فارمیٹ ریکویسٹس کو اس فارمیٹ میں ترجمہ کرتا ہے جو اپ اسٹریم پرووائیڈر توقع کرتا ہے، اس لیے جب آپ نیا پرووائیڈر شامل کرتے ہیں تو آپ کی ایپلیکیشن کا کوڈ نہیں بدلتا۔

ٹریڈ آف عملیاتی بوجھ ہے: سرور چلانے، اسکیل کرنے، اور اپڈیٹ کرنے کی ذمہ داری آپ کی ہے۔

موزوں ترین: وہ ٹیمیں جن کے پاس ڈیواپس صلاحیت ہے، وہ ادارے جن کے کمپلائنس تقاضے تیسرے فریق API پراکسیز کو روکتے ہیں، یا کوئی بھی جو کراس پرووائیڈر روٹنگ چاہتا ہو مگر درخواست کے مواد کو SaaS وینڈر پر بھروسہ نہیں کرنا چاہتا۔

Cloudflare AI Gateway

Cloudflare AI Gateway ساخت کے اعتبار سے باقی تینوں سے مختلف ہے۔ آپ اپنی API کلید نہیں بدلتے اور نہ ہی ماڈل ایکسس کے لیے Cloudflare کو ادائیگی کرتے ہیں۔ اس کے بجائے، آپ پرووائیڈر کے بیس URL کو Cloudflare کے زیرِ انتظام URL سے بدلتے ہیں جو ایج پر لاگنگ، کیشنگ، اور ریٹ لمٹنگ شامل کرتا ہے۔

چونکہ Cloudflare آپ کی ایپلیکیشن اور پرووائیڈر کے درمیان بیٹھتا ہے، یہ ایک جیسے ریکویسٹ کیش کر سکتا ہے — مفید جب آپ کی ایپ بار بار ایک ہی پرامپٹس بھیجتی ہے۔ فری ٹئیر زیادہ تر انڈی ڈویلپر استعمال کے کیسز کو کور کرتا ہے۔ حد دائرہ کار کی ہے: Cloudflare پرووائیڈرز کے درمیان ماڈلز ایگریگیٹ نہیں کرتا۔ آپ کو اب بھی ہر پرووائیڈر کے الگ اکاؤنٹس اور کلیدیں درکار ہوں گی جنہیں آپ استعمال کرتے ہیں۔

موزوں ترین: وہ ڈویلپرز جو پہلے سے Cloudflare کی انفراسٹرکچر پر ہیں، یا کوئی بھی جو موجودہ پرووائیڈر اکاؤنٹس کے اوپر کیشنگ اور لاگنگ چاہتا ہو بغیر نئی بلنگ رشتہ متعارف کرائے یا API کلیدیں بدلے۔

منظرنامہ مطابقت

منظرنامہ	سفارش کردہ ٹول	وجہ
انڈی ایپ، ایک API کلید کے ساتھ 10+ ماڈلز آزمانا	CometAPI	وسیع کیٹلاگ، سادہ سیٹ اپ، ہر کلید کی کریڈٹ حدیں
ایک ہی انٹیگریشن میں امیج + ویڈیو جنریشن درکار	CometAPI	ٹیکسٹ، امیج، اور ویڈیو ماڈلز کے لیے متحدہ اینڈ پوائنٹ
5 رکنی ٹیم، کس نے کون سا ماڈل استعمال کیا ٹریک کرنا	Portkey	ریکویسٹ ٹریسنگ، ٹیم مینجمنٹ
ایک کلائنٹ کنفیگ سے 1,600+ LLMs پر روٹنگ	Portkey	@provider/model روٹنگ، فی پرووائیڈر سیٹ اپ کی ضرورت نہیں
کوڈ بدلے بغیر پرووائیڈرز کے پار فالبیک روٹنگ	Portkey	ڈیش بورڈ میں ڈیکلریٹو فالبیک کنفیگ
انٹرپرائز، ڈیٹا ریزیڈنسی تقاضے	LiteLLM (سیلف ہوسٹڈ)	کوئی تیسرا فریق ٹریفک ہینڈل نہیں کرتا
بجٹ صفر، سیلف مینجمنٹ میں راحت	LiteLLM	اوپن سورس، پلیٹ فارم لاگت نہیں
پہلے سے براہِ راست OpenAI استعمال کر رہے، کیشنگ درکار	Cloudflare AI Gateway	صرف URL تبدیل کرنا، نیا بلنگ رشتہ نہیں
متعدد ٹیموں کے لیے RBAC درکار	Portkey یا LiteLLM	دونوں میں ٹیم/رول مینجمنٹ ہے؛ CometAPI اور Cloudflare میں نہیں

یہ چاروں کیا کور نہیں کرتیں

یہ موازنہ ان گیٹ ویز کو کور کرتا ہے جو انڈی ڈویلپر گفتگو میں زیادہ سامنے آتے ہیں۔ مارکیٹ میں دیگر آپشنز بھی قابلِ غور ہیں: Helicone بغیر پراکسی بنے آبزرویبلٹی پر مرکوز ہے، OpenRouter اوپن ویٹ اور تحقیقی ماڈلز تک روٹنگ میں مہارت رکھتا ہے، اور AWS Bedrock ایمیزون کی مینیجڈ AI سروس ہے جو انٹرپرائز ورک لوڈز کے لیے بنائی گئی ہے۔ اگر آپ کی ضروریات اوپر دی گئی چاروں میں نہیں سماتیں تو یہ اگلی جگہیں ہیں جنہیں دیکھنا چاہیے۔

تبدیلی لانا

اگر آپ فی الحال کسی پرووائیڈر کو براہِ راست کال کر رہے ہیں اور گیٹ وے پر غور کر رہے ہیں، تو کوڈ میں تبدیلی کم ہے۔ CometAPI کے لیے، آپ ایک ماحول متغیر شامل کرتے ہیں اور base_url بدلتے ہیں۔ Portkey کے لیے، آپ ایک ہیڈر شامل کرتے ہیں اور ماڈل بتانے کا طریقہ بدلتے ہیں (@openai/gpt-4o کی جگہ gpt-4o)۔ Cloudflare کے لیے، آپ URL بدلتے ہیں بغیر اپنی پرووائیڈر API کلید چھیڑے۔ LiteLLM کے لیے، پہلے ایک لوکل سرور چلاتے ہیں، پھر اپنا کلائنٹ اس کی طرف پوائنٹ کرتے ہیں۔

بڑا سوال یہ نہیں کہ تبدیلی کیسے لانی ہے، بلکہ یہ کہ آیا آپ کو اس کی ضرورت ہے یا نہیں۔ اگر آپ ایک ہی پرووائیڈر کو کال کرتے ہیں، لاگت پر کوئی ابہام نہیں، اور کراس ماڈل روٹنگ درکار نہیں، تو گیٹ وے فائدے کے بغیر پیچیدگی بڑھاتا ہے۔ اگر آپ متعدد پرووائیڈرز کو ہِٹ کر رہے ہیں، کنٹریکٹرز میں کلیدیں بانٹ رہے ہیں، یا غیر متوقع بل بار بار مسئلہ بن رہے ہیں، تو انٹیگریشن کا اوورہیڈ فائدہ مند ہے۔

عمومی سوالات

کیا ان گیٹ ویز کو ساتھ ساتھ استعمال کیا جا سکتا ہے؟

ہاں۔ کچھ ٹیمیں حساس ورک لوڈز کے لیے LiteLLM سیلف ہوسٹڈ چلاتی ہیں اور باقی سب کے لیے CometAPI۔ اگر آپ Cloudflare کی کیشنگ لیئر اوپر چاہیں تو Cloudflare AI Gateway کو CometAPI ریکویسٹس کے سامنے بٹھایا جا سکتا ہے — اگرچہ اس سے ایک نیٹ ورک ہاپ بڑھ جاتا ہے۔

کیا یہ گیٹ ویز میرے پرامپٹس محفوظ کرتی ہیں؟

ٹول اور آپ کی کنفیگریشن پر منحصر ہے۔ Portkey اور CometAPI بطورِ ڈیفالٹ ریکویسٹس لاگ کرتے ہیں؛ دونوں میں رٹینشن سیٹنگز ہیں۔ LiteLLM صرف وہ محفوظ کرتا ہے جو آپ اپنی انفراسٹرکچر پر کنفیگر کرتے ہیں۔ Cloudflare کی لاگنگ کا طرزِ عمل اُن کی AI Gateway دستاویزات میں بیان ہے۔ کسی بھی ہوسٹڈ سروس کو حساس مواد بھیجنے سے پہلے اس کی پرائیویسی شرائط پڑھیں۔

اگر گیٹ وے ڈاؤن ہو جائے تو کیا ہوتا ہے؟

ہوسٹڈ گیٹ ویز (CometAPI، Portkey، Cloudflare) کے لیے، گیٹ وے ڈاؤن ٹائم کا مطلب ہے کہ آپ کی ایپلیکیشن اس راستے سے AI پرووائیڈر تک نہیں پہنچ سکے گی۔ لوکل چلتا ہوا LiteLLM آپ کے اپنے سرور جیسی دستیابی خصوصیات رکھتا ہے۔ کسی بھی ہوسٹڈ گیٹ وے پر پروڈکشن کے لیے کمٹ کرنے سے پہلے اس کا SLA دیکھیں اور کیا گیٹ وے خود غیر دستیاب ہونے پر ڈائریکٹ پرووائیڈر فالبیک دیتا ہے۔

کیا کمٹمنٹ سے پہلے مفت میں ہر ایک کو آزمایا جا سکتا ہے؟

ہاں۔ CometAPI اور Portkey دونوں کے فری ٹئیر ہیں۔ LiteLLM اوپن سورس ہے اور صرف آپ کی چلائی گئی انفراسٹرکچر کی لاگت آتی ہے۔ Cloudflare AI Gateway فراخ حدوں کے اندر مفت ہے۔ فیصلہ کرنے سے پہلے آپ ایک ہی ٹیسٹ پرامپٹس پر چاروں کو چلا سکتے ہیں۔

ہر گیٹ وے کے لیے درست ماڈل نام کیسے منتخب کروں؟

ہر گیٹ وے کا اپنا کنونشن ہے۔ CometAPI اپنے شناخت کار استعمال کرتا ہے (gpt-5.4, claude-opus-4-7)۔ Portkey @provider/model-name فارمیٹ استعمال کرتا ہے (@openai/gpt-4o, @anthropic/claude-3-5-sonnet)۔ LiteLLM وہ ماڈل نام استعمال کرتا ہے جو آپ اپنی پراکسی کنفیگ میں متعین کرتے ہیں۔ Cloudflare معیاری پرووائیڈر ماڈل نام بغیر تبدیلی کے پاس کرتا ہے۔ کوڈ لکھنے سے پہلے ہر گیٹ وے کی دستاویزات میں موجود موجودہ ماڈل فہرست چیک کریں۔

کیا گیٹ وے بدلنے سے میرے موجودہ ریٹ لمٹس متاثر ہوتے ہیں؟

ہاں۔ اگر آپ براہِ راست OpenAI کالز سے ایسے گیٹ وے پر جاتے ہیں جو پرووائیڈر رشتہ منیج کرتا ہے (جیسے CometAPI)، تو آپ کی مؤثر ریٹ لمٹس آپ کے ذاتی اکاؤنٹ کے بجائے گیٹ وے کے OpenAI اکاؤنٹ سے متعین ہوں گی۔ پروڈکشن ٹریفک مائگریٹ کرنے سے پہلے گیٹ وے سے ریٹ لمٹ کے رویے کی تصدیق کریں۔