Promptfoo ایک اوپن سورس CLI ٹول ہے جو LLM پرامپٹس، ماڈلز اور ایپلیکیشنز کی ٹیسٹنگ، تشخیص، اور ریڈ ٹیمِنگ کے لیے استعمال ہوتا ہے۔ اسے CometAPI—جو 500+ ماڈلز کے لیے یکجا اور OpenAI-مطابق API ہے—کے ساتھ جوڑنے سے ڈویلپرز ایک ہی کی کے ذریعے GPT، Claude, Gemini, Grok, DeepSeek وغیرہ پر ٹیسٹ کر سکتے ہیں، اور اکثر براہِ راست پرووائیڈرز کے مقابلے میں 20-40% کم لاگت پر۔ یہ گائیڈ سیٹ اپ، کنفیگز، ایڈوانس استعمال، اور حقیقی ڈیٹا پر مبنی فوائد کا احاطہ کرتی ہے۔
فیچرڈ اسنیپٹ کے لیے بہتر بنایا گیا خلاصہ
Promptfoo ایک اوپن سورس CLI ٹول ہے جو LLM پرامپٹس، ماڈلز اور ایپلیکیشنز کی ٹیسٹنگ، تشخیص، اور ریڈ ٹیمِنگ کے لیے استعمال ہوتا ہے۔ اسے CometAPI—جو 500+ ماڈلز کے لیے یکجا اور OpenAI-مطابق API ہے—کے ساتھ جوڑنے سے ڈویلپرز ایک ہی کی کے ذریعے GPT، Claude, Gemini, Grok, DeepSeek وغیرہ پر ٹیسٹ کر سکتے ہیں، اور اکثر براہِ راست پرووائیڈرز کے مقابلے میں 20-40% کم لاگت پر۔ یہ گائیڈ سیٹ اپ، کنفیگز، ایڈوانس استعمال، اور حقیقی ڈیٹا پر مبنی فوائد کا احاطہ کرتی ہے۔
Promptfoo کیا ہے؟
Promptfoo ایک آزمودہ، اوپن سورس CLI اور لائبریری ہے جو test-driven LLM development کے لیے بنائی گئی ہے۔ دستی کوشش و خطا کے بجائے، یہ پرامپٹس، ماڈلز، RAG سسٹمز، اور ایجنٹس پر تشخیصات کو خودکار بناتی ہے۔ اہم صلاحیتیں شامل ہیں:
- ماڈلز کا سائیڈ بائی سائیڈ موازنہ میٹرکس ویوز کے ساتھ۔
- خودکار اسرشینز (exact match، regex، LLM-as-judge، semantic similarity وغیرہ)۔
- پرامپٹ انجیکشن، جیل بریکس، اور برانڈ رسکس جیسے نقائص کے لیے ریڈ ٹیمِنگ (50+ پلگ اِن اقسام)۔
- CI/CD انضمام، کیشنگ، کونکرنسی، اور لائیو ری لوڈنگ۔
- 60+ پرووائیڈرز، کسٹم اسکرپٹس، اور HTTP اینڈ پوائنٹس کی سپورٹ۔
Adoption Stats (2026): 156 Fortune 500 کمپنیوں کے ذریعے استعمال، لاکھوں صارفین کی خدمت کرنے والی ایپس کو پاور کرتا ہے، اور Shopify وغیرہ کی ٹیموں کا معتمد۔ یہ MIT لائسنس کے تحت ہے اور کمیونٹی میں مضبوط رفتار رکھتا ہے۔
Promptfoo "it works on my machine" کی جگہ دہرائے جا سکنے والے، قابلِ مقدار بینچ مارکس لاتا ہے—جو پروڈکشن کی طرف بڑھتی LLM ایپس کے لیے نہایت اہم ہے۔
Promptfoo کے ساتھ CometAPI کیوں استعمال کریں؟
CometAPI ایک ڈویلپر-فرسٹ متحد API ہے جو OpenAI, Anthropic, Google, xAI, DeepSeek وغیرہ کے 500+ جدید ماڈلز (LLMs, image, video, embeddings) کو یکجا کرتی ہے۔ یہ مکمل طور پر OpenAI-مطابق ہے، اس لیے موجودہ کوڈ صرف base_url بدلنے سے کام کرتا ہے۔
Key Benefits of the Combo:
- Massive Model Variety Without Key Management: ایک ہی کی سے GPT-5 ویریئنٹس، Claude Opus 4.x، Gemini 3.x، Grok 4، DeepSeek V4، Flux، DALL-E، Sora-like ماڈلز وغیرہ ٹیسٹ کریں۔ متعدد اکاؤنٹس سنبھالنے کی ضرورت نہیں۔
- Significant Cost Savings: CometAPI ماڈلز کی قیمتیں سرکاری نرخ سے کم از کم 20-40% کم رکھتا ہے اور pay-as-you-go (بغیر سبسکرپشن)۔ حقیقی صارف رپورٹس اور بینچ مارکس براہِ راست یا OpenRouter جیسے متبادل کے مقابلے میں مسلسل بچت دکھاتے ہیں۔
- Native Promptfoo Support: chat، completion، embedding، اور image اقسام کے ساتھ مخصوص
cometapi:پرووائیڈر۔ تشخیصات اور ریڈ ٹیمِنگ کے لیے بے رکاوٹ۔ - Reliability & Speed: 99.9% اپ ٹائم، <400ms اوسط لیٹنسی، انٹرپرائز پرائیویسی (پرومپٹس پر تربیت نہیں)، یوزج ڈیش بورڈز، اور فیل اوور راؤٹنگ۔
- Flexibility for Evaluation Workflows: فرنٹیئر ماڈلز کا سستا A/B ٹیسٹ، RAG درستگی کا بینچ مارک، یا مختلف پرووائیڈرز پر ایجنٹس کی ریڈ ٹیمِنگ—وہ بھی بجٹ توڑے بغیر۔
ہائی والیم ٹیسٹنگ میں، Promptfoo کے ذریعے CometAPI پر سوئچ کرنا تشخیص لاگت کو ڈرامائی طور پر کم کر سکتا ہے اور کوریج وسیع بناتا ہے۔ مثال کے طور پر، متعدد Claude/GPT equivalents کو ساتھ ساتھ ٹیسٹ کرنا نہایت آسان اور کم خرچ ہو جاتا ہے۔ ٹیمیں پہلے دن سے 20%+ بچت رپورٹ کرتی ہیں، مکمل پورٹیبلیٹی کے ساتھ (زیرو لاک اِن)۔
Latest Context (2026): تیز رفتار ماڈل ریلیزز (جیسے Claude Opus 4-8، GPT-5 سیریز، Gemini کی پیش رفت) کے ساتھ، CometAPI جیسے unified پلیٹ فارمز اور Promptfoo جیسے تشخیصی ٹولز بجٹ بڑھائے بغیر چُست رہنے کے لیے ضروری ہیں۔ Promptfoo کا ایکو سسٹم پرووائیڈر سپورٹ کو وسعت دیتا جا رہا ہے، جس میں CometAPI کے ساتھ گہرا انضمام بھی شامل ہے۔
ضروریات
- Node.js (v18+ تجویز کردہ): Promptfoo بنیادی طور پر Node پر مبنی ہے۔
- CometAPI اکاؤنٹ اور کی: ٹیسٹ کریڈٹس کے لیے CometAPI پر مفت سائن اپ کریں۔ کی console/token سے حاصل کریں۔
- Promptfoo نصب:
npm install -g promptfoo
# Or npx promptfoo@latest for one-off use
- YAML اور ٹرمینل سے بنیادی واقفیت۔
- (اختیاری) کسٹم پرووائیڈرز کے لیے Python، یا تنہائی کے لیے Docker۔
تنصیب کی توثیق: promptfoo --version.
CometAPI کے ساتھ Promptfoo انضمام کو کیسے کنفیگر کریں
1. اپنی CometAPI API Key سیٹ کریں
export COMETAPI_KEY=your_actual_key_here
# Persist with .env or shell profile
Promptfoo cometapi پرووائیڈر کے لیے اسے خود بخود پڑھتا ہے۔
تشخیصات چلانے سے پہلے COMETAPI_KEY سیٹ کریں:
read -rsp "CometAPI API key: " COMETAPI_KEY
printf '\n'
export COMETAPI_KEY
2. CometAPI پرووائیڈر فارمیٹ منتخب کریں
promptfooconfig.yaml میں:
providers:
- cometapi:chat:gpt-5-mini # Defaults to chat
- cometapi:chat:claude-3-5-sonnet-20241022
- cometapi:image:flux-schnell # Image gen
- cometapi:embedding:text-embedding-3-small
# Or shorthand
- cometapi:gpt-5.4-pro
مکمل نحو: cometapi:<type>:<model>۔ قسم بطورِ ڈیفالٹ chat ہوتی ہے۔ config کے ذریعے تمام OpenAI پیرامیٹرز سپورٹ ہوتے ہیں۔
ان پرووائیڈر اقسام کو استعمال کریں:
| Type | استعمال |
|---|---|
| chat | چیٹ کمپلیشنز، وژن، اور ملٹی موڈل پرامپٹس |
| completion | ٹیکسٹ کمپلیشن ماڈلز |
| embedding | ٹیکسٹ ایمبیڈنگ تشخیصات |
| image | امیج جنریشن تشخیصات |
آپ cometapi:your-model-id بھی ڈیفالٹ چیٹ موڈ کے لیے استعمال کر سکتے ہیں۔
3. فوری CLI تشخیص چلائیں
# Simple one-off
npx promptfoo@latest eval --prompts "Write a haiku about AI" -r cometapi:chat:your-model-id
# With full config
promptfoo eval
یہ سکورز، آؤٹ پٹس، اور ڈیفس کے ساتھ ایک ویب ویوئر بناتا ہے۔
4. جامع Promptfoo کنفیگ فائل بنائیں
درج ذیل promptfooconfig.yaml ایک ہی پرامپٹ کو CometAPI ماڈل کے مقابل تشخیص دیتا ہے:
prompts:
- "Classify this support request: {{message}}"
providers:
- id: cometapi:chat:your-model-id
config:
temperature: 0.2
max_tokens: 256
tests:
- vars:
message: "The API key works locally but fails in production."
assert:
- type: contains-any
value:
- authentication
- configuration
Promptfoo کے ساتھ کنفیگ فائل چلائیں:
npx promptfoo@latest eval -c promptfooconfig.yaml
خودکار نقائص کی اسکیننگ کے لیے promptfoo redteam setup چلائیں۔
مضبوط تشخیصات کے لیے تفصیلی مرحلہ وار ورک فلو
- کاروبار کے لیے کلیدی منظرنامے متعین کریں: حقیقی استعمال کی عکاسی کرنے والی ٹیسٹ سوئیٹس بنائیں (مثلاً کسٹمر سپورٹ، کوڈ جنریشن، تخلیقی کام)۔
- پرامپٹ انجینئرنگ کا اعادہ: متغیرات (
{{var}}) اور فائل پر مبنی پرامپٹس استعمال کریں۔ ورژنز ٹریک کریں۔ - ماڈل موازنہ میٹرکس: 5-10 ماڈلز پر تشخیصات چلائیں۔ لاگت، لیٹنسی، اور کوالٹی اسکورز کا تجزیہ کریں۔
- اسکورنگ اور اسرشینز: قواعد پر مبنی، ماڈل پر مبنی (LLM جج)، اور کسٹم JS/Python گریڈرز کو یکجا کریں۔
- CI/CD انضمام: GitHub Actions میں شامل کریں:
- name: Promptfoo Eval
run: promptfoo eval --ci
- مانیٹر کریں اور اعادہ کریں: خرچ/لیٹنسی کی بصیرت کے لیے Promptfoo ویوئر + CometAPI ڈیش بورڈ استعمال کریں۔
مثالی آؤٹ پٹ تجزیہ: ایسی جدولیں متوقع ہیں جو جیت کی شرحیں دکھائیں، مثلاً بعض کاموں میں استدلال پر Claude بہتر، رفتار پر GPT، اور لاگت پر DeepSeek۔
Promptfoo میں CometAPI بمقابلہ براہِ راست پرووائیڈرز بمقابلہ متبادلات
| Aspect | CometAPI + Promptfoo | Direct (OpenAI/Anthropic) | Other Aggregators (e.g., OpenRouter) |
|---|---|---|---|
| Models Available | 500+ یکجا | وینڈر کے مطابق محدود | بہت سے، مگر غیر یکساں |
| Pricing | سرکاری نرخ سے 20-40% کم | مکمل نرخ | سرکاری + فیسیں |
| Key Management | واحد کی | متعدد | متعدد |
| Latency/Uptime | <400ms، 99.9% | مختلف | مختلف |
| Promptfoo Native | ہاں، مکمل سپورٹ | ہاں | جزوی |
| Privacy | پرومپٹس پر تربیت نہیں | پرووائیڈر پالیسی | مختلف |
| Best For | وسیع ٹیسٹنگ اور پروڈکشن | سنگل وینڈر لاک اِن | سادہ راؤٹنگ |
Data Insight: 1M ٹوکنز کے مِڈ-ٹیئر ماڈل استعمال پر، CometAPI عموماً فی ملین $5-20+ تک بچت دیتا ہے، جو تشخیصی لوپس (سینکڑوں/ہزاروں کالز) میں جمع ہو کر بڑھتی ہے۔
عام مسائل کا حل
- API Key Errors: تصدیق کریں کہ
COMETAPI_KEYانوائرنمنٹ ویری ایبل سیٹ ہے (echo $COMETAPI_KEY)۔ کریڈٹس کے لیے کنسول چیک کریں۔ - Model Not Found: ماڈلز لسٹ کریں بذریعہ
curl -H "Authorization: Bearer $COMETAPI_KEY"https://api.cometapi.com/v1/models. درست نام استعمال کریں۔ - Rate Limits: CometAPI اپ اسٹریم کو ذہانت سے ہینڈل کرتا ہے؛ config میں
delayسیٹ کریں یا کونکرنسی کم کریں۔ - High Latency in Evals: کیشنگ فعال کریں (
cache: true)۔ ابتدائی ٹیسٹس کے لیے چھوٹے ماڈلز استعمال کریں۔ - Assertion Failures: ربریکس ٹیون کریں یا مزید مثالیں شامل کریں۔ LLM ججز غیر مستقل ہو سکتے ہیں—متعدد رنز کا اوسط لیں (
repeat: 3)۔ - Image/Vision Issues: یقینی بنائیں کہ ماڈل مطلوبہ موڈیلٹی سپورٹ کرتا ہے؛ درست URLs فراہم کریں۔
- YAML Parsing: Promptfoo اسکیمہ یا آن لائن ٹولز سے توثیق کریں۔
- Permissions/CORS: کسٹم HTTP کے لیے ہیڈرز چیک کریں۔
Pro Tip: تفصیلی لاگز کے لیے promptfoo eval --verbose چلائیں۔ بندشوں کے لیے CometAPI اسٹیٹس/ڈیش بورڈ چیک کریں۔
Troubleshooting
Promptfoo API key نہیں ڈھونڈ پا رہا
یقینی بنائیں کہ COMETAPI_KEY اسی شیل سیشن میں ایکسپورٹ ہوا ہے جس میں promptfoo eval چل رہا ہے۔
پرووائیڈر کی قسم ماڈل سے مطابقت نہیں رکھتی
گفتگو اور ملٹی موڈل ماڈلز کے لیے chat، ایمبیڈنگ ماڈلز کے لیے embedding، اور امیج جنریشن ماڈلز کے لیے image استعمال کریں۔
ماڈل ID ناکام ہے
your-model-id کو CometAPI Models صفحہ سے عین ماڈل ID سے بدلیں۔
ایڈوانس ٹِپس اور بہترین طریقہ کار
- Cost Optimization: پرامپٹ اعادہ کے لیے سستے ماڈلز (مثلاً GPT-5-mini یا CometAPI کے ذریعے DeepSeek) سے شروع کریں، پھر پریمیم سے توثیق کریں۔
- Custom Providers: ضرورت پڑنے پر CometAPI سے آگے JS/Python کے ساتھ توسیع کریں۔
- RAG & Agent Testing: ریٹریول ویری ایبلز اور ٹول کالز شامل کریں۔
- Security: پروڈکشن سے پہلے بھرپور ریڈ ٹیمِنگ کریں۔ Promptfoo + CometAPI کا پرائیویسی فوکس مددگار ہے۔
- Scaling: بڑے سوئیٹس کے لیے کلاؤڈ رنرز استعمال کریں یا Promptfoo کو خود ہوسٹ کریں۔
- Monitoring: ماڈل فی ٹوکن خرچ کے لیے CometAPI اینالیٹکس کے ساتھ ملا کر استعمال کریں۔
CometAPI Recommendations for Your Stack (Cometapi.com سے):
- لاگت کم رکھنے کے لیے تمام تشخیصی ورک لوڈز میں استعمال کریں۔
- تیز ٹیسٹس کے لیے پلے گراؤنڈ سے فائدہ اٹھائیں۔
- بجٹ میں رہنے کے لیے یوزج الرٹس مانیٹر کریں۔
- Promptfoo میں ملٹی موڈل تشخیصات کے لیے امیج/ویڈیو ماڈلز ایکسپلور کریں۔
نتیجہ: آج ہی اپنے LLM ڈیولپمنٹ کو اگلے درجے پر لے جائیں
Promptfoo کے ساتھ CometAPI کا انضمام جدید AI ڈیولپمنٹ کے لیے طاقتور، کم خرچ، اور اسکیل ایبل حل فراہم کرتا ہے۔ آپ کو بے مثال ماڈل لچک، سخت جانچ، لاگت کی بچت، اور خودکار ریڈ ٹیمِنگ کے ذریعے اطمینان حاصل ہوتا ہے—وہ بھی مکمل کنٹرول برقرار رکھتے ہوئے۔
چھوٹا آغاز کریں: کی سیٹ کریں، مثال کنفیگ چلائیں، اور اپنی ٹیسٹ سوئیٹ کو وسعت دیں۔ وقت اور پیسے کی بچت آپ کی AI ایپلیکیشنز کے بڑھنے کے ساتھ مرکب ہو کر بڑھے گی۔
Ready to implement? اپنے مفت کی کے لیے CometAPI پر جائیں اور Promptfoo ڈاکس میں غوطہ لگائیں۔ Cometapi.com پر کسٹم کنسلٹنگ یا ایڈوانس سیٹ اپس کے لیے، ہمارے وسائل دریافت کریں۔
