تکنیکی وضاحتیں — Claude Sonnet 4.6
| آئٹم | Claude Sonnet 4.6 (عوامی خلاصہ) |
|---|---|
| فراہم کنندہ | Anthropic |
| ماڈل فیملی | Sonnet (Claude v4.x فیملی) — Sonnet 4.6 ویریئنٹ |
| ماڈل ID (کینونیکل) | claude-sonnet-4-6 |
| ان پٹ کی اقسام | متن (بنیادی)۔ ساختہ ٹول/JSON I/O کے لیے محدود/ثانوی سپورٹ۔ امیج جنریشن کے بنیادی ماڈل کے طور پر پوزیشن نہیں کیا گیا۔ |
| آؤٹ پٹ کی اقسام | متن (قدرتی زبان، ساختہ JSON، کوڈ، اور ٹول کال پیلوڈز) |
| کانٹیکسٹ ونڈو | ∼200,000 ٹوکن (تقریباً) — کثیر دستاویز اور طویل نشستوں میں ربط کے لیے ڈیزائن کیا گیا ہے |
| فنکشن کالنگ / ٹول استعمال | ہاں — ساختہ ٹول انووکییشن، JSON-محدود آؤٹ پٹس، ایجنٹ طرز آرکیسٹریشن کی سپورٹ |
| ملٹی موڈیلٹی | محدود — Sonnet متن اور ساختہ ٹول انضمام پر مرکوز ہے؛ امیج جنریشن کے لیے بہتر نہیں کیا گیا۔ |
| رلیز نوٹس کی نمایاں باتیں | طویل سیاق میں استدلال کی استحکام/بہتری، کم تاخیر والا Sonnet ویریئنٹ جو رفتار–درستگی کے توازن کے لیے ٹون کیا گیا، ہدایات پر عملدرآمد میں بہتری۔ |
Claude Sonnet 4.6 کیا ہے
Claude Sonnet 4.6، Anthropic کی Sonnet ماڈل لائن کا تازہ ترین ارتقا ہے، جسے زیادہ قابلِ دسترس قیمت پر Opus کے قریب کارکردگی فراہم کرنے کے لیے ڈیزائن کیا گیا ہے۔ یہ Sonnet کو اس کے سابقہ 4.5 ورژن سے اپگریڈ کرتا ہے، مضبوط ہدایات کی پیروی، سیاق کی بہت زیادہ توسیع شدہ سپورٹ، کوڈنگ اور کمپیوٹر استعمال کی بہتر صلاحیتیں، اور زیادہ وسیع کثیر مرحلہ استدلالی قابلیتیں لاتے ہوئے — اور یہ سب Sonnet 4.5 کے ساتھ قیمت میں برابری برقرار رکھتے ہوئے۔
Opus ماڈلز کے برعکس، جو فلیگ شپ ہیں اور بھاری ایجنٹک ورک لوڈز کے لیے بہتر کیے گئے ہیں، Sonnet 4.6 ان ڈویلپرز اور عمومی علمی کام کے لیے ہدف ہے جہاں وسیع صلاحیت اور لاگت مؤثریت اہم ہو۔
Claude Sonnet 4.6 کی نمایاں خصوصیات
- 1M ٹوکن کانٹیکسٹ ونڈو (بیٹا): Sonnet 4.6 بیٹا میں سیاق کے ایک ملین ٹوکن تک سپورٹ دیتا ہے — تقریباً اتنا کہ ایک ہی درخواست میں مکمل کوڈ بیسز، قانونی معاہدوں کے ڈھیر، یا متعدد علمی مقالے سموئے جا سکیں۔
- بہتر کوڈنگ کارکردگی: Sonnet 4.6 حقیقی دنیا کے ڈویلپر ٹاسکس اور بینچ مارکس جیسے SWE-Bench Verified (~79.6% رپورٹڈ اسکور) میں نمایاں بہتری دکھاتا ہے، جس سے یہ پیچیدہ کوڈنگ کاموں کے لیے موزوں بنتا ہے۔
- بہتر کمپیوٹر استعمال: سافٹ ویئر آپریشن کے کاموں (اسپریڈشیٹس، کثیر مرحلہ ویب فارم ورک فلو وغیرہ) میں نئی مہارتیں، OSWorld-Verified ٹیسٹس میں انسانی سطح کے قریب کارکردگی۔
- اڈاپٹو تھنکنگ: ماڈل میں بہتر استدلالی حکمت عملیاں شامل ہیں اور یہ پیچیدہ مسائل کو مرحلہ وار حل کرنے کے لیے اندرونی حسابی وسائل کو متحرک طور پر مختص کر سکتا ہے۔
- ہدایات کی مضبوط پیروی: صارفین زیادہ مستقل مزاجی اور دقت کے ساتھ تفصیلی درخواستوں کی پیروی، کم ہیلوسینیشنز، اور بہتر ٹاسک تکمیل رپورٹ کرتے ہیں۔
- سیفٹی اور پرومپٹ انجیکشن مزاحمت: Anthropic نے پرومپٹ انجیکشن اور مشابہہ کمزوریوں کے خلاف Sonnet 4.5 کی نسبت مضبوطی میں بہتری کی ہے۔
Claude Sonnet 4.6 کی بینچ مارک کارکردگی
| جانچ | Claude Sonnet 4.6 (تقریباً) | نوٹس |
|---|---|---|
| SWE-Bench Verified | ~79.6% | Opus کلاس کے قریب مضبوط کوڈنگ کارکردگی۔ |
| OSWorld-Verified (کمپیوٹر استعمال) | ~72.5% | انسانی سطح کے قریب ٹاسک کارکردگی؛ ورک فلو کے لیے مضبوط۔ |
| ARC-AGI-2 | ~60.4% | وسیع استدلالی طاقت کی عکاسی کرتا ہے۔ |
بطور ایک مڈ-ٹیر ماڈل، Sonnet 4.6 Opus ماڈلز کے ساتھ کارکردگی کے فرق کو قابلِ ذکر حد تک کم کرتا ہے، جس سے یہ بہت سے ایسے کاموں کے لیے موزوں ہو جاتا ہے جو پہلے فلیگ شپ کلاس کے لیے مخصوص تھے۔
Claude Sonnet 4.6 بمقابلہ دیگر Claude ماڈلز
| ماڈل | بہترین استعمال | کلیدی فرق |
|---|---|---|
| Claude Sonnet 4.6 | متوازن کوڈنگ، استدلال، بڑے سیاق | وسیع کانٹیکسٹ ونڈو بیٹا، کم لاگت، ورک فلو ٹاسکس کے لیے مضبوط۔ |
| Claude Sonnet 4.5 | مڈ-ٹیر عمومی ٹاسکس | کم بینچ مارکس، 4.6 سے پہلے چھوٹا کانٹیکسٹ ونڈو۔ |
| Claude Opus 4.6 | گہرا استدلال اور ایجنٹک کوڈنگ | خام استدلال اور ایجنٹ صلاحیتیں زیادہ مضبوط؛ زیادہ مہنگا۔ |
Sonnet 4.5 کے مقابلے میں، 4.6 ریلیز سیاقی فہم اور دفتر نما کاموں میں کارکردگی کو بڑھاتی ہے؛ Opus ماڈلز کے مقابلے میں، Sonnet فلیگ شپ سطح کی استدلالی طاقت سے کچھ نیچے ہے مگر اکثر کوڈنگ اور عمومی بینچ مارکس میں توقع سے قریب تر رہتا ہے۔
Claude Sonnet 4.6 کی حدود
- بیٹا کانٹیکسٹ ونڈو: 1M ٹوکن سیاق فی الحال بیٹا میں ہے — API استعمال اور پلان کے مطابق اپنانے اور استحکام میں فرق ہو سکتا ہے۔
- لیٹنسی اور لاگت: بہت بڑے سیاق کے ساتھ کام کرنے سے حسابی لاگت میں اضافہ اور چھوٹے سیاق کے مقابلے میں API کالز پر زیادہ لیٹنسی ہو سکتی ہے۔
- بینچ مارک گرانولیریٹی: رپورٹڈ ٹیسٹس میں مضبوط ہونے کے باوجود، Sonnet نہایت پیچیدہ کثیر الشعبہ یا اعلیٰ درجے کے استدلالی بینچ مارکس میں Opus سے کچھ پیچھے رہ سکتا ہے۔
Claude Sonnet 4.6 کے نمائندہ استعمالات
- بڑی کوڈ بیس معاونت: مکمل سافٹ ویئر سسٹمز، ریفیکٹرنگز، یا فائلوں کے مابین انحصارات کو سمجھنے اور ان پر استدلال کے لیے موزوں۔
- دستاویز اور تحقیق کی تلخیص/ترکیب: طویل دستاویزات کے تجزیے کے لیے مفید، جہاں سیاق عام حدود سے زیادہ ہو جاتا ہے۔
- ورک فلو آٹومیشن: کثیر مرحلہ کمپیوٹر ٹاسکس جیسے اسپریڈشیٹس اور فارم آٹومیشن حل کرنا۔
- عمومی علمی کام: ایسے نالج ورکرز کے لیے موزوں جنہیں فلیگ شپ ماڈلز کی لاگت کے بغیر قابلِ اعتماد ہدایات پر عمل اور معقول استدلال درکار ہو۔
Claude Sonnet 4.6 API تک رسائی اور استعمال کا طریقہ
مرحلہ 1: API Key کے لیے سائن اپ کریں
cometapi.com میں لاگ اِن کریں۔ اگر آپ ابھی ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI کنسول میں سائن اِن کریں۔ انٹرفیس کی ایکسیس کریڈنشل API key حاصل کریں۔ پرسنل سینٹر میں API ٹوکن پر “Add Token” پر کلک کریں، ٹوکن کی: sk-xxxxx حاصل کریں اور جمع کرائیں۔
مرحلہ 2: claude-sonnet-4-6 API کو درخواست بھیجیں
“claude-opus-4-6” اینڈ پوائنٹ منتخب کریں اور API ریکویسٹ بھیجیں اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کی API ڈاک سے حاصل کیے جاتے ہیں۔ آپ کی سہولت کے لیے ہماری ویب سائٹ Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ سے حاصل کردہ CometAPI key کو استعمال کرتے ہوئے <YOUR_API_KEY> سے بدلیں۔ کال کہاں کریں: Anthropic Messages فارمیٹ اور Chat فارمیٹ۔
اپنا سوال یا درخواست content فیلڈ میں درج کریں — ماڈل اسی کا جواب دے گا۔ API ریسپانس کو پروسیس کرکے تیار کردہ جواب حاصل کریں۔
مرحلہ 3: نتائج حاصل کریں اور تصدیق کریں
API ریسپانس کو پروسیس کرکے تیار کردہ جواب حاصل کریں۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔