Grok-4-Fast xAI کا ہے۔ نیا لاگت موثر استدلال ماڈل صارفین اور ڈویلپر دونوں کے استعمال کے لیے اعلیٰ معیار کی استدلال اور ویب تلاش کی صلاحیتوں کو سستا اور تیز تر بنانے کے لیے ڈیزائن کیا گیا ہے۔ xAI اسے a کے طور پر رکھتا ہے۔ فرنٹیئر پیشکش جو کہ ٹوکن کی کارکردگی کو بہتر بناتے ہوئے Grok-4 کی بینچ مارک کارکردگی کو محفوظ رکھتی ہے، اور دو مختلف قسموں کو بھیجتا ہے ترک or غیر معقول کام کا بوجھ
اہم خصوصیات (فوری فہرست)
- ماڈل کی دو قسمیں:
grok-4-fast-reasoningاورgrok-4-fast-non-reasoning(گہرائی بمقابلہ رفتار کے لیے ٹیون ایبل)۔ - بہت بڑی سیاق و سباق کی ونڈو: تک 2,000,000 ٹوکن, انتہائی طویل دستاویزات / کثیر گھنٹے ٹرانسکرپٹس / کثیر دستاویزی ورک فلو کو فعال کرنا۔
- ٹوکن کی کارکردگی / لاگت کی توجہ: xAI رپورٹس ~40% کم سوچ ٹوکن اوسط بمقابلہ Grok-4 اور ایک دعوی کیا اسی معیار کی کارکردگی کو حاصل کرنے کے لیے لاگت میں ~98% کمی (میٹرکس xAI رپورٹس پر)۔
- مقامی ٹول / براؤزنگ انضمام: ویب/X براؤزنگ، کوڈ پر عمل درآمد اور ایجنٹ کی تلاش کے رویے کے لیے ٹول کے استعمال کے لیے RL کے ساتھ اختتام سے آخر تک تربیت یافتہ۔
- ملٹی موڈل اور فنکشن کالنگ: تصاویر اور ساختی آؤٹ پٹ کی حمایت کرتا ہے؛ فنکشن کالنگ اور سٹرکچرڈ رسپانس فارمیٹس API میں تعاون یافتہ ہیں۔
تکنیکی تفصیلات
متحد استدلال فن تعمیر: Grok-4-Fast use a سنگل ماڈل ویٹ بیس جس میں لے جایا جا سکتا ہے۔ ترک (سوچوں کا طویل سلسلہ) یا غیر معقول (تیز جوابات) سسٹم پرامپٹس یا مختلف قسم کے انتخاب کے ذریعے رویہ، بجائے کہ دو مکمل طور پر علیحدہ بیک بون ماڈلز بھیجیں۔ یہ کام کے مخلوط بوجھ کے لیے سوئچنگ میں تاخیر اور ٹوکن لاگت کو کم کرتا ہے۔
ذہانت کی کثافت کے لیے کمک سیکھنا: xAI کا استعمال کرتے ہوئے رپورٹ کرتا ہے بڑے پیمانے پر کمک سیکھنے پر توجہ مرکوز انٹیلی جنس کثافت (فی ٹوکن کارکردگی کو زیادہ سے زیادہ کرنا)، جو کہ بیان کردہ ٹوکن کی کارکردگی کے فوائد کی بنیاد ہے۔
ٹول کنڈیشنگ اور ایجنٹ کی تلاش: Grok-4-Fast کو ان کاموں پر تربیت دی گئی اور ان کا جائزہ لیا گیا جن کے لیے ٹولز (ویب براؤزنگ، ایکس سرچ، کوڈ پر عمل درآمد) کی ضرورت ہوتی ہے۔ ماڈل کو ماہر کے طور پر پیش کیا گیا ہے۔ منتخب کریں ٹولز کو کب کال کرنا ہے اور براؤزنگ شواہد کو جوابات میں کیسے سلائی جائے۔
بینچ مارک کارکردگی
IBrowseComp میں بہتری (44.9% پاس@1 بمقابلہ 43.0% Grok-4 کے لیے), SimpleQA (95.0% بمقابلہ 94.0%)، اور کچھ چینی زبان کی براؤزنگ/سرچ میدانوں میں بڑے فوائد۔ xAI نے LMArena کے سرچ ایرینا میں ایک اعلی درجہ بندی کی بھی اطلاع دی ہے۔ grok-4-fast-search مختلف.

ماڈل ورژن اور نام
xAI کی طرف سے اعلان کردہ عوامی نام: grok-4-fast-reasoning اور grok-4-fast-non-reasoning. ہر ویرینٹ ایک جیسی رپورٹ کرتا ہے۔ 2M ٹوکن سیاق و سباق کی حد پلیٹ فارم پہلے کی میزبانی بھی جاری رکھے ہوئے ہے۔ گروک -4 پرچم بردار (مثال کے طور پر، grok-4-0709 مختلف قسمیں جو پہلے استعمال ہوتی ہیں)۔
حدود اور حفاظت کے تحفظات
- مواد کی حفاظت کے خدشات: تحقیقاتی آؤٹ لیٹس کی رپورٹنگ سے ظاہر ہوتا ہے کہ xAI کے گروک فیملی (اور کچھ گروک فیچرز) کو اجازت دینے والے مواد کے اختیارات کے ساتھ تیار کیا گیا ہے اور یہ کہ کچھ اندرونی ورک فلو نے تشریح کرنے والوں کو انتہائی پریشان کن مواد سے بے نقاب کیا ہے۔ اعتدال کی مضبوطی اور غیر قانونی مواد کے لیے حکام کو رپورٹ کرنے کے بارے میں واضح خدشات ہیں۔ یہ حفاظت اور تعمیل کے مسائل پروڈکشن میں کسی بھی گروک ویرینٹ کو تعینات کرتے وقت مادی ہوتے ہیں۔
- آزاد تصدیق: xAI کی کارکردگی/معیشت کے بہت سے دعوے خود رپورٹ ہوتے ہیں۔ آزاد بینچ مارکس اور ہم مرتبہ کے جائزے اب بھی شائع کیے جا رہے ہیں۔ جب تک فریق ثالث کی نقل دستیاب نہ ہو قیمت کی کارکردگی کے دعووں کو وینڈر کے فراہم کردہ سمجھیں۔
- آپریشنل خطرات: کیونکہ Grok-4-Fast کو ایجنٹ براؤزنگ کے لیے بنایا گیا ہے، صارفین کو نوٹ کرنا چاہیے۔ hallucination, ڈیٹا تازگی کی حدود (براؤزنگ کی صلاحیت کے باوجود)، اور کی رازداری جب ماڈل کو بیرونی ٹولز یا لائیو ویب سوالات کے ساتھ استعمال کیا جاتا ہے تو غور کیا جاتا ہے۔
عام اور تجویز کردہ استعمال کے معاملات
- ہائی تھرو پٹ تلاش اور بازیافت — سرچ ایجنٹس جن کو تیز ملٹی ہاپ ویب استدلال کی ضرورت ہے۔
- ایجنٹ کے معاونین اور بوٹس — وہ ایجنٹ جو براؤزنگ، کوڈ پر عمل درآمد، اور غیر مطابقت پذیر ٹول کالز کو یکجا کرتے ہیں (جہاں اجازت ہے)۔
- لاگت کے لحاظ سے حساس پیداواری تعیناتیاں — ایسی خدمات جن کے لیے بہت ساری کالز کی ضرورت ہوتی ہے اور وہ بہتر ٹوکن ٹو یوٹیلیٹی اکنامکس بمقابلہ بھاری بیس ماڈل چاہتے ہیں۔
- ڈویلپر کا تجربہ - پروٹو ٹائپنگ ملٹی موڈل یا ویب بڑھا ہوا بہاؤ جو تیز، بار بار سوالات پر انحصار کرتے ہیں۔
کال کیسے کریں؟ grok-4-fast CometAPI سے API
grok-code-fast-1 CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ:
| grok-4-تیز-غیر معقول | ان پٹ ٹوکنز: $0.16/ M ٹوکن آؤٹ پٹ ٹوکنز: $0.40/ M ٹوکن |
| grok-4-تیز استدلال | ان پٹ ٹوکنز: $0.16/ M ٹوکن آؤٹ پٹ ٹوکنز: $0.40/ M ٹوکن |
مطلوبہ اقدامات
- داخل ہوجاو cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔
- انٹرفیس کی رسائی کی سند API کلید حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔
طریقہ استعمال کریں
- منتخب کریں “
grok-4-fast-reasoning"/"grok-4-fast-reasoningAPI کی درخواست بھیجنے اور درخواست کا باڈی سیٹ کرنے کے لیے اینڈ پوائنٹ۔ درخواست کا طریقہ اور درخواست کا باڈی ہماری ویب سائٹ API دستاویز سے حاصل کیا جاتا ہے۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ - بدل دیں۔ آپ کے اکاؤنٹ سے اپنی اصل CometAPI کلید کے ساتھ۔
- مواد کے خانے میں اپنا سوال یا درخواست داخل کریں—یہ وہی ہے جس کا ماڈل جواب دے گا۔
- . تیار کردہ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔
CometAPI مکمل طور پر ہم آہنگ REST API فراہم کرتا ہے — بغیر کسی رکاوٹ کے منتقلی کے لیے۔ کی اہم تفصیلات API دستاویز:
- بنیادی URL: https://api.cometapi.com/v1/chat/completions
- ماڈل کے نام:"
grok-4-fast-reasoning"/"grok-4-fast-reasoning" - توثیق: بیئرر ٹوکن کے ذریعے
Authorization: Bearer YOUR_CometAPI_API_KEYہیڈر - مواد کی قسم:
application/json.
API انٹیگریشن اور مثالیں۔
ایک کے لیے ازگر کا ٹکڑا چیٹ کی تکمیل CometAPI کے ذریعے کال کریں:
pythonimport openai
openai.api_key = "YOUR_CometAPI_API_KEY"
openai.api_base = "https://api.cometapi.com/v1/chat/completions"
messages = [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize grok-4-fast's main features."}
]
response = openai.ChatCompletion.create(
model="grok-4-fast-reasoning",
messages=messages,
temperature=0.7,
max_tokens=500
)
print(response.choices.message)
یہ بھی دیکھتے ہیں گروک 4
