تکنیکی وضاحتیں — Gemini 3.1 Pro
| آئٹم | gemini-3-pro (عوامی خلاصہ) |
|---|---|
| فراہم کنندہ | |
| مستند ماڈل آئی ڈی | gemini-3-pro (پبلک پری ویو) |
| ان پٹ اقسام | Text, Image, Video, Audio, PDF |
| آؤٹ پٹ اقسام | Text (قدرتی زبان، ساختہ آؤٹ پٹس، فنکشن کال پے لوڈز) |
| ان پٹ ٹوکن حد (کانٹیکسٹ) | 1,048,576 tokens |
| آؤٹ پٹ ٹوکن حد | 65,536 tokens |
| فنکشن کالنگ / ٹول استعمال | معاونت یافتہ (فنکشن کالنگ، ساختہ آؤٹ پٹس، ٹول انٹیگریشنز) |
| ملٹی ماڈیلٹی | مکمل ملٹی موڈل سپورٹ (تصاویر، ویڈیو، آڈیو، دستاویزات) |
| کوڈ ایگزیکیوشن اور ایجنٹک فلو | معاونت یافتہ (ایجنٹ موڈ، کوڈ اسِسٹ، ٹول آرکسٹریشن) |
| علمی کٹ آف | January 2025 |
Gemini 3.1 Pro کیا ہے؟
Gemini 3.1 Pro، Google کا Gemini 3 فیملی میں عوامی سطح پر فلیگ شپ ہے، جسے جدید ترین ملٹی موڈل استدلالی ماڈل کے طور پر مرتب کیا گیا ہے، جس میں اعلیٰ درجے کی ایجنٹک اور ڈویلپر ٹولنگ موجود ہے۔ ماڈل کی توجہ ہائی-کیپیسیٹی کانٹیکسٹ ہینڈلنگ (یعنی 1M token سے زیادہ ان پٹ)، وسیع میڈیا سپورٹ (تصاویر، ویڈیو، آڈیو، PDF)، اور ٹول استعمال، فنکشن کالنگ، اور کوڈ-مرکوز ورک فلو (مثلاً Gemini Code Assist اور ایجنٹ موڈز) کے لیے گہری انٹیگریشنز پر ہے۔
Gemini 3 Pro کو Google اس طرح پیش کرتا ہے کہ یہ دونوں طرح کے منظرناموں کے لیے موزوں ہے: انٹرایکٹو ڈویلپر تجربات (کم تاخیر والی کوڈنگ اور ایجنٹ ورک فلو) اور اعلیٰ وفاداری والی ملٹی موڈل سمجھ بوجھ (ملے جلے میڈیا ان پٹس میں تشریح اور استدلال)۔
Gemini 3.1 Pro کی اہم خصوصیات
Gemini-3.1 Pro (اپنے پری ویو کے ذریعے) مندرجہ ذیل خصوصیات متعارف کراتا ہے:
ملٹی موڈل انٹیگریشن
ان پٹس کو درج ذیل میں پروسیس کرتا ہے:
- قدرتی زبان
- تصاویر
- تقریر/آڈیو
- ویڈیو
کراس موڈل استدلال کے لیے متحدہ ٹوکن نمائندگی کے ساتھ۔
وسیع کانٹیکسٹ ونڈو
تقریباً ~1 million tokens تک غیرمعمولی بڑی کانٹیکسٹ کیپیسٹی اس قابل بناتی ہے کہ:
- طویل دستاویزات
- متعدد دستاویزات کی ترکیب
- کوڈ بیسز اور ٹرانسکرپٹس
کو ہینڈل کیا جا سکے۔ یہ کئی مقابل ماڈلز سے بڑھ کر ہے جو عموماً ~32 K–262 K ٹوکنز کی سپورٹ دیتے ہیں۔
اسپارسی Mixture-of-Experts (MoE) اسکیلنگ
Sparse MoE راؤٹنگ متناسب کمپیوٹ لاگت کے بغیر اندرونی ماڈل کیپیسٹی کو اسکیل کرنے دیتی ہے، جس سے بڑے پیمانے پر استدلال بہتر ہوتا ہے۔
اعلیٰ استدلال/منصوبہ بندی
chain-of-thought تربیت، انسانی فیڈبیک سے reinforcement learning، اور مخصوص بینچ مارکس جیسی جدتیں اسے منطقی اور ریاضیاتی کاموں میں مضبوط بناتی ہیں۔
مفروضہ بینچ مارکس:
AIME 2025: 100% (کوڈ ایگزیکیوشن کے ساتھ)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%
نمائندہ انٹرپرائز استعمال کی صورتیں
- اینڈ ٹو اینڈ میڈیا پائپ لائنز: ویڈیو، ٹرانسکرپٹ، اور تصاویر کو انجیسٹ کر کے بڑے پیمانے پر ہم آہنگ خلاصے، میٹاڈیٹا، اور ساختہ بصیرتیں تیار کریں۔
- بڑے پیمانے پر کوڈ جنریشن اور ریویو: IDEs اور CI پائپ لائنز میں استعمال کریں تاکہ کوڈ خودکار طور پر تیار ہو، ملٹی فائل پروجیکٹس ریفیکٹر ہوں، اور بڑے کوڈ بیسز میں ٹیسٹ تجاویز پیدا ہوں۔
- ایجنٹک آٹومیشن: اسٹرکچرڈ فنکشن کالز استعمال کرتے ہوئے کلاؤڈ سروسز، آرکسٹریشن سسٹمز، اور اندرونی APIs کے ساتھ تعامل کرنے والے کثیر-ٹول ایجنٹس کو مربوط کریں۔
- تحقیق اور مواد کی تیاری: طویل شکل کا مواد (رپورٹس، کتابیں) مسودہ کریں جو متن اور ایمبیڈڈ ملٹی میڈیا کو یکجا کرتا ہو اور داخلی کراس ریفرنسز برقرار رہیں۔
Gemini 3.1 Pro API تک کیسے رسائی حاصل کریں
مرحلہ 1: API کلید کے لیے سائن اپ کریں
cometapi.com میں لاگ ان کریں۔ اگر آپ ابھی ہمارے صارف نہیں ہیں تو براہِ کرم پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن ان کریں۔ انٹرفیس کی رسائی اسناد کی API کلید حاصل کریں۔ پرسنل سینٹر میں API ٹوکن پر “Add Token” پر کلک کریں، ٹوکن کلید حاصل کریں: sk-xxxxx اور جمع کرائیں۔
مرحلہ 2: Gemini 3.1 Pro API کو درخواستیں بھیجیں
API درخواست بھیجنے کے لیے “gemini-3.1-pro” اینڈ پوائنٹ منتخب کریں اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کی API ڈاکیومنٹیشن سے حاصل کیے جاتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنے اکاؤنٹ کی اصل CometAPI کلید کے ساتھ <YOUR_API_KEY> کو بدلیں۔ base url Gemini Generating Content اور Chat ہے۔
اپنا سوال یا درخواست content فیلڈ میں داخل کریں—ماڈل اسی کا جواب دے گا۔ پیدا شدہ جواب حاصل کرنے کے لیے API ریسپانس کو پروسیس کریں۔
مرحلہ 3: نتائج حاصل کریں اور تصدیق کریں
پیدا شدہ جواب حاصل کرنے کے لیے API ریسپانس کو پروسیس کریں۔ پروسیسنگ کے بعد، API ٹاسک کی حیثیت اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔
مزید دیکھیں Gemini 3 Pro API