المواصفات التقنية — Gemini 3.1 Pro
| العنصر | gemini-3-pro (ملخص عام) |
|---|---|
| المزوّد | |
| معرّف النموذج القياسي | gemini-3-pro (معاينة عامة) |
| أنواع الإدخال | نص، صورة، فيديو، صوت، PDF |
| أنواع الإخراج | نص (لغة طبيعية، مخرجات منظَّمة، حمولات استدعاء الدوال) |
| حد رموز الإدخال (السياق) | 1,048,576 رمزًا |
| حد رموز الإخراج | 65,536 رمزًا |
| استدعاء الدوال / استخدام الأدوات | مدعوم (استدعاء الدوال، المخرجات المنظَّمة، تكاملات الأدوات) |
| تعدد الوسائط | دعم كامل لتعدد الوسائط (الصور، الفيديو، الصوت، المستندات) |
| تنفيذ الكود والتدفقات الوكيلة | مدعوم (وضع الوكيل، مساعدة الكود، تنسيق الأدوات) |
| تاريخ انقطاع المعرفة | يناير 2025 |
ما هو Gemini 3.1 Pro؟
Gemini 3.1 Pro هو نموذج Google الرائد المتاح علنًا ضمن عائلة Gemini 3، ويُوضَع كنموذج استدلال متعدد الوسائط على أحدث مستوى تقني مع أدوات متقدمة للوكلاء والمطورين. يركّز النموذج على التعامل مع سياق عالي السعة (أكثر من 1M token من المدخلات)، ودعم واسع للوسائط (الصور، الفيديو، الصوت، PDF)، وتكاملات عميقة لاستخدام الأدوات، واستدعاء الدوال، وتدفقات العمل المتمحورة حول الكود (مثل Gemini Code Assist وأوضاع الوكيل).
تُقدّمه Google على أنه مُحسَّن لكلٍّ من تجارب المطورين التفاعلية (البرمجة منخفضة الكمون وتدفقات عمل الوكيل) والفهم متعدد الوسائط عالي الدقة (تفسير المدخلات المختلطة من الوسائط والاستدلال عبرها).
الميزات الرئيسية لـ Gemini 3.1 Pro
يقدّم Gemini-3.1 Pro (عبر نسخته التجريبية) الميزات التالية:
التكامل متعدد الوسائط
يعالج المدخلات عبر:
- اللغة الطبيعية
- الصور
- الكلام/الصوت
- الفيديو
باستخدام تمثيل موحّد للرموز من أجل الاستدلال العابر للوسائط.
نافذة سياق ممتدة
تتيح سعة سياق كبيرة للغاية تصل إلى ~1 مليون رمز إمكانية التعامل مع:
- المستندات الطويلة
- توليف مستندات متعددة
- قواعد الشيفرة والنصوص المفرَّغة.
وهذا يتجاوز كثيرًا العديد من النماذج المنافسة التي تدعم عادةً ~32 K–262 K رمزًا.
التوسّع باستخدام Sparse Mixture-of-Experts (MoE)
يتيح توجيه Sparse MoE توسيع السعة الداخلية للنموذج دون تكاليف حوسبة متناسبة، مما يحسّن الاستدلال على نطاق واسع.
الاستدلال / التخطيط المتقدم
تجعل ابتكارات مثل تدريب chain-of-thought، والتعلّم المعزّز من ملاحظات البشر، والمعايير المتخصصة هذا النموذج قويًا في المهام المنطقية والرياضية.
المعايير المرجعية المفترضة:
AIME 2025: 100% (مع تنفيذ الكود)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%
حالات استخدام مؤسسية تمثيلية
- مسارات وسائط شاملة من البداية إلى النهاية: استيعاب الفيديو والنصوص المفرَّغة والصور لإنتاج ملخصات متزامنة وبيانات وصفية ورؤى منظَّمة على نطاق واسع.
- توليد الشيفرة ومراجعتها على نطاق واسع: استخدامه داخل IDEs وخطوط CI لتوليد الشيفرة تلقائيًا، وإعادة هيكلة المشاريع متعددة الملفات، وتقديم اقتراحات للاختبارات عبر قواعد شيفرة كبيرة.
- الأتمتة الوكيلة: تنسيق وكلاء متعددَي الأدوات يتفاعلون مع الخدمات السحابية وأنظمة التنسيق وواجهات API الداخلية باستخدام استدعاءات دوال منظَّمة.
- البحث وإنتاج المحتوى: صياغة محتوى طويل (تقارير، كتب) يجمع بين النص والوسائط المضمَّنة مع الحفاظ على الإحالات المرجعية الداخلية.
كيفية الوصول إلى واجهة Gemini 3.1 Pro API
الخطوة 1: التسجيل للحصول على مفتاح API
سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يُرجى التسجيل أولًا. سجّل الدخول إلى CometAPI console. احصل على بيانات الوصول، أي مفتاح API الخاص بالواجهة. انقر على “Add Token” ضمن API token في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسله.
الخطوة 2: إرسال الطلبات إلى Gemini 3.1 Pro API
حدّد نقطة النهاية “gemini-3.1-pro” لإرسال طلب API واضبط نص الطلب. يتم الحصول على طريقة الطلب ونص الطلب من توثيق API على موقعنا. كما يوفّر موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي الخاص بك من حسابك. عنوان base url هو Gemini Generating Content وChat.
أدرج سؤالك أو طلبك في حقل content — وهذا هو ما سيرد عليه النموذج. عالج استجابة API للحصول على الإجابة المُولَّدة.
الخطوة 3: استرجاع النتائج والتحقق منها
عالج استجابة API للحصول على الإجابة المُولَّدة. بعد المعالجة، تستجيب API بحالة المهمة وبيانات الإخراج.
راجع أيضًا Gemini 3 Pro API