المواصفات التقنية — Gemini 3.1 Pro
| البند | gemini-3-pro (ملخص عام) |
|---|---|
| المزوّد | |
| المعرّف الأساسي للنموذج | gemini-3-pro (معاينة عامة) |
| أنواع الإدخال | نص، صورة، فيديو، صوت، PDF |
| أنواع الإخراج | نص (لغة طبيعية، مخرجات مُنظَّمة، حمولات استدعاء الدوال) |
| حد رموز الإدخال (السياق) | 1,048,576 رموز |
| حد رموز الإخراج | 65,536 رموز |
| استدعاء الدوال / استخدام الأدوات | مدعوم (استدعاء الدوال، مخرجات مُنظَّمة، تكامل الأدوات) |
| تعددية الوسائط | دعم متعدد الوسائط بالكامل (صور، فيديو، صوت، مستندات) |
| تنفيذ الشيفرة وتدفقات الوكلاء | مدعوم (وضع الوكيل، مساعدة الشيفرة، تنسيق الأدوات) |
| حد المعرفة | يناير 2025 |
ما هو Gemini 3.1 Pro؟
Gemini 3.1 Pro هو النسخة الرائدة المُعلنة للجمهور ضمن عائلة Gemini 3 من Google، ويتموضع كنموذج استدلال متعدد الوسائط متقدم مع أدوات مطوّرين ووكلاء محسّنة. يركّز النموذج على التعامل مع سياق ذي سعة كبيرة (مدخلات تزيد عن 1M رمز) ودعم واسع للوسائط (صور، فيديو، صوت، PDF)، وتكاملات عميقة لاستخدام الأدوات، واستدعاء الدوال، وأُطر العمل المحورية حول الشيفرة (مثل Gemini Code Assist وأوضاع الوكيل).
تقدّم Google نموذج Gemini 3 Pro بوصفه مُحسَّناً لكلٍّ من تجارب المطوّرين التفاعلية (ترميز منخفض الكمون وتدفقات الوكلاء) وفهم متعدد الوسائط عالي الدقة (تفسير واستدلال عبر مدخلات وسائط مختلطة).
الميزات الرئيسية في Gemini 3.1 Pro
يُقدّم Gemini-3.1 Pro (عبر المعاينة) الميزات التالية:
التكامل متعدد الوسائط
يعالج المدخلات عبر:
- اللغة الطبيعية
- الصور
- الكلام/الصوت
- الفيديو
مع تمثيل موحّد للرموز يتيح الاستدلال عبر الأنماط متعددة الوسائط.
نافذة سياق ممتدة
سعة سياق استثنائية تصل إلى ~1 مليون رمز تُمكّن من التعامل مع:
- مستندات طويلة
- توليف متعدد المستندات
- قواعد شيفرة ونصوص محادثات.
وهذا يتجاوز العديد من النماذج المنافسة التي تدعم عادةً ~32 K–262 K رمزاً.
التوسّع بخليط الخبراء (MoE) المتناثر
يتيح توجيه MoE المتناثر توسيع سعة النموذج الداخلية من دون تكاليف حوسبة متناسبة، مما يحسّن الاستدلال على نطاق واسع.
الاستدلال/التخطيط المتقدم
ابتكارات مثل تدريب سلسلة التفكير، والتعلّم التعزيزي من ملاحظات بشرية، ومعايير متخصصة تجعل أداءه قوياً في المهام المنطقية والرياضية.
معايير مفترضة:
AIME 2025: 100% (مع تنفيذ الشيفرة)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%
حالات استخدام مؤسسية نموذجية
- سلاسل وسائط من طرف إلى طرف: إدخال الفيديو والنصوص والصور لإنتاج ملخصات متزامنة وبيانات وصفية ورؤى مُهيكلة على نطاق واسع.
- إنشاء الشيفرة ومراجعتها على نطاق واسع: استخدامه في بيئات التطوير المتكاملة (IDEs) وسلاسل CI لتوليد الشيفرة تلقائياً، وإعادة هيكلة مشاريع متعددة الملفات، واقتراح اختبارات عبر قواعد شيفرة كبيرة.
- أتمتة قائمة على الوكلاء: تنسيق وكلاء متعددي الأدوات يتفاعلون مع خدمات السحابة وأنظمة التنسيق وواجهات برمجة التطبيقات الداخلية عبر استدعاءات دوال مُنظَّمة.
- البحث وإنتاج المحتوى: صياغة محتوى طويل (تقارير، كتب) يجمع النص ووسائط متعددة مضمّنة مع الحفاظ على المراجع الداخلية.
كيفية الوصول إلى واجهة Gemini 3.1 Pro API
الخطوة 1: التسجيل للحصول على مفتاح API
سجّل الدخول إلى cometapi.com. إن لم تكن مستخدماً لدينا بعد، يُرجى التسجيل أولاً. سجّل الدخول إلى وحدة تحكم CometAPI. احصل على مفتاح اعتماد الوصول لواجهة API. انقر "إضافة رمز" في قسم رموز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم قدّمه.
الخطوة 2: إرسال الطلبات إلى واجهة Gemini 3.1 Pro API
اختر نقطة النهاية "gemini-3.1-pro" لإرسال طلب واجهة برمجة التطبيقات واضبط جسم الطلب. يتم الحصول على طريقة الطلب وجسم الطلب من وثائق واجهة برمجة التطبيقات على موقعنا. يوفّر موقعنا أيضاً اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الحقيقي من حسابك. عنوان URL الأساسي هو إنشاء المحتوى في Gemini والدردشة.
أدرج سؤالك أو طلبك في حقل المحتوى — فهذا ما سيستجيب له النموذج. عالج استجابة واجهة برمجة التطبيقات للحصول على الإجابة المُولَّدة.
الخطوة 3: استرجاع النتائج والتحقق منها
عالج استجابة واجهة برمجة التطبيقات للحصول على الإجابة المُولَّدة. بعد المعالجة، تستجيب الواجهة بحالة المهمة وبيانات المخرجات.
راجع أيضاً واجهة Gemini 3 Pro API