المواصفات التقنية لـ MiniMax M3
| البند | MiniMax M3 |
|---|---|
| عائلة النموذج | MiniMax M3 نموذج أساسي على مستوى الحدود |
| المزود | MiniMax |
| البنية | MiniMax Sparse Attention (MSA) |
| أنواع الإدخال | نص، صورة، فيديو |
| أنواع الإخراج | نص |
| نافذة السياق | حتى 1,000,000 رمز (الحد الأدنى المضمون 512K) |
| نقاط القوة الأساسية | البرمجة، سير عمل قائم على الوكلاء، الاستدلال متعدد الوسائط، معالجة سياقات طويلة |
| وضع الاستدلال | أوضاع التفكير (تشغيل/إيقاف) |
| استخدام الأدوات | سير عمل الوكلاء، استدعاء الأدوات، تنفيذ مهام سطر الأوامر |
| النشر | API، MiniMax Code، Token Plan، إصدار بالأوزان المفتوحة مرتقب |
| دعم متعدد الوسائط | تدريب مسبق متعدد الوسائط أصيل منذ الخطوة صفر |
| تاريخ الإصدار | يونيو 2026 |
ما هو MiniMax M3؟
MiniMax M3 هو نموذج ذكاء اصطناعي على مستوى الحدود مصمم حول ثلاث قدرات كانت تاريخياً مقصورة على الأنظمة مغلقة المصدر: أداء برمجي متقدم، معالجة سياق بمليون رمز، وفهم متعدد الوسائط أصيل. وعلى عكس النماذج التي تضيف قدرات الرؤية كامتداد لاحق، خضع M3 للتدريب كنموذج متعدد الوسائط منذ البداية، ما يتيح مواءمة أعمق بين الاستدلال البصري والنصي.
يستند النموذج إلى MiniMax Sparse Attention (MSA)، وهي بنية انتباه متناثر صُممت لجعل سياقات بملايين الرموز عملية حسابياً مع الحفاظ على الأداء في مهام البرمجة والاستدلال والمهام القائمة على الوكلاء.
الميزات الرئيسية لـ MiniMax M3
- نافذة سياق بسعة 1M من الرموز: تدعم المستودعات الضخمة، ومجاميع الأبحاث المطوّلة، وتحليل متعدد المستندات، وجلسات الوكلاء طويلة الأمد.
- بنية موجهة نحو الوكلاء: مصممة لتفكيك المهام ذاتياً، واستدعاء الأدوات، والتخطيط التكراري، والتنفيذ متعدد الخطوات.
- متعدد الوسائط أصيل: يعالج النصوص والصور والمخططات ولقطات الشاشة ومدخلات الفيديو دون الاعتماد على طبقة رؤية منفصلة.
- قدرات برمجة متقدمة: أداء قوي على معايير هندسة البرمجيات بما في ذلك SWE-Bench Pro وTerminal-Bench وKernelBench.
- تنفيذ طويل الأفق: برهن على سير عمل ذاتي لعدة ساعات يشمل إعادة إنتاج الأبحاث ومشاريع تحسين CUDA.
- استدلال قابل للتهيئة: يمكن تمكين وضع التفكير للأعباء الاستدلالية الأعمق أو تعطيله لتفاعلات أقل زمناً.
أداء MiniMax M3 على المعايير
تفيد MiniMax بنتائج على مستوى الحدود عبر مهام البرمجة والتنفيذ القائم على الوكلاء والتقييمات متعددة الوسائط. تشمل النتائج المعلنة:
| المعيار | النتيجة |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal-Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BrowseComp | 83.5 |
| PostTrainBench | 37.1 |
كما تفيد الشركة بأن M3 يتفوق على GPT-5.5 وGemini 3.1 Pro في عدة معايير موجهة للبرمجة بينما يقترب من أداء Claude Opus 4.7 في تقييمات مختارة. تعود هذه الادعاءات إلى إفصاحات MiniMax الداخلية حول المعايير وينبغي تفسيرها إلى جانب اختبارات مستقلة من أطراف ثالثة حالما تصبح متاحة.
بنية السياق الطويل وMSA
MiniMax Sparse Attention (MSA) هي الابتكار البنيوي وراء قدرة M3 على التعامل مع سياقات بمليون رمز. وبدلاً من تطبيق انتباه تربيعي كامل عبر التسلسل بأكمله، تنفذ MSA توجيهاً على مستوى الكتل وانتباهًا متناثراً عبر مناطق مختارة من السياق.
بحسب MiniMax، فإن ذلك يقلل متطلبات الحوسبة بشكل ملحوظ عند أطوال السياق الكبيرة ويقدّم:
- أكثر من 9× أداء ملء مسبق أسرع عند طول سياق 1M
- أكثر من 15× أداء فك تشفير أسرع
- نحو 1/20 من حساب كل رمز مقارنة بالجيل السابق عند مقياس سياق 1M
تهدف هذه التحسينات إلى جعل البرمجة على مستوى المستودعات وسير عمل الوكلاء طويل الأفق عملية.
MiniMax M3 مقابل Claude Opus 4.7 مقابل Gemini 3.1 Pro
| القدرة | MiniMax M3 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| نافذة السياق | حتى 1M | طبقات سياق متاحة علناً أصغر حجماً | متعدد الوسائط بسياق كبير |
| تدريب متعدد الوسائط أصيل | نعم | نعم | نعم |
| تركيز على الترميز القائم على الوكلاء | قوي جداً | قوي جداً | قوي |
| SWE-Bench Pro | 59.0% | أعلى بحسب تقارير MiniMax | أدنى بحسب تقارير MiniMax |
| توافر الأوزان المفتوحة | مُخطط له | لا | لا |
| سير عمل الوكلاء طويل الأفق | محور تصميم رئيسي | قوي | قوي |
القيود المعروفة
- معظم الإفصاحات عن نتائج المعايير تأتي حالياً من MiniMax وليس من مختبرات تقييم مستقلة.
- تم الإعلان عن ملفات النموذج ذات الأوزان المفتوحة والتقرير التقني الكامل لكن لم تُطرح على نطاق واسع عند الإطلاق.
- لا تزال الموثوقية الواقعية عبر بيئات الإنتاج قيد التحقق من قبل مجتمع المطوّرين.
- قد تنطوي أعباء العمل بسياق مليون رمز على تكاليف تشغيل وكمون أعلى مقارنة بأعباء الاستدلال القياسية.
حالات استخدام تمثيلية
هندسة برمجيات على مستوى المستودعات
تحليل قواعد شيفرة ضخمة، إجراء إعادة هيكلة متعددة الملفات، توليد ترقيعات، مراجعة طلبات السحب، والحفاظ على سياق تطوير طويل الأمد.
وكلاء بحث مستقلون
دعم مراجعة الأدبيات، توليف المستندات، تحليل المعايير، وسير عمل بحثي طويل يتطلب مئات الآلاف من الرموز.
تحليل تقني متعدد الوسائط
تفسير لقطات الشاشة، مخططات البنية، الرسوم البيانية، المستندات التقنية، ومحتوى الفيديو ضمن سير استدلال واحد.
أتمتة سطر الأوامر وDevOps
تنفيذ سير عمل هندسي معقد يشمل الاختبار، تنسيق النشر، إدارة التبعيات، وتصحيح الأخطاء التكراري.
أنظمة معرفة مؤسسية
البحث والاستدلال عبر مجموعات كبيرة من السياسات والعقود والوثائق التقنية ومستودعات المعرفة الداخلية.
إصدار النموذج والتوافر
تم تقديم MiniMax M3 رسمياً في يونيو 2026 بوصفه الخليفة الرئيسي ضمن تشكيلة نماذج MiniMax. النموذج متاح عبر النظام البيئي لـ MiniMax API وCometAPI.