النماذج
مدخل:$0.4/M
الإخراج:$2.4/M
نظرة عامة على القدرات الأساسية: الدقة: حتى 4K (4096×4096)، على قدم المساواة مع Pro. اتساق الصور المرجعية: حتى 14 صورة مرجعية (10 عناصر + 4 شخصيات)، مع الحفاظ على اتساق الأسلوب/الشخصيات. نسب أبعاد قصوى: تمت إضافة نسب جديدة 1:4، 4:1، 1:8، 8:1، مناسبة للصور الطويلة والملصقات واللافتات. عرض النصوص: توليد نص متقدم، مناسب للرسوم المعلوماتية وتخطيطات الملصقات التسويقية. تعزيز البحث: تكامل Google Search + Image Search. الاستدلال: عملية تفكير مدمجة؛ تُعالَج المطالبات المعقدة بالاستدلال قبل التوليد.Claude Opus 4.6 هو نموذج لغة كبير من فئة “Opus” تابع لـ Anthropic، صدر في فبراير 2026. ويُطرح كأداة عمل أساسية لأعمال المعرفة وسير عمل البحث — مع تحسين الاستدلال ضمن سياقات طويلة، والتخطيط متعدد الخطوات، واستخدام الأدوات (بما في ذلك أطر عمل برمجية قائمة على الوكلاء)، ومهام استخدام الحاسوب مثل إنشاء الشرائح وجداول البيانات تلقائيًا. Claude Sonnet 4.6 هو أكثر نماذج Sonnet لدينا كفاءةً حتى الآن. إنه ترقية شاملة لقدرات النموذج في مجالات البرمجة، واستخدام الحاسوب، والاستدلال بسياقات طويلة، وتخطيط الوكلاء، والعمل المعرفي، والتصميم. كما يتميز Sonnet 4.6 بنافذة سياق بسعة 1M رمز في الإصدار التجريبي. سياق:400,000
GPT-5.4 nano مصمم للمهام التي تكتسب فيها السرعة والتكلفة أهمية قصوى، مثل التصنيف، واستخراج البيانات، والترتيب، والوكلاء الفرعيين.سياق:400,000
مدخل:$0.6/M
الإخراج:$3.6/M
يقدّم GPT-5.4 mini قدرات GPT-5.4 ضمن نموذج أسرع وأكثر كفاءة مصمم لأحمال عمل كبيرة الحجم.Claude Mythos Preview هو أكثر نماذجنا الحدودية قدرة حتى الآن، ويُظهر
قفزة لافتة في النتائج على العديد من معايير التقييم مقارنةً بنموذجنا الحدودي السابق، Claude Opus 4.6. مدخل:$0.8/M
الإخراج:$2.4/M
MiMo-V2-Pro هو نموذج تأسيسي رائد من Xiaomi، يضم أكثر من 1T من إجمالي المعاملات وطول سياق يبلغ 1M، ومحسّن بعمق لسيناريوهات الوكلاء. وهو قابل للتكيّف بدرجة عالية مع أطر الوكلاء العامة مثل OpenClaw. ويصنَّف ضمن الفئة العليا عالميًا في معايير PinchBench وClawBench القياسية، مع أداء مُدرَك يقترب من أداء Opus 4.6. وقد صُمِّم MiMo-V2-Pro ليكون بمثابة عقل أنظمة الوكلاء، لتنسيق سير عمل معقّدة، وقيادة مهام الهندسة الإنتاجية، وتقديم نتائج موثوقة.مدخل:$0.32/M
الإخراج:$1.6/M
MiMo-V2-Omni هو نموذج شمولي متعدد الوسائط متقدّم يعالج مدخلات الصور والفيديو والصوت بشكل أصيل ضمن بنية موحّدة. يجمع بين إدراك متعدد الوسائط قوي وقدرات وكيلية - الربط البصري، والتخطيط متعدد الخطوات، واستخدام الأدوات، وتنفيذ التعليمات البرمجية - مما يجعله مناسبًا للغاية للمهام الواقعية المعقدة التي تمتد عبر الوسائط. نافذة سياق بسعة 256K.مدخل:$0.24/M
الإخراج:$0.96/M
يقدّم MiniMax-M2.7 الذكاء رفيع المستوى نفسه كما في الإصدار القياسي — بما في ذلك التطور الذاتي التكراري وإنتاجية مكتبية بمستوى خبير — لكنه مُصمَّم للتطبيقات التي تتطلب كمونًا أقل من ثانية وتوليد الرموز عالي السرعة. بالاستفادة من بنية عمود فقري للاستدلال مُعزَّزة، فإن سرعة الإخراج لديه أعلى بنسبة 66% من النموذج القياسي (تصل إلى 100 tps). وهو الخيار المفضّل لمساعدي البرمجة التفاعليين، وتنفيذ حلقات الوكلاء في الوقت الحقيقي، وخطوط أنابيب المؤسسات عالية الإنتاجية ذات متطلبات صارمة لوقت الإكمال.سياق:200k
مدخل:$0.96/M
الإخراج:$3.264/M
GLM-5 Turbo هو نموذج جديد من Z.ai، صُمم للاستدلال السريع والأداء القوي في البيئات المعتمدة على الوكلاء مثل سيناريوهات OpenClaw.سياق:1,050,000
إصدار من GPT-5.4 يقدّم ردودًا أذكى وأكثر دقة.سياق:1,050,000
GPT-5.4 هو النموذج الطليعي للعمل المهني المعقّد. Reasoning.effort يدعم: none (default), low, medium, high و xhigh.مدخل:$1.4/M
الإخراج:$11.2/M
نموذج GPT-5.3 Instant المستخدم في ChatGPTمدخل:$0.2/M
الإخراج:$1.2/M
Gemini 3.1 Flash-Lite هو نموذج من المستوى الثالث فعّال للغاية من حيث التكلفة ومنخفض الكمون ضمن سلسلة Gemini 3 من Google، ومصمم لسير عمل ذكاء اصطناعي إنتاجي عالي الحجم حيث تكون الإنتاجية والسرعة أهم من الحد الأقصى لعمق الاستدلال. يجمع بين نافذة سياق كبيرة متعددة الوسائط وأداء استدلالي فعّال، وبتكلفة أقل من معظم النظائر الرائدة.سياق:200K
النموذج الأسرع والأكثر فعالية من حيث التكلفة.في الثانية:$0.24
Sora 2 Pro هو نموذج توليد الوسائط الأكثر تقدمًا وقوة لدينا، وقادر على توليد مقاطع فيديو بصوت متزامن. يمكنه إنشاء مقاطع فيديو مفصلة وديناميكية بالاعتماد على اللغة الطبيعية أو الصور.في الثانية:$0.08
نموذج توليد فيديو فائق القوة، مع مؤثرات صوتية، ويدعم نمط المحادثة.لكل طلب:$0.6
Midjourney video generationمدخل:$0.16/M
الإخراج:$0.96/M
بوصفه نموذج رؤية-لغة أصليًا، يتفوق QWEN3.5-397B-A17B من سلسلة Qwen3.5 في الاختبارات المعيارية الشاملة مثل الاستدلال والبرمجة وقدرات الوكلاء والفهم متعدد الوسائط، مما يساعد المطورين والمؤسسات على تحسين الإنتاجية بشكل كبير. يستخدم النموذج بنية هجينة مبتكرة تجمع بين الانتباه الخطي (Gated Delta Networks) و«خليط خبراء متناثر» (MoE) لتحقيق كفاءة ممتازة في الاستدلال: 397 مليار معلمة إجمالية ولا يُفعَّل سوى 17 مليار معلمة في كل تمرير أمامي، ما يحسّن السرعة والتكلفة مع الحفاظ على القدرات. كما وسّعنا دعمنا للغات واللهجات من 119 إلى 201، مما يوفّر إتاحة أوسع ودعمًا أفضل للمستخدمين حول العالم.سياق:2,000,000
مدخل:$1.6/M
الإخراج:$4.8/M
يقدم إصدار Grok 4.20 بنية متعددة الوكلاء (عدة وكلاء متخصصين منسقين في الوقت الفعلي)، وأوضاع السياق الموسعة، وتحسينات مركزة في اتباع التعليمات، والحد من الهلوسة، والمخرجات المهيكلة/المدعومة بالأدوات.في الثانية:$0.04
أنشئ مقاطع فيديو من موجهات نصية، حرّك الصور الثابتة، أو عدّل مقاطع الفيديو الموجودة باستخدام اللغة الطبيعية. تدعم واجهة برمجة التطبيقات (API) ضبط المدة ونسبة العرض إلى الارتفاع والدقة لمقاطع الفيديو المولدة — مع تولّي حزمة تطوير البرمجيات (SDK) الاستقصاء الدوري غير المتزامن تلقائيًا.سياق:32,000
مدخل:$3.2/M
الإخراج:$12.8/M
أفضل نموذج صوتي لإدخال الصوت وإخراج الصوت.أفضل نموذج صوتي لإدخال وإخراج الصوت مع Chat Completions. سياق:400,000
مدخل:$1.4/M
الإخراج:$11.2/M
GPT-5.3-Codex محسّن للمهام البرمجية المعتمدة على الوكلاء في Codex أو بيئات مماثلة. يدعم GPT-5.3-Codex إعدادات جهد الاستدلال low وmedium وhigh وxhigh.لكل طلب:$0.028
Seedream 5.0 Lite هو نموذج موحّد متعدد الوسائط لتوليد الصور مزوّد بقدرات التفكير العميق والبحث عبر الإنترنت، ويتميّز بترقية شاملة في قدراته على الفهم والاستدلال والتوليد.مدخل:$1.6/M
الإخراج:$9.6/M
Gemini 3.1 Pro هو الجيل التالي في سلسلة نماذج Gemini، وهي مجموعة من نماذج الاستدلال عالية القدرات ومتعددة الوسائط أصلاً. Gemini 3 Pro هو الآن أكثر نماذج Google تطورًا للمهام المعقدة، وهو قادر على استيعاب مجموعات بيانات ضخمة والتعامل مع مشكلات صعبة من مصادر معلومات مختلفة، بما في ذلك النصوص والصوت والصور والفيديو ومستودعات تعليمات برمجية كاملة.مدخل:$0.32/M
الإخراج:$1.92/M
نماذج Plus من سلسلة Qwen3.5 الأصلية للرؤية واللغة مبنية على بنية هجينة تدمج آليات الانتباه الخطية مع نماذج مزيج الخبراء المتناثرة، ما يحقق كفاءة أعلى في الاستدلال.مدخل:$0.48/M
الإخراج:$2.88/M
نموذج الرؤية-اللغة الأصلي Qwen3.5 series 397B-A17B مبني على بنية هجينة تدمج آلية انتباه خطية مع نموذج خليط الخبراء المتناثر، ما يحقق كفاءة أعلى في الاستدلال.مدخل:$0.024/M
الإخراج:$0.24/M
🔹 سلسلة Doubao Seed 2.0
doubao-seed-2-0-code-preview-260215
يركّز على قدرات الاستدلال طويلة السلسلة واستقرار المهام المعقدة، ومكيَّف لسيناريوهات معقدة في بيئات أعمال حقيقية. وبصفته النسخة المعزَّزة بالبرمجة من Seed 2.0، فهو أنسب لـ Agentic Coding.
doubao-seed-2-0-lite-260215
يوفّق بين جودة التوليد وسرعة الاستجابة، ما يجعله مناسبًا كنموذج جاهز للإنتاج للأغراض العامة.
doubao-seed-2-0-mini-260215
مصمم لسيناريوهات زمن كمون منخفض، وتزامن مرتفع، وحساسية للتكلفة. يركّز على الاستجابة السريعة ونشر الاستدلال بشكل مرن، ويدعم تفكيرًا رباعي المستويات وقدرات الفهم متعدد الوسائط.مدخل:$0.24/M
الإخراج:$0.96/M
MiniMax-M2.5 هو نموذج لغوي كبير SOTA مُصمم لتعزيز الإنتاجية في العالم الحقيقي. بعد تدريبه ضمن مجموعة متنوعة من بيئات العمل الرقمية الواقعية المعقدة، يبني M2.5 على خبرة M2.1 في البرمجة ليتوسع إلى الأعمال المكتبية العامة، ليبلغ طلاقة في إنشاء وتشغيل ملفات Word وExcel وPowerpoint، والتبديل بين السياقات عبر بيئات برمجية متنوعة، والعمل عبر فرق مختلفة من الوكلاء والبشر.