تم تصميم Gemini 2.5 Flash لتقديم استجابات سريعة دون المساس بجودة المخرجات. ويدعم إدخالات متعددة الوسائط، بما في ذلك النصوص والصور والصوت والفيديو، مما يجعله مناسبًا لتطبيقات متنوعة. ويتاح النموذج عبر منصات مثل Google AI Studio وVertex AI، موفرًا للمطورين الأدوات اللازمة للتكامل السلس مع أنظمة مختلفة.
المعلومات الأساسية (الميزات)
يقدّم Gemini 2.5 Flash عدة ميزات بارزة تميّزه ضمن عائلة Gemini 2.5:
- الاستدلال الهجين: يمكن للمطورين ضبط معامل thinking_budget للتحكم بدقة في عدد الرموز التي يخصّصها النموذج للاستدلال الداخلي قبل الإخراج.
- حد باريتو: متموضع عند نقطة التكلفة-الأداء المُثلى، يوفّر Flash أفضل نسبة سعر إلى ذكاء بين نماذج 2.5.
- دعم متعدد الوسائط: يعالج النص والصور والفيديو والصوت أصلاً، ما يتيح قدرات حوارية وتحليلية أغنى.
- سياق بمليون رمز: طول السياق غير المسبوق يتيح تحليلاً عميقًا وفهمًا لوثائق طويلة ضمن طلب واحد.
إصدارات النموذج
انتقل Gemini 2.5 Flash عبر الإصدارات الرئيسية التالية:
- gemini-2.5-flash-lite-preview-09-2025: تحسين قابلية استخدام الأدوات: أداء أفضل في المهام المعقدة متعددة الخطوات، مع زيادة 5% في درجات SWE-Bench Verified (من 48.9% إلى 54%). كفاءة محسّنة: عند تمكين الاستدلال، يتحقق إخراج أعلى جودة بعدد رموز أقل، مما يقلل زمن التأخير والتكاليف.
- Preview 04-17: إصدار وصول مبكر بقدرة “thinking”، متاح عبر gemini-2.5-flash-preview-04-17.
- Stable General Availability (GA): اعتبارًا من 17 يونيو 2025، يحل الطرف النهائي المستقر gemini-2.5-flash محل الإصدار التجريبي، مع ضمان موثوقية على مستوى الإنتاج دون أي تغييرات في واجهة البرمجة مقارنة بإصدار 20 مايو.
- إيقاف الإصدار التجريبي: كان من المقرر إيقاف نقاط نهاية الإصدار التجريبي في 15 يوليو 2025؛ يجب على المستخدمين الترقية إلى نقطة النهاية المتاحة بشكل عام قبل هذا التاريخ.
اعتبارًا من يوليو 2025، أصبح Gemini 2.5 Flash متاحًا الآن للعامة وبشكل مستقر (دون تغييرات مقارنة بـ gemini-2.5-flash-preview-05-20). إذا كنت تستخدم gemini-2.5-flash-preview-04-17، فستستمر تسعيرة الإصدار التجريبي الحالية حتى موعد إيقاف نقطة نهاية النموذج في 15 يوليو 2025، وعندها سيتم إيقافها. يمكنك الترحيل إلى النموذج المتاح عمومًا "gemini-2.5-flash".
أسرع، أرخص، أذكى:
- أهداف التصميم: زمن تأخير منخفض + إنتاجية عالية + تكلفة منخفضة؛
- تسريع عام في الاستدلال، ومعالجة الوسائط المتعددة، ومهام النصوص الطويلة؛
- انخفض استهلاك الرموز بنسبة 20–30%، ما يقلّل بشكل ملحوظ تكاليف الاستدلال.
المواصفات التقنية
نافذة سياق الإدخال: حتى 1 مليون رمز، مما يتيح احتفاظًا واسعًا بالسياق.
رموز المخرجات: قادرة على توليد ما يصل إلى 8,192 رمزًا لكل استجابة.
الأنماط المدعومة: نصوص وصور وصوت وفيديو.
منصات التكامل: متاحة عبر Google AI Studio وVertex AI.
التسعير: نموذج تسعير تنافسي قائم على الرموز، يسهّل النشر منخفض التكلفة.
التفاصيل التقنية
في الجوهر، يُعد Gemini 2.5 Flash نموذج لغة كبيرًا قائمًا على المحوّل، مُدرَّبًا على مزيج من بيانات الويب والشيفرة والصور والفيديو. تشمل المواصفات التقنية الأساسية ما يلي:
التدريب متعدد الوسائط: مُدرَّب على مواءمة أنماط متعددة، ما يمكّن Flash من مزج النص بسلاسة مع الصور أو الفيديو أو الصوت، وهو مفيد لمهام مثل تلخيص الفيديو أو توليد تسميات توضيحية للصوت.
عملية تفكير ديناميكية: يطبق حلقة استدلال داخلية يقوم فيها النموذج بالتخطيط وتفكيك المطالبات المعقدة قبل الإخراج النهائي.
ميزانيات تفكير قابلة للتهيئة: يمكن ضبط thinking_budget من 0 (دون استدلال) وحتى 24,576 رمزًا، ما يتيح الموازنة بين زمن التأخير وجودة الإجابة.
تكامل الأدوات: يدعم Grounding with Google Search وCode Execution وURL Context وFunction Calling، مما يتيح إجراءات واقعية مباشرةً من أوامر اللغة الطبيعية.
أداء الاختبارات المعيارية
في تقييمات صارمة، يُظهر Gemini 2.5 Flash أداءً رائدًا على مستوى الصناعة:
- LMArena Hard Prompts: حقق نتيجة ثانية بعد 2.5 Pro فقط على معيار Hard Prompts الصعب، ما يبرز قدراته القوية في الاستدلال متعدد الخطوات.
- درجة MMLU قدرها 0.809: تتجاوز أداء النماذج المتوسط بدقة MMLU تبلغ 0.809، ما يعكس سعة معارفه وقدراته الاستدلالية.
- زمن التأخير ومعدل النقل: يحقق سرعة فك ترميز قدرها 271.4 tokens/sec مع 0.29 s Time-to-First-Token، ما يجعله مثاليًا للأعباء الحساسة لزمن التأخير.
- الريادة في السعر مقابل الأداء: عند \$0.26/1 M tokens، يتفوّق Flash على كثير من المنافسين من حيث الكلفة مع مجاراتهم أو التفوق عليهم في معايير رئيسية.
تشير هذه النتائج إلى ميزة Gemini 2.5 Flash التنافسية في الاستدلال، والفهم العلمي، وحل المسائل الرياضية، والبرمجة، والتفسير البصري، والقدرات متعددة اللغات:
القيود
- مخاطر السلامة: قد يُظهر النموذج نبرة “وعظية”، وقد ينتج مخرجات تبدو معقولة لكنها غير صحيحة أو متحيّزة (هلوسات)، لا سيما في الاستفسارات الحدّية. وتظلّ المراجعة البشرية الدقيقة ضرورية.
- قيود المعدّل: يخضع استخدام واجهة البرمجة لقيود معدل (10 RPM و250,000 TPM و250 RPD في الشرائح الافتراضية)، ما قد يؤثر في المعالجة الدفعية أو التطبيقات كبيرة الحجم.
- حد أدنى للذكاء: رغم قدراته الاستثنائية كنموذج Flash، يظل أقل دقة من 2.5 Pro في أكثر المهام الوكيلية تطلبًا مثل البرمجة المتقدمة أو تنسيق الوكلاء المتعددين.
- مفاضلات التكلفة: رغم تقديمه لأفضل سعر مقابل أداء، فإن الاستخدام الموسّع لوضع التفكير يزيد إجمالي استهلاك الرموز، ما يرفع التكاليف للمطالبات التي تتطلب استدلالًا عميقًا.




