في مؤتمر جوجل للمُطورين (Google I/O 2025)، الذي عُقد في ماونتن فيو، كاليفورنيا، كشف فريقا جوجل ديب مايند وجوجل للذكاء الاصطناعي عن تحسينات كبيرة على سلسلة نماذج جيميني 2.5 واسعة النطاق. تغطي هذه التحديثات كلا من الجوزاء 2.5 برو و الجوزاء 2.5 فلاش تُقدّم هذه التحسينات إمكانيات تفكير متقدمة، ومخرجات صوتية أصلية، ودعمًا متعدد اللغات، وضمانات أمنية، وزيادات كبيرة في الكفاءة. تهدف هذه التحسينات مجتمعةً إلى تمكين المطورين والشركات والمستخدمين النهائيين من خدمات ذكاء اصطناعي أكثر موثوقيةً وطبيعيةً وفعاليةً من حيث التكلفة عبر Google AI Studio وواجهة برمجة تطبيقات Gemini وVertex AI.
تحسينات Gemini 2.5 Pro
التفكير العميق: تعزيز التفكير متعدد الفرضيات
الميزة الرئيسية لـ 2.5 Pro هي التفكير العميق، وهو نمط استدلال تجريبي يسمح للنموذج بتوليد مسارات حلول متعددة داخليًا ومقارنتها وتحسينها قبل إنتاج ناتجه النهائي. تُظهر المعايير الأولية براعة Deep Think: فهو يتصدر اختبار الرياضيات USAMO لعام 2025، ويتصدر LiveCodeBench في البرمجة على مستوى المنافسة، ويحقق نسبة 84.0% في اختبار الاستدلال متعدد الوسائط MMMU.
ابتداءً من هذا الشهر، أصبح Deep Think متاحًا للمختبرين الموثوق بهم عبر واجهة برمجة تطبيقات Gemini. وقد صرّحت جوجل بأنها تحتاج إلى مزيد من الوقت لإجراء تقييمات أمنية قبل إتاحة Deep Think على نطاق أوسع.

الصوت الأصلي والحوار متعدد اللغات
بناءً على إمكانيات النص الخاصة به، يدعم Gemini 2.5 Pro الآن مخرجات الصوت الأصلية متوفر بـ ٢٤ لغة. توفر هذه الميزة إيقاعًا صوتيًا واعيًا بالسياق ونبرة عاطفية، مما يجعل تفاعلات الذكاء الاصطناعي أكثر إنسانية. إلى جانب الصوت، يُكيّف نظام الحوار في النموذج النبرة ديناميكيًا، مما يُعزز التعاطف في تطبيقات خدمة العملاء والتعليم. تضمنت العروض التوضيحية المبكرة محادثات صوتية فورية بتركيز دقيق وشرحًا تفصيليًا للرموز بلغات متعددة، مما يُبرز توجه جوجل نحو الذكاء الاصطناعي الحواري الحقيقي.
الأمن والجدارة بالثقة
تُركز التحسينات الأمنية في الإصدار 2.5 Pro على الحد من هجمات الحقن الفوري غير المباشر. يعتمد الإطار المُحدّث على تعقيم مُحسّن للمُدخلات وتصفية ديناميكية للسياق، وهو أمرٌ أساسي للقطاعات الخاضعة للتنظيم والتي تتعامل مع البيانات الحساسة. ووفقًا لمدونة مُطوّري جوجل، تُقلل هذه الضمانات من الثغرات الأمنية بنسبة تصل إلى 40% في تقييمات الفريق الأحمر الداخلية، مما يُمهّد الطريق لاعتمادها على نطاق أوسع في المؤسسات.
تحسينات فلاش Gemini 2.5
الكفاءة والسرعة
تم تجديد Gemini 2.5 Flash، وهو الشقيق المحسن للزمن لـ 2.5 Pro، من أجل كفاءة حسابية أكبر بنسبة 22% وأوقات استجابة أسرع. خلال الكلمة الرئيسية، أشار ديميس هاسابيس إلى أن فلاش الآن "يُحسّن أداءه في جميع الجوانب تقريبًا" مقارنةً بسابقه، مع توفر نسخة تجريبية للمطورين في Google AI Studio وVertex AI وتطبيق Gemini للجوال. ومن المقرر إطلاقه رسميًا في أوائل يونيو 2025. أحدث إصدار من فلاش Gemini 2.5 متوفر حاليًا. gemini-2.5-flash-preview-05-20 في مؤتمر Google I/O 2025.
قدرات متعددة الوسائط موسعة
يتشارك كلا إصداري Flash وPro قدرات جديدة في التفكير متعدد الوسائط، مما يسمح للمستخدمين بالتفاعل مع النصوص والصور والصوت وحتى الفيديو. ومن أبرز حالات الاستخدام التي عُرضت في مؤتمر I/O، التصورات الكسورية المُولّدة من مُوجّه واحد، وخطوط أنابيب "تحويل الفيديو إلى تطبيق تعليمي" التي تُحوّل مقاطع الفيديو التعليمية إلى تجارب تعليمية تفاعلية.
تحديثات النظام البيئي للمطورين
تكامل Google AI Studio
يُتيح Google AI Studio الآن وصولاً سلسًا إلى كلٍّ من Gemini 2.5 Pro وFlash. يُضمّن مُحرّر الأكواد الأصلي النماذج مباشرةً، مما يُمكّن المطورين من إنشاء تطبيقات ويب جاهزة للإنتاج من خلال توجيهات بسيطة. تُبرز قوالب البدء المهام، بدءًا من الوكلاء التفاعليين مع الصوت، وصولًا إلى لوحات معلومات تحليل البيانات في الوقت الفعلي، مما يُقلّل دورات النماذج الأولية من أسابيع إلى دقائق.
تطورات واجهة برمجة تطبيقات Gemini
(أراضي البوديساتفا) الجوزاء API لقد تلقيت عدة تحديثات:
- استدعاء الوظائف المبسط:تعمل تعريفات المخططات المبسطة على تقليل جهد التكامل بنسبة 30%.
- التفكير في ضوابط الميزانية:يستطيع المطورون الآن ضبط عمق التفكير لتحقيق التوازن بين التكلفة والأداء.
- سير العمل الوكيل:تدعم نقاط النهاية الجديدة تنسيق الوكيل متعدد الخطوات عبر مشروع مارينر، مما يتيح للذكاء الاصطناعي القيام بشكل مستقل بما يصل إلى 10 مهام مرتبطة (على سبيل المثال، استرجاع البيانات، والتلخيص، وإنشاء التقارير) بمكالمة واحدة.
التوفر العام لخدمة Gemini Code Assist
برج الجوزاء 2.5 قوة مساعدة كود الجوزاء للأفراد وتكاملات GitHub، وهي متاحة الآن بشكل عام بنسختين مجانية ومدفوعة. تتميز هذه الأداة بتحويل الكود، وإنشاء واجهات المستخدم، وإعادة الهيكلة الآلية، مما يلبي احتياجات كل من المبرمجين المبتدئين والمهندسين المتمرسين.
التوفر والتسعير
(أراضي البوديساتفا) سلسلة جيميني 2.5 يمكن لجميع عملاء Google Cloud الوصول إليها عبر Vertex AI، مع تحديد مستويات الأداء حسب مستوى الاشتراك:
- منظمة العفو الدولية برو يمنح (19.99 دولارًا أمريكيًا/الشهر) إمكانية الوصول إلى ميزات Gemini 2.5 Flash وميزات 2.5 Pro القياسية.
- الذكاء الاصطناعي فائق يتيح لك (249.99 دولارًا أمريكيًا/الشهر) فتح Deep Think، والإنتاجية ذات الأولوية، ومجموعة كاملة من الإمكانات المتعددة الوسائط والوكيلة، بالإضافة إلى الخدمات المجمعة مثل تخزين سحابي بسعة 30 تيرابايت وYouTube Premium.
الخلاصة والتوقعات
مع آخر تحديثات Gemini 2.5 Pro وFlash، تُرسي جوجل معيارًا جديدًا في استدلال الذكاء الاصطناعي والتفاعلية وإنتاجية المطورين. يُمهد تقييم Deep Think متعدد الفرضيات، إلى جانب الصوت الأصلي والتطورات الأمنية ومكاسب الكفاءة، الطريق لأنظمة ذكاء اصطناعي أكثر ذكاءً وموثوقية وسهولة في الوصول. مع طرح هذه النماذج في يونيو، سيُسرّع دمجها عبر Google AI Studio وواجهة برمجة تطبيقات Gemini وVertex AI الابتكار - من مساعدي برمجة أكثر ذكاءً إلى أدوات تعليمية غامرة - مما يُعيد صياغة كيفية تسخير الأفراد والمؤسسات للذكاء الاصطناعي.
كيف تبدأ
يوفر CometAPI واجهة REST موحدة تجمع مئات نماذج الذكاء الاصطناعي، بما في ذلك عائلة Gemini، ضمن نقطة نهاية موحدة، مع إدارة مدمجة لمفاتيح واجهة برمجة التطبيقات، وحصص الاستخدام، ولوحات معلومات الفواتير. بدلاً من إدارة عناوين URL وبيانات اعتماد متعددة للموردين.
يمكن للمطورين الوصول واجهة برمجة تطبيقات Gemini 2.5 Flash Pre (نموذج:gemini-2.5-flash-preview-05-20) و واجهة برمجة تطبيقات Gemini 2.5 Pro (نموذج:gemini-2.5-pro-preview-05-06)إلخ من خلال كوميت ايه بي اي. للبدء، استكشف قدرات النموذج في ساحة اللعب واستشر دليل واجهة برمجة التطبيقات للحصول على تعليمات مفصلة. قبل الدخول، يُرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API.
