Gemini 2.5 Pro I/O: شرح تفصيلي للوظيفة

CometAPI
AnnaMay 8, 2025
Gemini 2.5 Pro I/O: شرح تفصيلي للوظيفة

يُمثل إصدار Gemini 2.5 Pro I/O تحديثًا بارزًا لنموذج الذكاء الاصطناعي الرائد من Google DeepMind، مُقدمًا براعة برمجة لا مثيل لها، وقدرات إدخال/إخراج مُوسّعة، وسير عمل مُحسّن للمطورين. أُصدر هذا الإصدار التجريبي مُبكرًا قبل مؤتمر Google I/O 2025، وهو يُحسّن تطوير الواجهة الأمامية وواجهات المستخدم من خلال احتلاله المركز الأول في قائمة مُتصدري WebDev Arena، ويُحقق فهمًا مُتطورًا للفيديو، ويُقدم تحسينات قوية في استدعاء الدوال وتقليل الأخطاء. يُباع هذا الإصدار بنفس سعر سابقه - 1.25 دولار أمريكي لكل مليون رمز مُدخل و10 دولارات أمريكية لكل مليون رمز مُخرج - ويُقدم حلاً فعالاً من حيث التكلفة مُقارنةً بالمنافسين مع الحفاظ على نافذة سياق سخية تضم 200,000 رمز. تُبسط وظائف الإدخال/الإخراج مُتعددة الوسائط، مثل "تحويل الفيديو إلى رمز" وإنشاء التطبيقات بمُوجه واحد، عملية إنشاء النماذج الأولية، كما تُؤكد توصيات رواد الصناعة على قيمته العملية. وفي المستقبل، تخطط Google لتوسيع قدرات السياق ودمج ميزات الإدخال/الإخراج المتقدمة، مما يعزز مكانة Gemini كأداة لا غنى عنها لتحديات الترميز في العالم الحقيقي.

ما هو Gemini 2.5 Pro I/O Edition؟

التسلسل الزمني للنشأة والإصدار

أُعلن عن إصدار Gemini 2.5 Pro I/O في 6 مايو 2025، كمعاينة أولية مُصممة لمنح المطورين بدايةً مُبكرة قبل مؤتمر Google I/O للمطورين الذي سيُعقد لاحقًا في ذلك الشهر. يستبدل هذا الإصدار إصدار 25 مارس (03-25) بإصدار مُحدث يحمل اسم "05-06"، يُوجه مستخدمي Gemini 2.5 Pro الحاليين تلقائيًا إلى الإصدار الجديد دون الحاجة إلى أي إجراء.

ما الذي يميز إصدار I/O؟

بخلاف التحديثات القياسية التي تُركز على تحسينات الواجهة الخلفية، يُركز إصدار الإدخال/الإخراج على قدرات ترميز أقوى بشكل ملحوظ في كلٍّ من تحويلات الواجهة الأمامية والتحويلات الأساسية. ويُقدم وظائف إدخال/إخراج مُحسّنة ومتعددة الوسائط - مثل فهم الفيديو وإنشاء التطبيقات التفاعلية - مما يُوسّع نطاق فائدة النموذج ليتجاوز النص والترميز إلى مجالات وسائط أكثر ثراءً.

ما هي التحسينات الرئيسية في Gemini 2.5 Pro؟

كيف تم رفع أداء الترميز؟

يُقدم إصدار Gemini 2.5 Pro الآن إمكانيات مُحسّنة بشكل ملحوظ لإنشاء الأكواد البرمجية وإعادة هيكلتها، مُعالجًا مهام إعادة هيكلة الواجهة الخلفية المُعقدة بخيارات تجريد وهندسة معمارية مُخصصة للمطورين الكبار. في معايير Cognition الداخلية، اجتاز الإصدار حالات اختبار مُتقدمة للمطورين لأول مرة، مُظهرًا إعادة تصميم قوية للوحدات، وإعادة كتابة واجهات برمجة التطبيقات، وتنفيذًا منطقيًا متعدد الخطوات دون الحاجة إلى ضبط دقيق إضافي.

علاوةً على ذلك، تم تحسين موثوقية استدعاء الوظائف: انخفضت معدلات الأخطاء بشكل ملحوظ بينما ارتفعت معدلات التشغيل، مما يتيح بناءً أكثر سلاسةً لسير عمل الوكيل الذي يربط استدعاءات وظائف متعددة. سيجد المطورون الحاليون الذين يستخدمون واجهة برمجة تطبيقات جيميني انتقالًا سلسًا، حيث ينتقل النظام تلقائيًا إلى النموذج المُحدّث دون الحاجة إلى أي تغييرات في الكود.

ما هي إمكانيات الواجهة الأمامية وواجهة المستخدم التي تمت إضافتها؟

في مجال تطوير الواجهة الأمامية، صعد Gemini 2.5 Pro إلى المركز الأول على لوحة صدارة WebDev Arena - تصنيف تفضيلات الإنسان لنماذج الذكاء الاصطناعي لبناء تطبيقات ويب وظيفية وجميلة من الناحية الجمالية - متجاوزًا Claude 1 Sonnet وإصدارات Gemini السابقة بأكثر من 3.7 نقطة ELO.

يستطيع النموذج تحويل نماذج التصميم تلقائيًا إلى مكونات HTML وCSS وJavaScript جاهزة للإنتاج، مع تخطيطات متجاوبة وتنسيق متناسق. يتعرف النموذج على العناصر المرئية، مثل تفاعلات الأزرار، والطباعة، والتباعد، والرسوم المتحركة، ويعيد إنتاجها بدقة لضمان اندماج وحدات واجهة المستخدم الجديدة بسلاسة مع أنظمة التصميم الحالية. على سبيل المثال، يمكن للمطورين الذين يستخدمون تطبيق Gemini 95 Starter طلب "مشغل فيديو متوافق مع التصميم"، وسيستنتج النموذج رموز تصميم المشروع ويُنتج مكونًا جاهزًا للاستخدام في غضون ثوانٍ.

كيف يقوم برنامج Gemini 2.5 Pro بدمج فهم الفيديو مع إنشاء الكود؟

يُوسّع جيميني 2.5 برو إمكانياته الأصلية متعددة الوسائط لتشمل الفيديو: فقد حقق نسبة 84.8% في معيار VideoMME الجديد، مُصنّفًا ضمن أفضل النماذج الكبيرة المتاحة لفهم الفيديو. بالاستفادة من هذه الميزة، يُمكن للمطورين توفير مقطع فيديو من يوتيوب والحصول على تطبيق تعليمي أو توضيحي تفاعلي بالكامل - مُتكامل مع محتوى مُستخرج، وشاشات واجهة مستخدم مُخصصة، ونصوص منطقية أساسية.

يوضح العرض التوضيحي لتطبيق "تحويل الفيديو إلى تطبيق تعليمي" من Google AI Studio سير العمل هذا: يتم تحميل فيديو تعليمي، وربط النقاط الرئيسية بوحدات تفاعلية، ثم يُنشأ تطبيق تعليمي متكامل دون تدخل بشري. يشير هذا التطور إلى تحول من "البرمجة المعتمدة على اللغة" إلى إنشاء "منتج معتمد على الفيديو" في مجال الذكاء الاصطناعي متعدد الوسائط.

أين وكيف يمكن للمطورين الوصول إلى Gemini 2.5 Pro؟

ما هي المنصات ونماذج التسعير المطبقة؟

إصدار Gemini 2.5 Pro I/O متوفر فورًا عبر واجهة برمجة تطبيقات Gemini في Google AI Studio وعبر Vertex AI لعملاء المؤسسات. يحتفظ الإصدار التجريبي بنفس سعر الإصدار السابق، مما يضمن عدم وجود تكلفة إضافية للمستخدمين الأوائل.

افتراضيًا، تُعاد توجيه جميع استدعاءات واجهة برمجة التطبيقات (API) الحالية التي تستهدف نقطة نهاية Gemini 2.5 تلقائيًا إلى نموذج Pro الجديد (05-06)، مما يُغني فرق التطوير عن تكاليف الترحيل. نُشرت بطاقات نموذجية مفصلة، ​​تُوثّق نتائج الاختبارات المعيارية وتغييرات الميزات، مع الإصدار الجديد لمزيد من الشفافية.

يدعم CometAPI بالفعل استدعاء واجهة برمجة تطبيقات Gemini 2.5 Pro I/O (اسم الطراز: ggemini-2.5-pro-preview-05-06).

كيف يقارن Gemini 2.5 Pro بمنافسيه؟

الجوزاء 2.5 برو

ما مدى هيمنة تصنيف WebDev Arena؟

بنتيجة 1419.95 في مسابقة أرينا، يتصدر جيميني 2.5 برو قائمة أرينا ويب ديف، متفوقًا على كلود 3.7 سونيت (1357.10) وGPT‑4.1 (1261.35) بفارق كبير. تعكس هذه القفزة تفضيل المستخدمين لمزيج جيميني من دقة التصميم، وسهولة صيانة الكود، ودقة واجهة المستخدم.

ماذا تكشف معايير الذكاء الاصطناعي الأوسع نطاقًا؟

بالإضافة إلى واجهة المستخدم، يُوسّع جيميني 2.5 برو ميزته في معايير التفكير المنطقي والبرمجة العامة. ففي منصة LMArena، وهي منصة تجمع بين اختبارات فهم الذكاء الاصطناعي وحل المشكلات، يتفوق جيميني 39 برو بفارق XNUMX نقطة على أقرب منافس له في تصنيف ELO، وفقًا لديميس هاسابيس، الرئيس التنفيذي لشركة جوجل ديب مايند.

وتستمر قدرتها المتعددة الوسائط، التي تشمل النصوص والصوت والصور والفيديو والرموز، في تمييزها في سوق حيث أصبح التفكير المتكامل بالذكاء الاصطناعي سريعًا أمرًا بالغ الأهمية.

ما هي حالات الاستخدام الواقعية التي تسلط الضوء على قدراتها؟

إنشاء نموذج أولي للتطبيق من خلال موجه واحد

من أبرز ميزات إصدار الإدخال/الإخراج قدرته على إنشاء تطبيقات ويب تفاعلية كاملة بضغطة زر واحدة. داخل تطبيق جيميني، يمكن للمستخدمين إدخال سمات تصميم أو أنماط بصرية، والحصول على شيفرة برمجية كاملة للتطبيقات العاملة، مما يُقلل بشكل كبير من دورات إنشاء النماذج الأولية.

سير العمل الوكيل والتكامل

يُشغّل النموذج المُحسّن سير عمل وكلاء مُتطورة، كما يتضح من التكامل مع وكيل Replit ووكيل الكود الخاص بـ Cursor. تُؤتمت هذه الأنابيب مهام مُعقدة، مثل إعادة هيكلة توجيه الواجهة الخلفية وتصميم مكونات واجهة المستخدم، بأقل تدخل بشري.

ما هي التعليقات التي قدمها المطورون؟

تأييدات قادة الصناعة

أشاد سيلاس ألبيرتي من شركة كوغنيشن بنضج النموذج، مشيرًا إلى قدرته على إجراء عمليات إعادة هيكلة واسعة النطاق بجودة صنع قرارات عالية المستوى. وأكدت ميشيل كاتاستا من شركة ريبليت على التوازن المتفوق بين "القدرات وزمن الاستجابة"، مشيرةً إلى ملاءمته للمهام الحساسة لزمن الاستجابة. وأكد بول كوفيرت، مُعلّم الذكاء الاصطناعي ومؤسس شركة بلو شيل، وبييترو شيرانو، الرئيس التنفيذي لشركة إيفر آرت، على نقاط قوته في إنشاء الأكواد البرمجية وواجهات المستخدم من خلال الترويج لها على وسائل التواصل الاجتماعي.

التكامل في منصات مثل Replit و Cursor

أظهرت الاختبارات الداخلية لبرنامج Cursor انخفاضًا في حالات فشل استدعاء الأدوات، وتحسنًا في الموثوقية، مما دفع الشركة إلى دمج إصدار الإدخال/الإخراج في وكيل الترميز الأساسي الخاص بها. وبالمثل، تستكشف Replit تكاملًا أعمق للمساعدة في الترميز الفوري، مستفيدةً من تحسين استدعاء الوظائف في النموذج وتعدد الوسائط في الإدخال/الإخراج.

دليل البدء السريع

يوفر CometAPI إمكانية الوصول إلى أكثر من 500 نموذج ذكاء اصطناعي، بما في ذلك نماذج مفتوحة المصدر ومتعددة الوسائط متخصصة للدردشة والصور والبرمجة وغيرها. تكمن قوته الأساسية في تبسيط عملية دمج الذكاء الاصطناعي المعقدة تقليديًا. بفضله، يمكنك الوصول إلى أدوات الذكاء الاصطناعي الرائدة مثل Claude وOpenAI وDeepseek وGemini من خلال اشتراك واحد موحد. يمكنك استخدام واجهة برمجة التطبيقات في CometAPI لإنشاء الموسيقى والأعمال الفنية، وإنشاء مقاطع الفيديو، وبناء سير عملك الخاصة.

كوميت ايه بي اي عرض سعر أقل بكثير من السعر الرسمي لمساعدتك على التكامل واجهة برمجة تطبيقات Gemini 2.5 Proستحصل على دولار واحد في حسابك بعد التسجيل وتسجيل الدخول! مرحبًا بك في CometAPI وتجربة الخدمة. CometAPI يدفع لك حسب الاستخدام.واجهة برمجة تطبيقات Gemini 2.5 Pro (اسم الموديل : gemini-2.5-pro-preview-05-06) في CometAPI يتم تنظيم التسعير على النحو التالي:

  • رموز الإدخال: 1 دولارًا أمريكيًا / مليون رمز
  • رموز الإخراج: 8 دولارًا أمريكيًا / مليون رمز

للتكامل السريع، يرجى الاطلاع على وثيقة API

SHARE THIS BLOG

اقرأ المزيد

500+ نموذج في واجهة برمجة تطبيقات واحدة

خصم يصل إلى 20%