Veo 3.1 قادم: انا ارى هي عائلة نماذج جوجل لتوليد الفيديو بالذكاء الاصطناعي (Veo 3 / Veo 3 Fast هما الأحدث). أطلقت جوجل مؤخرًا تحسينات كبيرة على Veo 3 (عمودي 9:16، 1080 بكسل، Veo 3 Fast، وسعر أقل)، وهناك الشائعات / المنشورات الاجتماعية أن فيو 3.1 وشيك - لكن جوجل لديها لست لم يُنشر بعدُ نشرة رسمية لإصدار Veo 3.1. سأسرد الحقائق المؤكدة، والتغييرات المحتملة/المتوقعة، ومقارنة مباشرة مع OpenAI. سورا 2.
ابحث عن انا ارى is
انا ارى هي سلسلة نماذج الفيديو التوليدية من جوجل (DeepMind / Google Cloud / عائلة Gemini) التي تُحوّل النصوص أو الصور إلى مقاطع فيديو قصيرة، وتُولّد الصوت تلقائيًا (في Veo 3) (مؤثرات صوتية، وصوت محيطي، وحوار). وهي متوفرة على Google Cloud (Vertex AI / Gemini API) للمطورين والشركات، وتتضمن علامات مائية مدمجة للمصدر / SynthID على المخرجات.
ابحث عن فيو 3 تم جلبه بالفعل
- النص → الفيديو و الصورة → الفيديو الإمكانات (بما في ذلك معاينة الصورة إلى فيديو).
- توليد الصوت الأصلي (الموسيقى، الأصوات المحيطة، الحوار) - قدم Veo 3 صوتًا من الدرجة الأولى.
- نوعان مختلفان: Veo 3 عالي الجودة و أرى 3 سريعًا (مُحسَّن للسرعة/التكرار).
- توفر المنصة: متاح في Vertex AI / Gemini API (معاينة مدفوعة → تحديثات التوفر العام في منتصف عام 2025).
- السلامة/المنشأ: علامة مائية لـ SynthID واستخدام بعض أدوات التحكم/الموافقة على إنشاء شخص/طفل.
إذن - ما هو فيو 3.1 من المتوقع أن تجلب؟
الحالة: حتى الآن لا توجد صفحة رسمية لمنتج Veo 3.1 من Google تصف ملاحظات الإصدار الكاملة. ومع ذلك، تشير العديد من منشورات مطوري Google/منشورات المجتمع والتغريدات إلى تحديث تدريجي قريب المدى (يُسمى "Veo 3.1") من المتوقع أن يركز على التحسينات التكرارية لدعم الصوت والجودة والتنسيق بدلاً من إعادة كتابة الجيل الجديد بالكامل.
فيما يلي بعض الاستنتاجات التي توصلت إليها استنادًا إلى منشور x وخصائص Veo3:
- تحسين الصوت الأصلي (الحوار، ومزامنة الشفاه متعددة الأصوات) - حوار أكثر وضوحًا، ومزج أفضل للمؤثرات الصوتية والتوزيع المكاني. يقوم Veo 3 بالفعل بإنشاء الصوت بشكل أصلي؛ يمكن لـ Veo 3.1 تحسين واقعية الحوار ودعم اللغة لمواكبة التحسينات الأخيرة التي يقدمها المنافسون.
- مسارات أسرع/أرخص لبعض المخرجات الشائعة (مزيد من التكافؤ والتحسينات في Veo 3 Fast).
- تحسين دقة الصورة → الفيديو وتحسين تناسق الشخصيات/الوضعيات في مقاطع متعددة الإطارات.
- نسب العرض إلى الارتفاع الموسعة / عناصر التحكم في الدقة (أكثر مرونةً في إعدادات 9:16/16:9 و1080 بكسل). أضافت جوجل بالفعل دقة عمودية + 1080 بكسل؛ ويمكن لـ Veo 3.1 توسيع نطاق هذه الضوابط.
- مقاطع أطول / غطاء مريح لمدة 8 ثوانٍ — تشير طلبات المجتمع وخريطة الطريق السابقة لشركة Google إلى أن زيادة المدة هي هدف محتمل (تم تحسين Veo 3 اليوم لمقاطع مدتها 8 ثوانٍ).
- صورة أفضل → دقة الفيديو ودعم موسع للصورة إلى الفيديو (تحسينات في الواقعية، واستمرارية الحركة)، بناءً على معاينة الصورة→الفيديو في Veo 3.

قارن Veo 3 / (متوقع) Veo 3.1 → OpenAI Sora 2
التركيز الأساسي
- فيو 3 (جوجل): مقاطع فيديو قصيرة عالية الدقة مدتها 8 ثوانٍ من النصوص/الصور؛ صوت أصلي؛ مدمجة في واجهة برمجة تطبيقات Gemini/Gemini وVertex AI؛ مُحسّنة للاستخدام في الإنتاج وتكامل واجهة برمجة التطبيقات للمطورين.
- سورا 2 (أوبن إيه آي):نموذج الفيديو والصوت الرائد من OpenAI يركز على الواقعية المادية والحركة المتماسكة والحوار والصوت المتزامن، بالإضافة إلى تطبيق اجتماعي مصاحب (Sora) مع نظام موافقة/ظهور قصير لدمج صور المستخدمين ويركز بشكل كبير على الواقعية وضوابط السلامة.
نقاط القوة
- فيو (الآن): تكامل قوي بين المطورين والشركات (Vertex AI وGemini API)، خيارات تسعير إنتاجية، مسار واضح لعملاء السحابة، دقة عمودية/1080 بكسل + إصدار سريع. مثالي للشركات التي تُطوّر خطوط إنتاجها.
- سورا 2دقة فيزيائية رائعة ومزامنة متعددة الوسائط (حوار + مرئيات)، وتطبيق موجه للمستهلكين مدمج مع سير عمل اجتماعي (ميزة الظهور القصير، والتعديل). مثالي للمبدعين الذين يبحثون عن مشاهد سردية واقعية وبيئة تطبيقات متكاملة.
كيفية الوصول إلى Veo الآن - وكيفية الاستعداد لإصدار Veo 3.1
- جرب في الجوزاء (المستهلك / الويب / الهاتف المحمول): يتوفر إنشاء Veo في تطبيقات Gemini (انقر على خيار "الفيديو" في شريط الإشعارات). يؤثر مستوى الوصول (Pro / Ultra) على إصدارات Veo التي يمكنك استخدامها.
- برمجيًا / مؤسسيًا: استعمال API in كوميت ايه بي اي (معرفات نماذج Veo متوفرة في مستندات النماذج). يوفر CometAPI نماذج veo3-pro وveo3-fast وveo3. لمزيد من التفاصيل، يُرجى مراجعة فيو 3 الصورة الوثيقة.
نصيحة عملية (المطور): لطلب الإخراج الرأسي، اضبط aspectRatio المعلمة (على سبيل المثال "9:16") وتحقق من تكوين النموذج (Veo 3 مقابل Veo 3 Fast) وخطتك لحدود الدقة (720 بكسل مقابل 1080 بكسل).
كيفية الوصول إلى Sora 2 (اليوم)
تطبيق سورا: تم إطلاق Sora 2 مع تطبيق Sora (طرح محدود بدعوة في الولايات المتحدة وكندا عند الإطلاق). أشارت OpenAI لاحقًا إلى إمكانية وصول أوسع وتوسيع واجهة برمجة التطبيقات. إذا كنت ترغب في تجربة Sora 2 الآن، فراجع CpmetAPI. سورا 2 صفحة. CometAPI تدعم بالفعل واجهة برمجة تطبيقات sora 2، وتولد مقاطع فيديو اجتماعية مدتها حوالي 10 ثوانٍ مع التركيز على الواقعية الحركية للأشخاص.
كيف تبدأ
CometAPI هي منصة واجهات برمجة تطبيقات موحدة تجمع أكثر من 500 نموذج ذكاء اصطناعي من أبرز المزودين، مثل سلسلة GPT من OpenAI، وGemini من Google، وClaude من Anthropic، وMidjourney، وSuno، وغيرهم، في واجهة واحدة سهلة الاستخدام للمطورين. من خلال توفير مصادقة متسقة، وتنسيق الطلبات، ومعالجة الردود، تُبسط CometAPI بشكل كبير دمج قدرات الذكاء الاصطناعي في تطبيقاتك. سواء كنت تُنشئ روبوتات دردشة، أو مُولّدات صور، أو مُلحّنين موسيقيين، أو خطوط أنابيب تحليلات قائمة على البيانات، تُمكّنك CometAPI من التكرار بشكل أسرع، والتحكم في التكاليف، والاعتماد على مورد واحد فقط، كل ذلك مع الاستفادة من أحدث التطورات في منظومة الذكاء الاصطناعي.
يمكن للمطورين الوصول واجهة برمجة تطبيقات Veo 3.1 من خلال CometAPI، أحدث إصدار للنموذج يتم تحديثه دائمًا بالموقع الرسمي. للبدء، استكشف إمكانيات النموذج في ملعب واستشر دليل واجهة برمجة التطبيقات للحصول على تعليمات مفصلة. قبل الدخول، يُرجى التأكد من تسجيل الدخول إلى CometAPI والحصول على مفتاح API. كوميت ايه بي اي عرض سعر أقل بكثير من السعر الرسمي لمساعدتك على التكامل.
هل أنت مستعد للذهاب؟→ سجل في CometAPI اليوم !
