Veo 3.1 من Google: ما هي التغييرات الجديدة في الإصدار الخاص بفيديو الذكاء الاصطناعي وكيفية استخدامه

CometAPI
AnnaOct 15, 2025
Veo 3.1 من Google: ما هي التغييرات الجديدة في الإصدار الخاص بفيديو الذكاء الاصطناعي وكيفية استخدامه

قامت Google اليوم بتوسيع مجموعة أدوات إنشاء الفيديو الخاصة بها مع فيو 3.1، وهو تحديث تدريجي ولكنه ذو أهمية كبيرة لسلسلة نماذج الفيديو Veo الخاصة بالشركة. يُمثل Veo 3.1 حلاً وسطًا بين سرعة إنشاء النماذج الأولية وسير عمل الإنتاج عالي الدقة، حيث يوفر صوتًا أغنى، ومقاطع أطول وأكثر تماسكًا، ودقة أعلى في الاستجابة، وعددًا من ميزات سير العمل المصممة لجعل الفيديو المدعوم بالذكاء الاصطناعي أكثر فائدة لرواة القصص والعلامات التجارية والمطورين. يأتي هذا الإصدار بالتزامن مع تحديثات تطبيق التحرير Flow من Google، وهو متاح كمعاينة مدفوعة الأجر على منصات Google للمطورين.

ما هو Veo 3.1؟

Veo 3.1 هو أحدث إصدار عام من عائلة نماذج الفيديو التوليدية من جوجل. يعتمد على البنية والميزات التي قُدّمت مع Veo 3، ولكنه يُركّز بشكل كبير على تكامل الصوت، وطول المقطع، واستمرارية السردفي حين أعطت الأجيال السابقة الأولوية للمقاطع القصيرة أو القابلة للتكرار أو مقاطع إثبات المفهوم (غالبًا ما تكون مدتها بضع ثوانٍ)، يدعم Veo 3.1 مقاطع فردية أطول بكثير - تعرض Google وشركاؤها مخرجات تصل إلى دقيقة واحدة لبعض أوضاع الإنتاج، ويستهدف إنتاج 1080 بكسل كخط أساس لحالات استخدام عالية الدقة. كما يُقدم النموذج ميزات مُيسّرة لصانعي الأفلام والمبدعين، مثل إمكانية توفير إطار أول وآخر لتحديد مسار الصورة، و"مكونات الفيديو" (صور مرجعية متعددة تُحرك المحتوى)، وتوسيع المشهد (إنشاء ثوانٍ إضافية من اللقطات مع الحفاظ على السياق).

يتم تقديم نكهتين تشغيليتين: النموذج الرئيسي Veo 3.1 (الذي يهدف إلى الجودة والإخلاص) و أرى 3.1 سريعًا (تداول بعض الدقة مقابل التكرار الأسرع)، مما يسمح للفرق بإنشاء نماذج أولية بسرعة ثم رفع مستوى الجودة أو إعادة تقديم إصدارات ذات جودة أعلى للمنتجات النهائية.

صُمم Veo 3.1 بشكل واضح كترقية متطورة تُعزز الصوت، وتُطيل مدة المشهد، وتُضيف إمكانيات تحرير مُفصّلة (إدراج/إزالة، تمديد المشهد، استيفاء الإطار الأول والأخير، وتوجيه الصورة المرجعية) بدلاً من إعادة صياغة البنية. مقارنةً بإصدار Veo 3 الذي صدر في وقت سابق من عام 2025، يعتمد Veo 3.1 على ثلاثة محاور عملية: (1) صوت أصلي أغنى، (2) تحكم مُتقدم في المشهد واللقطات، و(3) تحسينات في الجودة والطول.

صوت أصلي أكثر ثراءً عبر الميزات

بينما قدّم Veo 3 صوتًا متزامنًا، يُوسّع Veo 3.1 ثراءَ هذا الصوت ووعيَه بالسياق. يُولّد Veo 3.1 صوتًا متزامنًا سياقيًا (حوار، صوت محيطي، ومؤثرات) كمخرج مُدمج بدلًا من طلب عمليات تصميم صوت مُنفصلة. أضافت جوجل صراحةً الصوت المُولّد إلى الميزات التي كانت تُنتج سابقًا فيديوهات صامتة (مثل: مُكوّنات الفيديو، إطارات الفيديو، وامتداد المشهد). يُقلّل هذا التغيير من خطوات ما بعد الإنتاج ويُسهّل التكرار السريع للمُبدعين والفرق. تصف جوجل هذا بأنه "صوت أكثر ثراءً" ومزامنة شفاه مُحسّنة عند نطق الشخصيات.

التحكم المتقدم في المشهد واللقطات

يُركّز Veo 3.1 على التحكم بأسلوب الإنتاج (الصور المرجعية، وتوسيع المشهد، والتداخل بين الأول والأخير، والإدراج/الإزالة)، مما يُحسّن سير عمل صانع الأفلام. تُعدّ هذه ميزةً واضحةً في مسارات الإبداع وأتمتة المؤسسات.

يمكن للمبدعين توفير صورة أولى وأخيرة أو "مكونات" (مجموعة من الصور)، وسيعمل Veo 3.1 على توليد انتقالات متماسكة وحركات بينية تحافظ على مظهر الشخصية وتخطيط المشهد، مما يحسن الاستمرارية للمحتوى السردي أو المحتوى ذي العلامة التجارية.

تسلسل متعدد المطالبات / متعدد اللقطات وتناسق الشخصية: ميزات سير العمل الجديدة تهدف إلى الحفاظ على هوية الشخصية والاستمرارية البصرية عبر اللقطات والمطالبات المتعددة، بحيث يمكن لشخصية واحدة أو دعامة أن تستمر بشكل صحيح طوال التسلسل.

الإعدادات المسبقة السينمائية وضوابط الإضاءة: إعدادات الإضاءة والكاميرا المدمجة (العربة، الدفع، التكبير، عمق المجال، جداول البحث السينمائية) لتسريع الإنتاج وتقليل الحاجة إلى الهندسة السريعة المتقدمة.

تحسينات الجودة + الطول

يُتيح Veo 3.1 مقاطع أطول (تشير التقارير إلى ما يصل إلى 60 ثانية تقريبًا في ميزات امتداد المشهد في Flow)، بينما ركّز Veo 3 بشكل أساسي على المقاطع القصيرة عالية الدقة (ثماني ثوانٍ). قد تُقيّد واجهة Flow أو معلمات API توافر المقاطع الأطول.

صورة أفضل→دقة الفيديو - التحسينات في العرض عندما يتم منح النموذج صورًا مرجعية (الإطارات الأولى / الأخيرة، المراجع المتعددة) تؤدي إلى إنتاج هوية شخصية أكثر اتساقًا وتماسكًا للمشهد.

تتضمن المخرجات خيارين أفقيين (16:9) ورأسيين (9:16) لخدمة حالات الاستخدام الاجتماعية والبث بشكل مباشر.

السلامة والمنشأ والعلامة المائية

لقد ركّزت جوجل على ميزات السلامة والمنشأ في نماذجها التوليدية؛ ويتبع Veo 3.1 هذا التوجه. في التغطية الأولية، تُشير جوجل إلى ما يلي:

  • طرق SynthID والمصدر (حيثما كان ذلك مدعومًا) للمساعدة في تتبع الوسائط التي تم إنشاؤها بواسطة الذكاء الاصطناعي إلى النماذج/المصادر والحماية من سوء الاستخدام.
  • حواجز سياسة المحتوى في محرر التدفق وواجهة برمجة التطبيقات (تعتمد على المنطقة/الخطة)، وأدوات الاعتدال لتقليل إنشاء المحتوى الضار أو الحساس.

لا يزال يتعين على المبدعين اتباع أفضل الممارسات: وضع علامات على محتوى الذكاء الاصطناعي بوضوح عند الحاجة، ومراجعة المخرجات بحثًا عن عناصر وهمية أو حساسة، وتطبيق سير عمل المراجعة التقليدية عند النشر على نطاق واسع.

ما هي الحدود والمخاطر التي لا تزال قائمة مع Veo 3.1؟

يُعدّ Veo 3.1 تقدمًا ملموسًا، ولكنه ليس حلاً سحريًا. القيود والمخاطر الرئيسية:

  • تظل أوضاع الفشل قائمة لا تزال عيوب الإضاءة، والأخطاء الهندسية الدقيقة، وعدم المحاذاة العرضية (مثل الأيدي والأصابع والنصوص الدقيقة) تظهر في المشاهد المعقدة أو عند الحاجة إلى دقة عالية. يصف الصحفيون والمختبرون الأوائل هذه الحالات بأنها حالات طارئة مستمرة.
  • مخاوف بشأن المعلومات المضللة وإساءة الاستخدام — تثير الواقعية العالية وتركيب الصوت مخاوف واضحة بشأن التزييف العميق وإساءة استخدامه. تواصل جوجل التركيز على الضمانات (مثل تطبيق سياسة المحتوى، وعلامات المنشأ)، وقد سبق أن قدمت علامة SynthID المائية للمساعدة في تتبع الوسائط الاصطناعية، لكن هذه الأنظمة ليست بديلاً مضمونًا للحوكمة والمراجعة البشرية.
  • الأسئلة القانونية والملكية الفكرية - استخدام صور مرجعية أو صور مشابهة للشخصيات أو مواد محمية بحقوق الطبع والنشر في عملية التوليد سيؤدي إلى إثارة الاعتبارات القانونية القياسية؛ ويجب على الشركات استشارة المستشارين واحترام قواعد سياسة الاستخدام.

البدء السريع - سير عمل نموذجي (تطبيق Gemini + واجهة برمجة التطبيقات)

في تطبيق Gemini / Flow (بدون رمز):

افتح تطبيق Gemini (أو محرر Flow) وقم بتسجيل الدخول. ابحث عن خيار الفيديو أو إنشاء → فيديو.
سكاي وورك

اختر Veo 3.1 من القائمة المنسدلة للنماذج (في حال وجود نماذج متعددة). حدد نسبة العرض إلى الارتفاع ومدة الاستهداف. اختر إعدادًا مسبقًا للتصوير السينمائي أو الإضاءة.
TechRadar

قدّم نصًا، ويمكنك اختياريًا تحميل صورة مرجعية واحدة إلى ثلاث صور (للتدفقات "المكونات ← الفيديو" أو "الإطار الأول/الأخير")، ثم اختر ما إذا كنت تريد إنشاء صوت. أرسل الملف وانتظر اكتماله. استخدم أدوات التحرير في Flow لتوسيع المشاهد، أو إدراج عناصر، أو إزالة عناصر حسب الحاجة.
وشك

كيفية الاتصال بـ Veo 3.1 (برمجيًا)

تتضمن قائمة نماذج CometAPI ووثائق الذكاء الاصطناعي أسماء النماذج (على سبيل المثال، veo-3.1 وveo-3.1-pro) والمعلمات للتحكم في الدقة والطول ونسبة العرض إلى الارتفاع والمراجع.

الخطوات التالية:

  • تسجيل الدخول إلى كوميت ايه بي اي ويضمن لك احصل على مفتاح CometAPI.
  • اتصل بنقطة نهاية نموذج Veo 3.1 باستخدام حمولة JSON تحتوي على موجه الأوامر، والمراجع (مراجع base64 أو GCS)، ودقة/مدة الهدف، وعلامات امتداد الصوت أو المشهد. استخدم نقطة نهاية Veo 3.1 Fast للتشغيلات التكرارية.
  • تحكم في المخرجات (ملفات الفيديو، مسار صوتي منفصل اختياري) وأدر مرحلة ما بعد المعالجة (تصنيف الألوان، والترميز للتسليم) في خط إنتاجك. راقب التكاليف والحصص؛ فالمقاطع الطويلة أو عالية الدقة تتطلب معالجة أكبر.

CometAPI هي منصة واجهات برمجة تطبيقات موحدة تجمع أكثر من 500 نموذج ذكاء اصطناعي من أبرز المزودين، مثل سلسلة GPT من OpenAI، وGemini من Google، وClaude من Anthropic، وMidjourney، وSuno، وغيرهم، في واجهة واحدة سهلة الاستخدام للمطورين. من خلال توفير مصادقة متسقة، وتنسيق الطلبات، ومعالجة الردود، تُبسط CometAPI بشكل كبير دمج قدرات الذكاء الاصطناعي في تطبيقاتك. سواء كنت تُنشئ روبوتات دردشة، أو مُولّدات صور، أو مُلحّنين موسيقيين، أو خطوط أنابيب تحليلات قائمة على البيانات، تُمكّنك CometAPI من التكرار بشكل أسرع، والتحكم في التكاليف، والاعتماد على مورد واحد فقط، كل ذلك مع الاستفادة من أحدث التطورات في منظومة الذكاء الاصطناعي.

يمكن للمطورين الوصول فيو 3.1 من خلال CometAPI، كوميت ايه بي اي عرض سعر أقل بكثير من السعر الرسمي لمساعدتك على التكامل.

الخاتمة

يُعد Veo 3.1 ترقية عملية وواسعة النطاق: تكمن قيمته المباشرة في تقليل الاحتكاك بين الفكرة والمشهد النهائي من خلال إضافة الصوت كمخرج أصلي، وتوسيع نطاق عناصر التحكم في المشهد والمرجع، وتمكين مخرجات ذات تسلسل أطول بشكل معقول. بالنسبة للمبدعين الذين يرغبون في تحرير بأسلوب الإنتاج ضمن حلقة توليدية، وللشركات التي تبحث عن أتمتة برمجية للمحتوى، يُعد Veo 3.1 أداةً جذابةً للتقييم.

اقرأ المزيد

500+ نموذج في واجهة برمجة تطبيقات واحدة

خصم يصل إلى 20%