Veo 3.1 هو تحديث تدريجي ولكنه مهم من Google لعائلة Veo النصية والصورية→الفيديو، حيث يضيف ميزات أكثر ثراءً الصوت الأصلي، ومخرجات فيديو أطول وأكثر قابلية للتحكم، ودقة أعلى التحرير و على مستوى المشهد ضوابط.
المعلومات الأساسية — الميزات الأساسية
يركز Veo 3.1 على الجوانب العملية إنشاء المحتوى الميزات:
- توليد الصوت الأصلي (الحوار، الصوت المحيط، المؤثرات الصوتية) مُدمجة في المخرجات. يُولّد Veo 3.1 الصوت الأصلي (الحوار + الأجواء + المؤثرات الصوتية) متوافقة مع الجدول الزمني المرئي؛ يهدف النموذج إلى الحفاظ على مزامنة الشفاه والمحاذاة الصوتية والبصرية للحوار وإشارات المشهد.
- مخرجات أطول (دعم لمدة تصل إلى ~60 ثانية / 1080 بكسل مقابل مقاطع Veo 3 القصيرة جدًا، 8 ثوانٍ)، والمطالبات المتعددة طلقات متعددة تسلسلات لاستمرارية السرد.
- امتداد المشهد و الإطار الأول/الأخير الأوضاع التي تعمل على تمديد أو استيفاء اللقطات بين الإطارات الرئيسية.
- إدراج الكائن وإزالته (القادم) وتحرير العناصر البدائية داخل Flow.
تم تصميم كل نقطة أعلاه لتقليل العمل اليدوي في المؤثرات البصرية: تسجيل صوتي و استمرارية المشهد أصبحت الآن مخرجات من الدرجة الأولى بدلاً من مجرد أفكار لاحقة.
التفاصيل الفنية (سلوك النموذج والمدخلات)
عائلة الطراز والمتغيرات: ينتمي Veo إلى عائلة Veo-3 من Google؛ معرف نموذج المعاينة عادةً هو veo3.1-pro; veo3.1 (وثيقة CometAPI). يقبل المطالبات النصية, مراجع الصور (إطار واحد أو تسلسلات)، وتخطيطات متعددة المطالبات منظمة لتوليد لقطات متعددة.
الدقة والمدة: تصف وثائق المعاينة المخرجات في 720p / 1080p مع خيارات لفترات زمنية أطول (تصل إلى ~60 ثانية في إعدادات المعاينة المحددة) ودقة أعلى من إصدارات Veo السابقة.
نسب: 16:9 (مدعوم) و 9:16 (مدعوم باستثناء بعض تدفقات الصور المرجعية).
لغة المطالبة: الإنجليزية(معاينة).
حدود واجهة برمجة التطبيقات: تتضمن حدود المعاينة النموذجية ما يلي الحد الأقصى 10 طلبات API/الدقيقة لكل مشروع, الحد الأقصى 4 مقاطع فيديو لكل طلبو أطوال الفيديو قابلة للاختيار من بين 4 أو 6 أو 8 ثوانٍ (تدفقات الصور المرجعية تدعم 8 ثوانٍ).
أداء المعيار
تقرير التقييمات الداخلية والملخص العام لشركة Google تفضيل قوي لمخرجات Veo 3.1 عبر مقارنات المصنفين البشريين على مقاييس مثل محاذاة النص, جودة بصريةو التماسك السمعي البصري (النص→الفيديو والصورة→مهام الفيديو).
تم تحقيق Veo 3.1 دولة من بين الفن تعتمد هذه الدراسة على مقارنات داخلية بين المصنفين البشريين عبر عدة محاور موضوعية - التفضيل العام، ومحاذاة السرعة (النص→الفيديو والصورة→الفيديو)، والجودة المرئية، ومحاذاة الصوت والفيديو، و"الفيزياء الواقعية بصريًا" على مجموعات بيانات مرجعية مثل MovieGenBench وVBench.
القيود واعتبارات السلامة
القيود:
- التحف والتناقضات: على الرغم من التحسينات، فإن بعض الإضاءة، والفيزياء الدقيقة، والانسدادات المعقدة لا تزال قادرة على إحداث بعض العيوب؛ تم تحسين الاتساق بين الصورة والفيديو (خاصة على مدى فترات زمنية طويلة) ولكن ليس بشكل مثالي.
- خطر المعلومات المضللة/التزييف العميق: يزيد الصوت الأكثر ثراءً مع إدراج/إزالة العناصر من خطر سوء الاستخدام (صوت مزيف واقعي ومقاطع مطولة). تشير جوجل إلى إجراءات تخفيف (سياسات، ضمانات)، كما أشارت إصدارات Veo السابقة إلى العلامات المائية/SynthID للمساعدة في تحديد المصدر؛ إلا أن الضمانات التقنية لا تقضي على خطر سوء الاستخدام.
- قيود التكلفة والإنتاجية: تُعدّ مقاطع الفيديو الطويلة وعالية الدقة مُكلفة حسابيًا، وتُقتصر حاليًا على معاينة مدفوعة الأجر - توقع زمن وصول وتكلفة أعلى مقارنةً بنماذج الصور. تُناقش منشورات المجتمع ونقاشات منتديات جوجل فترات التوفر واستراتيجيات الاستعادة.
ضوابط السلامة: تم دمج سياسات المحتوى في Veo3.1، وإشارات العلامات المائية/synthID في إصدارات Veo السابقة، وضوابط الوصول إلى المعاينة؛ ويُنصح العملاء باتباع سياسة المنصة وتنفيذ المراجعة البشرية للمخرجات عالية المخاطر.
حالات الاستخدام العملي
- النمذجة السريعة للمبدعين: لوحات القصة → مقاطع متعددة اللقطات والرسوم المتحركة مع الحوار الأصلي للمراجعة الإبداعية المبكرة.
- التسويق والمحتوى القصير: إعلانات المنتجات من فترة 15 إلى ستينيات القرن العشرين، ومقاطع الفيديو الاجتماعية، والإعلانات التشويقية للمفاهيم حيث تكون السرعة أكثر أهمية من الواقعية الفوتوغرافية المثالية.
- تكييف الصورة→الفيديو: تحويل الرسوم التوضيحية أو الشخصيات أو إطارين إلى انتقالات سلسة أو مشاهد متحركة عبر الإطار الأول/الأخير و امتداد المشهد.
- تعزيز الأدوات: تم دمجها في Flow للتحرير التكراري (إدراج/إزالة الكائنات، إعدادات الإضاءة المسبقة) مما يقلل من عمليات تمرير المؤثرات البصرية اليدوية.
مقارنة مع النماذج الرائدة الأخرى
Veo 3.1 مقابل Veo 3 (السلف): يركز Veo 3.1 على تحسين الالتزام الفوري, جودة الصوتو اتساق اللقطات المتعددة - تحديثات تدريجية ولكن مؤثرة تهدف إلى تقليل الآثار وتحسين إمكانية التحرير.
Veo 3.1 مقابل OpenAI Sora 2: التنازلات التي تم الإبلاغ عنها في الصحافة: يؤكد Veo 3.1 التحكم في السرد الأطول، المدمجة تسجيل صوتيوتكامل تحرير Flow؛ يركز Sora 2 (عند مقارنته بالصحافة) على نقاط قوة مختلفة (السرعة، وخطوط التحرير المختلفة). يُصنّف موقع TechRadar وغيره من المنافذ Veo 3.1 كمنافس مُستهدف من قِبل Google لـ Sora 2 في دعم السرد والفيديوهات الأطول. لا تزال الاختبارات المُستقلة جنبًا إلى جنب محدودة.
كيف تتصل فيو 3.1 واجهة برمجة التطبيقات من CometAPI
إصدار النموذج: veo3.1؛ veo3.1-pro
Veo 3.1 أسعار API في CometAPI، خصم 20% من السعر الرسمي:
| veo3.1 | 0.4000 |
| فيو 3.1 برو | 2.0000 |
الخطوات المطلوبة
- تسجيل الدخول إلى كوميتابي.كوم. إذا لم تكن مستخدمًا لدينا بعد، فيرجى التسجيل أولاً
- احصل على مفتاح API لبيانات اعتماد الوصول للواجهة. انقر على "إضافة رمز" في رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx، ثم أرسله.
- احصل على عنوان URL لهذا الموقع: https://api.cometapi.com/
استخدام الطريقة
- حدد "
veo3.1; veo3.1-proنقطة نهاية لإرسال طلب واجهة برمجة التطبيقات (API) وتعيين نص الطلب. يمكن الحصول على طريقة الطلب ونصه من وثيقة واجهة برمجة التطبيقات على موقعنا الإلكتروني. كما يوفر موقعنا اختبار Apifox لتسهيل الأمر عليك. - يستبدل باستخدام مفتاح CometAPI الفعلي الخاص بك من حسابك.
- أدخل سؤالك أو طلبك في حقل المحتوى - وهذا ما سيستجيب له النموذج.
- . قم بمعالجة استجابة API للحصول على الإجابة الناتجة.
توفر CometAPI واجهة برمجة تطبيقات REST متوافقة بالكامل - للانتقال السلس. التفاصيل الرئيسية:
- عنوان URL الأساسي: https://api.cometapi.com/v1/chat/completions
- أسماء النماذج: veo3.1؛ veo3.1-pro
- المصادقة:
Bearer YOUR_CometAPI_API_KEYرأس - نوع المحتوى:
application/json.
انظر أيضا سورا 2


