المدرج/الفصل الثاني

CometAPI
AnnaSep 13, 2025
المدرج/الفصل الثاني

الفصل الثاني هو الجيل القادم من Runway التقاط أداء الذكاء الاصطناعي و الرسوم المتحركة للشخصية الأداة: تبتلع قصيرة أداء القيادة (كاميرا ويب أو فيديو هاتف لشخص يمثل مشهدًا) بالإضافة إلى مرجع الشخصية (صورة أو فيديو) ويُنتج أداءً متحركًا للشخصية ينقل إليها الجسد وتعابير الوجه وحركة اليد. يُعرض الفصل الثاني داخل منتج Runway الإلكتروني، وكنموذج متاح عبر بيئة API.

مقدمة لنموذج الفصل الثاني

الفصل الثاني صُمم هذا النموذج لإضفاء طابع ديمقراطي على الرسوم المتحركة عالية الدقة من خلال تحويل مقاطع "أداء القيادة" القصيرة إلى تسلسلات شخصيات متحركة بالكامل. يركز النموذج على الإخلاص التعبيري - نقل تعبيرات الوجه الدقيقة، وحركة الشفاه والفم، وإيماءات الأصابع/اليد، ووضعية الجسم بالكامل - مع إضافة تعبيرات معقولة أيضًا الحركة البيئية عندما يكون الحرف المدخل عبارة عن صورة. الفصل الثاني تم وضعه كتطور لنماذج Act السابقة من Runway وتم دمجه بشكل وثيق في مجموعة أدوات الفيديو Gen-4 وواجهة برمجة التطبيقات الخاصة بـ Runway.

ماذا يفعل الفصل الثاني

  • نقل الأداء لكامل الجسم: خرائط الرأس والوجه والجذع واليدين من مقطع فيديو قيادة واحد إلى مرجع شخصية.
  • مرونة إدخال الأحرف: يقبل إما حرفًا صورة أو فيديو مرجعي كهدف.
  • السيطرة فتة: عند استخدام صورة شخصية، يمكنك توجيه إيماءات اليد/الجسم عبر مقطع القيادة وضبط تأثير الإيماءة.
  • الحركة البيئية التلقائية: يضيف حركة خلفية/بيئة دقيقة للشخصيات المستندة إلى الصور لتجنب النتائج "العائمة".

التفاصيل الفنية وقيود المهام

المدخلات

  • أداء القيادة: فيديو يحتوي على الأداء التمثيلي (الحركة، الإيماءات، الصوت).
  • مرجع الشخصية: إما صورة ثابتة أو مقطع فيديو للشخصية التي تريد تحريكها. ()

المخرجات والتنسيقات

تشمل نسب العرض إلى الارتفاع والدقة المدعومة ما يلي: 1280×720 (16:9), 720×1280 (9:16), 960×960 (1:1) ومجموعة صغيرة من الإعدادات المسبقة الأخرى؛ شنومكس فبس هو معدل الإطارات القياسي للمخرجات. يوجد القص التلقائي لتتوافق مع أهداف نسبة العرض إلى الارتفاع.

ملاحظات المعالجة: تُحقق أفضل النتائج عندما يكون أداء القيادة والشخصية في نفس الاتجاه العام ويشغلان مساحة شاشة متشابهة؛ قد تُؤدي المدخلات ذات التباين الشديد في المنظور أو الكائنات البعيدة جدًا/منخفضة الدقة إلى نتائج رديئة. تُطبق فلاتر تعديل المحتوى والمحتوى في Runway على المواد المُحمّلة؛ قد تُرفض المهام إذا كان المحتوى يُخالف السياسة.

القيود وأوضاع الفشل المعروفة

  • التركيز على مدة قصيرة: الفصل الثاني هو الأمثل ل مقاطع قصيرة (3 ثوانٍ كحد أدنى؛ عادةً ما تستخدم مهام العمل أقل من 30 ثانية). لالتقاط الحركة بطول الفيلم، ستحتاج إلى التقاط تقليدي أو مهام عمل مجزأة.
  • الإشراف / سلامة المحتوى: يمكن لإدارة Runway حظر أو تعطيل المهام للمدخلات المُعلَّمة؛ وقد تُقيَّد الحسابات التي تُخفق في إدارة المحتوى بشكل مفرط أو تُعلَّق. طوِّر امتثال سياسة المحتوى إلى الأتمتة.
  • الحالات الحدية: قد تُنتج العروض المعقدة للغاية التي تضم عدة أشخاص، أو الأيدي المُغطاة بشدة، أو الإشارات المُفرطة في الأسلوب، آثارًا جانبية (مثل الاهتزاز، أو وضعيات اليد الخاطئة، أو عدم تطابق التعبيرات). قد لا تزال هناك حاجة إلى التنظيف اليدوي أو استخدام أنابيب مختلطة (مثل تقنية الروتوسكوب الخفيفة/إصلاح الإطارات الرئيسية).
  • ليس بديلاً كاملاً لالتقاط الحركة في جميع الحالات: في حين أن الفصل الثاني يمكن أن يحل محل العديد من الإعدادات التقليدية للمشاهد القصيرة والنماذج الأولية، فإن خطوط أنابيب الأفلام/CGI المتطورة التي تتطلب دقة أقل من المليمتر، أو تفاعل الممثلين المتعددين جسديًا، أو مزامنة التوقيت في المجموعة ستظل تعتمد على أنظمة العلامات/مراحل التقاط الأداء.

حالات الاستخدام النموذجية

  • الإنتاج والعرض الافتراضي - اختبارات الحجب والتمثيل السريع بدون مرحلة التقاط الحركة.
  • النمذجة الأولية للألعاب والرسوم المتحركة المستقلة - توليد حركة سريعة للشخصيات للمشاهد القصيرة.
  • الإعلانات التجارية والمحتوى الاجتماعي - إنتاج إعلانات الشخصيات والمواهب المتحركة بسرعة وبتكلفة زهيدة.
  • إدخالات المؤثرات البصرية واستبدال الحركة - تعزيز اللقطات الموجودة من خلال قيادة شخصية منمقة من لقطة الممثل.

مقارنة مع الحلول الحالية الأخرى

الفصل الثاني ضد Pika Labs / Kaiber / Sora (مستوى عالي)

  • الفصل الثاني (المدرج): يتفوق في دقة الأداء للشخصيات (الرأس/الوجه/الجسم/اليدين) مع مشبك قيادة واحد نموذج وتكامل مباشر لواجهة برمجة التطبيقات لمقاطع الفيديو القصيرة؛ تسعير ائتماني يمكن التنبؤ به لثوانٍ من الإنتاج.
  • مختبرات بيكا: غالبًا ما يتم تسليط الضوء عليه من أجل نقل مرن للمطالبة بالفيديو والأسلوب؛ قد يركز أكثر على إنشاء الفيديو العام وأسلوبه بدلاً من نقل الأداء المستهدف.
  • كايبر: قوي في تحويلات الأسلوب، والمرئيات التي تعتمد على الموسيقى، وتوليد المشهد العام، ولكن ليس بالضرورة متخصصًا في دقة التقاط الحركة لكل شخصية.
  • Sora (وخطوط أنابيب VFX المتميزة المماثلة): موجه نحو الجودة السينمائية وتوليد المشاهد الممتدة؛ أقوى للتسلسلات الطويلة وتأثيرات الفيديو السينمائية ولكنها تتطلب موارد أكثر وربما تكون أقل سهولة في الوصول إليها بالنسبة للنماذج الأولية السريعة.

كيف تتصل الفصل الثاني واجهة برمجة التطبيقات من CometAPI

الخطوات المطلوبة

  • تسجيل الدخول إلى كوميتابي.كوم. إذا لم تكن مستخدمًا لدينا بعد، فيرجى التسجيل أولاً
  • احصل على مفتاح API لبيانات اعتماد الوصول للواجهة. انقر على "إضافة رمز" في رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx، ثم أرسله.
  • احصل على عنوان URL لهذا الموقع: https://api.cometapi.com/

استخدام الطريقة

  1. حدد "act_twoنقطة نهاية لإرسال طلب واجهة برمجة التطبيقات (API) وتعيين نص الطلب. يمكن الحصول على طريقة الطلب ونصه من وثيقة واجهة برمجة التطبيقات على موقعنا الإلكتروني. كما يوفر موقعنا اختبار Apifox لتسهيل الأمر عليك.
  2. يستبدل باستخدام مفتاح CometAPI الفعلي الخاص بك من حسابك.
  3. أدخل سؤالك أو طلبك في حقل المحتوى - وهذا ما سيستجيب له النموذج.
  4. . قم بمعالجة استجابة API للحصول على الإجابة الناتجة.

يوفر CometAPI واجهة برمجة تطبيقات REST متوافقة تمامًا - لترحيل سلس. تفاصيل رئيسية لـ  وثيقة API:

  • نقطة النهاية: https://api.cometapi.com/runwayml/v1/character_performance
  • نموذج معلمة: act_two
  • المصادقة: Bearer YOUR_CometAPI_API_KEY
  • نوع المحتوى: application/json .
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/character_performance' \  
--header 'X-Runway-Version: 2024-11-06' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"character": {  
"type": "video",  
"uri": "https://filesystem.site/cdn/20250818/wAKbHUoj5EHyqZvEdJbFXn10wXBMUn.mp4"  
},  
"reference": {  
"type": "video",  
"uri": "https://filesystem.site/cdn/20250818/wAKbHUoj5EHyqZvEdJbFXn10wXBMUn.mp4"  
},  
"bodyControl": true,  
"expressionIntensity": 3,  
"seed": 4294967295,  
"model": "act_two",  
"ratio": "1280:720",  
"contentModeration": {  
"publicFigureThreshold": "auto"  
}  
}'
اقرأ المزيد

500+ نموذج في واجهة برمجة تطبيقات واحدة

خصم يصل إلى 20%