📘 المواصفات التقنية لـ Grok Imagine Video
| المواصفة | التفاصيل |
|---|---|
| معرّف النموذج | grok-imagine-video |
| المزوّد | xAI |
| النوع | ذكاء اصطناعي لإنشاء الفيديو وتحريره |
| أنواع الإدخال | نص (موجّه)؛ صورة أو فيديو اختياريان. مطالبات نصية (لغة طبيعية)؛ إدخال صورة اختياري (image→video)؛ video_url اختياري لتحرير المقاطع الموجودة. تختلف مدد أقصى فيديو إدخال للتحرير بحسب نقطة النهاية — أُبلِغ عن ~8.7s لبعض تدفقات التحرير. |
| أنواع الإخراج | فيديو .mp4 عبر رابط مؤقت |
| نطاق المدة (الإنشاء) | 1–15 ثانية |
| الدقة | 480p، 720p (قابلة للتهيئة) |
| نسب الأبعاد | 1:1، 16:9، 9:16 |
| دعم التحرير | نعم — يُحرّك ويعدّل مقاطع الفيديو حتى 8.7s |
| ضبط المحتوى | يتضمن ضبط المحتوى |
| التسعير | محاسبة بالثانية، تختلف حسب الدقة |
🚀 ما هو Grok Imagine Video؟
Grok Imagine Video هو نموذج xAI المتقدم لإنشاء الفيديو وتحريره، متاح عبر CometAPI. يتيح للمطورين إنشاء مقاطع فيديو قصيرة ومخصّصة من مطالبات لغوية طبيعية، مع إمكانية تحريك الصور الثابتة أو تحرير المقاطع الموجودة. يدعم النموذج ضبط طول الإخراج ودقته ونسبة الأبعاد، ويتضمن ضبط محتوى مدمجًا لضمان الامتثال للسياسات.
🧠 الميزات الرئيسية (ما يميّز Grok Imagine)
- صوت مدمج + مزامنة الشفاه: يولّد صوتًا محيطيًا متزامنًا، ومؤثرات، وكلامًا/سردًا قصيرًا مع مزامنة تقريبية لحركة الشفاه.
- الصورة→فيديو / التحرير بالموجه: تحريك صورة ثابتة أو تحرير لقطات موجودة عبر مطالبات نصية (إزالة/استبدال عناصر، إعادة التوقيت، إعادة الأسلوب).
- تكرار سريع وزمن استجابة منخفض: مصمم لدورات تغذية راجعة سريعة تلائم تدفقات العمل الإبداعية ونماذج أولية للمنتجات.
- واجهة API للإنتاج: توفّر Imagine API نقاط نهاية برمجية للتوليد الدفعي، والدمج ضمن سلاسل التحرير، وضوابط مؤسسية.
- أوضاع/أنماط متعددة: أوضاع موجهة للمستخدم (أمثلة مذكورة: Normal / Fun / Spicy أو إعدادات مشابهة) للتأثير على الأسلوب أو درجة السماحية (ملاحظة: وضع “Spicy” مكّن تاريخيًا محتوى NSFW).
| النموذج (الشركة) | أقصى دقة (عام) | أقصى طول للمقطع (عام) | صوت مدمج؟ | نقاط القوة | المآخذ |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | نعم | تكرار سريع، أداء جيد من حيث التكلفة والكمون، تحرير مدمج، صوت مدمج | حد أقصى 720p؛ اعتبارات ضبط المحتوى؛ تفاوت في مطابقة الواقع |
| Sora (OpenAI) | 720p–1080p (تعتمد على الفئة) | قصير (6–15s) | نعم | واقعية بصرية عالية؛ تكامل قوي مع منظومة OpenAI | تكلفة أعلى؛ ضوابط/اعتدال أكثر تقييدًا |
| Veo (Google DeepMind) | حتى 1080p+ | قصير (متفاوت) | نعم | تصوير فوتوغرافي واقعي قوي، حركة مستقرة | تكلفة أعلى؛ تجريب علني أقل |
| Runway Gen-4.5 | 1080p+ | قصير (متفاوت) | نعم | اعتماد واسع في الصناعة لبيئات العمل الإبداعية، دقة عالية | أعلى تكلفة؛ تركيز على أدوات الإبداع |
| Vidu / Kling / Pika (متخصصون متنوعون) | حتى 1080p | قصير (متفاوت) | متنوع | بعضها يقدم ميزات متخصصة (Smart Cuts، ربط اللقطات المتعددة) | دعم صوتي متفاوت؛ تباين في نضج واجهات API |
⚠️ القيود
- الحد الأقصى لطول الفيديو هو 15 ثانية.
- التحرير يحافظ على طول فيديو الإدخال (≤ 8.7s).
- الروابط المُنشأة مؤقتة — يرجى التنزيل سريعًا.
كيفية الوصول إلى Grok Imagine Video ودمجه
الخطوة 1: التسجيل للحصول على مفتاح API
سجّل الدخول إلى cometapi.com. إن لم تكن من مستخدمينا بعد، يُرجى التسجيل أولًا. سجّل الدخول إلى وحدة تحكم CometAPI. احصل على مفتاح اعتماد الوصول لواجهة API. انقر "Add Token" ضمن رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسِل.
الخطوة 2: إرسال الطلبات إلى واجهة Grok Imagine Video API
اختر نقطة النهاية “grok-imagine-video” لإرسال طلب واجهة API وحدّد جسم الطلب. تُستمد طريقة الطلب وجسمه من مستند واجهة API على موقعنا. يقدّم موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي من حسابك. أين يتم الاستدعاء: GROKإنشاء الفيديو وتحرير الفيديو.
الخطوة 3: إرسال الطلبات إلى واجهة Grok Imagine Video API
أدخِل نصًا أو ارفع صورة (يمكنك اختياريًا توفير صورة مصدر لتحريكها). تقوم واجهة Grok Imagine AI API بتحليل إدخالك وتحضير المحتوى للرابط. يدعم كلٌ من تحويل النص إلى فيديو وتحويل الصورة إلى فيديو.
يمكن توفير صورة المصدر عبر:
- رابط عام يشير إلى صورة
- معرّف بيانات URI مشفّر بـ base64 ( مثلًا:
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
الخطوة 4: استرجاع النتائج والتحقق منها
عالج استجابة واجهة API للحصول على النتيجة المُنشأة. بعد المعالجة، تستجيب الواجهة بحالة المهمة وبيانات الإخراج. تُعيد request_id فور الإرسال؛ استخدم نقطة نهاية GET للتحقق من الحالة واسترجاع الفيديو المُنشأ. تحرير الفيديو غير متزامن، وقد تحتاج إلى الاستعلام عن نقطة النهاية هذه عدة مرات حتى تكتمل المهمة. يُرجى التنزيل سريعًا.