📘 المواصفات التقنية لـ Grok Imagine Video
| المواصفة | التفاصيل |
|---|---|
| معرف النموذج | grok-imagine-video |
| المزود | xAI |
| النوع | ذكاء اصطناعي لتوليد الفيديو وتحريره |
| أنواع الإدخال | نص (مُحفِّز)؛ صورة أو فيديو اختياري. مطالبات نصية (لغة طبيعية)؛ إدخال صورة اختياري (صورة→فيديو)؛ video_url اختياري لتحرير المقاطع الموجودة. تختلف الحدود القصوى لمدة فيديو الإدخال للتحرير حسب المنفذ — المُبلّغ عنها ~8.7s لبعض مسارات التحرير. |
| أنواع الإخراج | فيديو .mp4 عبر عنوان URL مؤقت |
| نطاق المدة (توليد) | 1–15 ثانية |
| الدقة | 480p، 720p (قابلة للضبط) |
| نسب الأبعاد | 1:1، 16:9، 9:16 |
| دعم التحرير | نعم — يُحرك ويُعدِّل مقاطع حتى 8.7s |
| ضبط المحتوى | يشمل ضبط المحتوى |
| التسعير | محسوب بالثانية، يختلف حسب الدقة |
🚀 ما هو Grok Imagine Video؟
Grok Imagine Video هو نموذج xAI المتقدم لتوليد وتحرير الفيديو والمكشوف عبر CometAPI. يتيح للمطورين توليد مقاطع فيديو قصيرة ومخصصة من مطالبات باللغة الطبيعية، مع إمكانية تحريك الصور الثابتة أو تحرير المقاطع القائمة. يدعم النموذج ضبط طول الإخراج، والدقة، ونسبة الأبعاد، مع ضبط محتوى مدمج لضمان الامتثال للسياسات.
🧠 الميزات الرئيسية (ما يميز Grok Imagine)
- صوت مدمج + مزامنة حركة الشفاه: يُولّد صوتًا بيئيًا متزامنًا، وتأثيرات، وخطابًا/سردًا قصيرًا مع مزامنة تقريبية لحركة الشفاه.
- صورة→فيديو / تحرير بالمطالبة: تحريك صورة ثابتة أو تحرير لقطات قائمة عبر مطالبات نصية (إزالة/استبدال عناصر، إعادة توقيت، إعادة أسلوب).
- تكرار سريع وزمن استجابة منخفض: مُصمم لدورات تغذية راجعة سريعة مناسبة لسير عمل إبداعي ونماذج أولية للمنتجات.
- واجهة إنتاجية: Imagine API تُوفّر نقاط نهاية برمجية للتوليد الدفعي، والاندماج ضمن مسارات التحرير، وضوابط مؤسسية.
- عدّة “أوضاع” / أنماط: أوضاع مواجهة للمستخدم (أمثلة مُبلّغ عنها: Normal / Fun / Spicy أو إعدادات مشابهة) لتوجيه المخرجات نحو أسلوب أو درجة سماح معينة (ملاحظة: وضع “Spicy” تاريخيًا مكّن NSFW).
| النموذج (الشركة) | أقصى دقة (عام) | أقصى طول مقطع (عام) | صوت مدمج؟ | نقاط القوة | محاذير |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | نعم | تكرار سريع، تكلفة/زمن استجابة مُناسبان، تحرير مُدمج، صوت مدمج | حد 720p؛ مخاوف ضبط المحتوى؛ تباين في الواقعية |
| Sora (OpenAI) | 720p–1080p (يعتمد على الفئة) | قصير (6–15s) | نعم | واقعية بصرية عالية؛ تكامل قوي مع حزمة OpenAI | أعلى تكلفة؛ ضوابط/ضبط أكثر تقييدًا |
| Veo (Google DeepMind) | حتى 1080p+ | قصير (يتغير) | نعم | فوتوريالية قوية، حركة مستقرة | تكلفة أعلى؛ تجريب علني أقل |
| Runway Gen-4.5 | 1080p+ | قصير (يتغير) | نعم | اعتماد صناعي لسير العمل الإبداعي، جودة عالية | أعلى كلفة؛ تركيز على أدوات الإبداع |
| Vidu / Kling / Pika (متخصصون مختلفون) | حتى 1080p | قصير (يتغير) | متنوع | يقدم البعض ميزات متخصصة (Smart Cuts، ربط لقطات متعددة) | دعم صوتي متفاوت؛ نضج واجهات برمجة التطبيقات يختلف |
⚠️ القيود
- الحد الأقصى لطول الفيديو 15 ثانية.
- التحرير يحافظ على طول فيديو الإدخال (≤ 8.7s).
- عناوين URL المُولدة مؤقتة — يُرجى التحميل بسرعة.
كيفية الوصول إلى ودمج Grok Imagine Video
الخطوة 1: التسجيل للحصول على مفتاح API
سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يرجى التسجيل أولًا. سجّل الدخول إلى وحدة تحكم CometAPI. احصل على مفتاح واجهة برمجة التطبيقات للوصول. انقر “Add Token” عند رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسله.
الخطوة 2: إرسال الطلبات إلى واجهة Grok Imagine Video
اختر نقطة النهاية “grok-imagine-video” لإرسال طلب واجهة البرمجة واضبط جسم الطلب. تُستمد طريقة وجسم الطلب من وثائق واجهاتنا على الموقع. يوفر موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي من حسابك. أين تستدعيه: GROKتوليد الفيديو و تحرير الفيديو.
الخطوة 3: إرسال الطلبات إلى واجهة Grok Imagine Video
أدخل نصًا أو ارفع صورة (يمكنك اختياريًا تزويد صورة مصدر لتحريكها). تحلل واجهة Grok Imagine AI مدخلاتك وتُحضّر المحتوى لعنوان URL. يدعم كلٌّ من التحويل من نص إلى فيديو ومن صورة إلى فيديو.
يمكن تقديم صورة المصدر عبر:
- عنوان URL عام يشير إلى صورة
- معرّف URI لبيانات مُشفرة بـ base64 (مثل:
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
الخطوة 4: استرجاع النتائج والتحقق منها
عالج استجابة الواجهة للحصول على النتيجة المُولدة. بعد المعالجة، تُرجع الواجهة حالة المهمة وبيانات المخرجات. تُعيد request_id مباشرةً عند الإرسال؛ استخدم نقطة نهاية GET للتحقق من الحالة واسترجاع الفيديو المُولد. تحرير الفيديو غير متزامن، وقد تحتاج إلى الاستعلام عن هذه النقطة عدة مرات حتى تكتمل المهمة. يُرجى التنزيل بسرعة.




