إطلاق رئيسي لنماذج Imagen 4 وImagen 4 Ultra وVeo 3 من Google في مؤتمر Google I/O 2025

تستعد شركة جوجل للكشف عن نماذج الذكاء الاصطناعي التوليدية من الجيل التالي -الصورة 4, إيماجين 4 ألتراو فيو 3—خلال مؤتمر Google I/O السنوي للمطورين في 20 مايو 2025. التسريبات المبكرة لمعرفات المعاينة (على سبيل المثال، imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) تشير إلى طرح تدريجي ومستويات متعددة من القدرات في مجالي تركيب الصور والفيديو. يهدف Imagen 4 إلى تحقيق مكاسب كبيرة في الواقعية، والدقة الفورية، والاتساق الأسلوبي مقارنةً بـ Imagen 3، بينما قد يوفر الإصدار "Ultra" دقة أعلى أو أوضاع أداء متخصصة. أما بالنسبة للفيديو، فيعد Veo 3 باستمرارية أكثر تماسكًا بين المقاطع، والتزامًا قويًا بالأسلوب مقارنةً بـ Veo 2. من المتوقع أن تتكامل جميع النماذج الثلاثة بشكل وثيق مع نظام Gemini AI من Google، مما يتيح انتقالات سلسة من المطالبات النصية إلى الصور أو مقاطع الفيديو ضمن سير العمل نفسه.

معاينة المعرفات واستراتيجية الطرح

المعاينات المرحلية: المراجع الداخلية مثل

imagen-4.0-generate-preview-05-20
imagen-4.0-ultra-generate-exp-05-20
veo-3.0-generate-preview

إطلاق رئيسي لنماذج Imagen 4 وImagen 4 Ultra وVeo 3 من Google في مؤتمر Google I/O 2025

ظهرت في مستودعات التعليمات البرمجية ومعاينات واجهة برمجة التطبيقات، مما يشير إلى نية Google تقديم مستويات الأداء القياسية و"الفائقة" لتوليد الصور، بالإضافة إلى معاينة نموذج الفيديو المتقدم للمختبرين الأوائل.

إطلاق Google I/O:

تشير هذه المعرفات بقوة إلى أن Google ستعرض وتمنح إمكانية الوصول إلى المعاينة للمطورين في مؤتمر I/O في 20 مايو 2025، تعكس عمليات الطرح السابقة لـ Imagen 3 وVeo 2.

ما الجديد في Imagen 4

الواقعية الفوتوغرافية والإخلاص

تحسين العرضيُقال إن Imagen 4 يُحقق تفاصيل واقعية أكثر للصور، مما يُقلل من العيوب ويُحسّن دقة الألوان. وتشير الشائعات الأولية إلى تحسينات في فهم المحفزات المعقدة، مثل الإضاءة الدقيقة أو الانعكاسات.
الالتزام الفوري:من المتوقع أن يتبع النموذج تعليمات المستخدم بدقة أكبر، وتقديم صور تتوافق بشكل أفضل مع كل من توجيهات المحتوى والأسلوب (على سبيل المثال، "لوحة زيتية لغروب الشمس فوق الجبال").

تناسق النمط

تماسك الصور المتعددةتم تصميم Imagen 4 للحفاظ على أسلوب مرئي متسق عبر مخرجات متعددة، مما يفيد حالات الاستخدام مثل رسم القصص المصورة أو إنشاء كتالوج المنتج، حيث يكون التوحيد أمرًا بالغ الأهمية.
متغير فائق:من المرجح أن توفر الطبقة "Ultra" (imagen‑4.0‑ultra) مخرجات ذات دقة أعلى أو تحسينات متخصصة (على سبيل المثال، دقة فائقة لوسائل الإعلام المطبوعة) للمؤسسات والمحترفين المبدعين.

ما الجديد في Veo 3

تحسين التماسك

استمرارية المقطع إلى المقطع:يهدف Veo 3 إلى إنشاء تسلسلات فيديو حيث تحافظ اللقطات المتتالية على التأطير والإضاءة ومظهر الشخصية بشكل متسق، مما يعالج القيود في Veo 2 حول الانجراف البصري بمرور الوقت.
دقة الأسلوب:يركز النموذج على تكرار الأنماط الفنية أو السينمائية بشكل أكثر دقة، مما يجعل من الأسهل إنتاج مقاطع فيديو بالجمالية المطلوبة (على سبيل المثال، الرسوم المتحركة السوداء أو الباستيل).

دمج العلامة المائية SynthID

العلامات المائية الرقميةمن خلال الاستفادة من تقنية SynthID من DeepMind (التي تم تقديمها مع Veo 2)، سيقوم Veo 3 بتضمين علامات مائية غير محسوسة للمساعدة في تحديد المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي والحد من سوء الاستخدام.

التكامل مع Gemini AI

وصول سلسمن المتوقع أن يكون من الممكن الوصول إلى كل من Imagen 4 وVeo 3 بشكل مباشر من خلال واجهات Gemini الخاصة بـ Google - مما يتيح للمستخدمين إنشاء صور أو مقاطع فيديو داخل المطالبات المستندة إلى الدردشة أو من خلال واجهات المنتج مثل Google Photos وGoogle Slides.
أحجار الجوزاء:قد تتضمن "الأحجار الكريمة" المخصصة للذكاء الاصطناعي هذه النماذج، مما يسمح للمستخدمين بإنشاء مساعدين متخصصين (على سبيل المثال، جوهرة تخطيط السفر التي تولد صورًا لمسار الرحلة ومقاطع فيديو عامة) ومشاركتها في سوق مشابه لمتجر GPT الخاص بـ ChatGPT.

التوفر والخطوات التالية

معاينة الجمهور:قد يتلقى المطورون ومختبرو المؤسسات دعوات لتجربة Imagen 4 (القياسي وفائق) وVeo 3 بدءًا من 20 مايو 2025 في مؤتمر Google I/O، مع طرح أوسع نطاقًا للمختبرات وVertex AI في الأسابيع التالية.

ردود الفعل والتكرار:كما هو الحال مع الإطلاقات السابقة، من المرجح أن تطلب Google تعليقات المستخدمين لتحسين مرشحات الأمان، ومتانة العلامات المائية، وتحسين الأداء قبل التوفر العام.

انظر لهذه المساحة:يجب على المطورين المهتمين مراقبة كوميت ايه بي اي.

سيتم إدراج واجهة برمجة التطبيقات النموذجية الجديدة على CometAPI، ومن المتوقع أن توفر أسعارًا أقل من أسعار جوجل لتسهيل عملية التكامل. يُرجى الانتباه جيدًا. وثيقة API.