ما هو GPT Image 2؟
GPT Image 2 هو نموذج توليد الصور الأحدث من OpenAI، مدمج أصلاً في ChatGPT باسم ChatGPT Images 2.0. وعلى عكس الأدوات المستقلة السابقة مثل DALL·E 3، يجمع بين قدرات فهم اللغة في سلسلة GPT والتوليف البصري المتقدم. ينتج النموذج صوراً دقيقة قابلة للاستخدام ومُحسّنة للمهام المهنية بدلاً من التجريب الفني البحت.
القدرات الرئيسية
- تصيير نص شبه مثالي: يحقق دقة على مستوى الحرف تبلغ ~99%، وينتج نصوصاً مقروءة ودقيقة سياقياً بالإنجليزية وبالأنظمة الكتابية غير اللاتينية. يتعامل مع الفقرات الطويلة والقوائم والملصقات والرسوم المعلوماتية دون التشويش الطباعي الشائع في النماذج السابقة.
- تركيب معقّد والالتزام بالتخطيط: ينتج مخرجات منظمة مثل نماذج أولية لواجهات المستخدم، ومخططات الطوابق، وتصورات البيانات، وشرائح العرض، والخرائط، وصفحات المانغا، والشبكات متعددة العناصر (مثل مصفوفات أيقونات 10x10 أو ملصقات المنتجات).
- دعم متعدد اللغات والثقافات: يُنشئ نصوصاً دقيقة ومرئيات ملائمة ثقافياً بلغات متعددة.
- تحرير الصور ومعالجة المراجع: يُجري تعديلات على الصور المرفوعة مع الحفاظ على التفاصيل والوجوه والأنماط بدرجة عالية من الاتساق.
- التوليد على دفعات: يُنشئ ما يصل إلى 8 صور متماسكة من مطالبة واحدة، مع الحفاظ على اتساق الشخصيات والكائنات عبر المجموعة.
- واقعية فوتوغرافية وقابلية الاستخدام: تبدو المخرجات أكثر طبيعية وجاهزية للإنتاج، مع شوائب أقل، وأيقونات أفضل، وتركيب احترافي.