ما هو GPT Image 2؟
GPT Image 2 هو نموذج توليد الصور المتقدّم من OpenAI، ومُدمج أصلاً في ChatGPT تحت اسم ChatGPT Images 2.0. وعلى عكس الأدوات المستقلة الأقدم مثل DALL·E 3، فإنه يجمع بين فهم اللغة لسلسلة GPT والتركيب البصري المتقدّم. يُنتج النموذج صوراً دقيقة وقابلة للاستخدام ومُحسّنة للمهام الاحترافية بدلاً من التجريب الفني البحت.
القدرات الرئيسية
- عرض نص شبه مثالي: يحقق دقة على مستوى الأحرف تبلغ ~99%، مع إخراج نص مقروء ودقيق سياقياً بالإنجليزية وبأنظمة كتابة غير لاتينية. ويتعامل مع الفقرات الطويلة والقوائم والملصقات والرسوم المعلوماتية من دون التشوهات الطباعية الشائعة في النماذج السابقة.
- تركيب معقّد ودقة عالية في التخطيط: يُنتج مخرجاتٍ مُنظَّمة مثل نماذج أولية لواجهات المستخدم، ومخططات الطوابق، وتصورات بيانية، وشرائح عروض، وخرائط، وصفحات مانغا، وشبكات متعددة العناصر (مثل شبكات أيقونات 10x10 أو ملصقات المنتجات).
- دعم متعدد اللغات والثقافات: يولّد نصوصاً دقيقة ومرئيات ملائمة ثقافياً بلغات متعددة.
- تحرير الصور والتعامل مع المراجع: يُجري تعديلات على الصور المُرفوعة مع الحفاظ على التفاصيل والوجوه والأنماط بدرجة عالية من الاتساق.
- التوليد على دفعات: ينشئ ما يصل إلى 8 صور متسقة من مطالبة واحدة، مع الحفاظ على اتساق الشخصيات والكائنات عبر المجموعة.
- واقعية فوتوغرافية وقابلية الاستخدام: تبدو المخرجات أكثر طبيعية وجاهزة للإنتاج، مع شوائب أقل، وأيقونات أفضل، وتكوين احترافي.