How fast is GPT Image 1.5 compared to GPT Image 1?

يوفر GPT Image 1.5 تحسينات في السرعة تصل إلى 4× مقارنةً بـ GPT Image 1، مما يقلل بشكل ملحوظ زمن الاستجابة لسير العمل الإبداعي التكراري.

Does GPT Image 1.5 support multi-turn conversational editing?

نعم، عبر Responses API، يدعم GPT Image 1.5 سير عمل تحرير متعدد الجولات، حيث يمكنك تحسين الصور بشكل تكراري عبر تقديم تعليمات لاحقة مع الحفاظ على السياق.

What resolutions and quality settings does GPT Image 1.5 support?

يدعم GPT Image 1.5 الدقات 1024×1024 (مربعة)، 1536×1024 (أفقية)، و1024×1536 (عمودية). تشمل خيارات الجودة low وmedium وhigh وauto.

Can GPT Image 1.5 use multiple reference images for compositing?

نعم، يقبل GPT Image 1.5 عدة صور إدخال للتركيب وكمرجع للأسلوب. تُحفَظ أول 5 صور بدقة أعلى عند استخدام وضع input_fidelity العالي.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

يركّز GPT Image 1.5 على إخلاص التحرير وسرعة التكرار، بينما يُشاد بـ Nano Banana Pro من حيث الواقعية على مستوى الاستوديو. كلاهما متنافسان بشدة—اختر وفق احتياجات سير العمل لديك.

Does GPT Image 1.5 support transparent backgrounds?

نعم، عيّن معامل background إلى 'transparent' مع صيغ الإخراج PNG أو WebP. تعمل الشفافية بأفضل صورة عند إعدادات جودة متوسطة أو عالية.

What is the maximum text prompt length for GPT Image 1.5?

يقبل GPT Image 1.5 مطالبات نصية حتى 32,000 حرف، مما يتيح تعليمات مفصلة للغاية ومقيدة لمهام توليد الصور المعقدة.

واجهة برمجة تطبيقات GPT Image 1.5 بأسعار معقولة | text-to-image

ما هي واجهة برمجة تطبيقات GPT-Image-1.5؟

GPT-Image-1.5 هو أحدث أفراد عائلة نماذج الصور من OpenAI وهو النموذج الذي يقف وراء تجربة Images المحدّثة في ChatGPT. صُمّم لنقل توليد الصور من مرحلة التجارب الاستكشافية إلى أدوات إبداعية بمستوى الإنتاج: واقعية فوتوغرافية أعلى، تحكم أدق للتحريرات التكرارية، واستدلال أسرع لدعم سير العمل التفاعلية والمؤسسية.

إن gpt-image-1.5 API نقطة نهاية لنموذج صور متعدد الوسائط يقبل مدخلات صورة واحدة أو أكثر (معرّفات ملفات أو بايتات خام) بالإضافة إلى مُحرِّض نصي، ويعيد صورًا مولّدة أو صورًا محررة. يدعم:

التحويل من النص إلى صورة (الإنشاء انطلاقًا من مُحرِّض)،
تحرير الصور / الرسم داخل الصورة / التركيب (تطبيق التعليمات على صور موجودة، مع السماح بمدخلات صور متعددة)، و
سير عمل تحرير تكراري متعدد الجولات عبر Responses API (يُمكّن واجهات “التعديل والتكرار”).

تتعامل الواجهة مع مُحرّضات الصور بشكل مختلف عن قيود DALL·E القديمة: تقبل نماذج الصور في GPT مُحرّضات نصية أطول بكثير (إرشاد حتى 32,000 حرف)، ما يجعل التعليمات المعقدة والثقيلة بالقيود قابلة للتنفيذ.

الميزات الرئيسية (عملية)

قابلية تحرير محسّنة / اتساق عبر جولات متعددة: يحافظ على مظهر الشخصية والإضاءة والسمات البصرية الأساسية عبر التحريرات التكرارية. يجعل ذلك “النموذج نفسه، تحريرات متكررة” أكثر موثوقية لسير عمل مثل كتالوجات المنتجات أو أصول العلامات التجارية.
معدل نقل أعلى — تحسينات سرعة 4× مقارنة بـ GPT Image 1، بهدف خفض الكمون لسير العمل الإبداعية التكرارية.
تحسينات التكلفة — خفض تكاليف إدخال/إخراج الصور بنحو 20% مقارنة بـ GPT Image 1، ما يقلل تكلفة كل تكرار للصورة للمستخدمين ذوي الحجم الكبير.
تركيب متعدد الصور والإحالة الأسلوبية — يقبل صورًا مرجعية متعددة لتركيب المشاهد أو نقل الأسلوب/الإضاءة.
أدوات ضبط الجودة/الوفاء — معاملات في الواجهة توازن بين السرعة والدقة (استخدم جودة أقل للإنتاج بالجملة؛ جودة أعلى للأصول الإنتاجية).
تحرير متعدد الجولات / تكامل مع Responses API — يتيح سير عمل خطوة بخطوة (اطلب تغييرات، ثم “أجرِ تعديلات” مع الحفاظ على الحالة).

القدرات التقنية

حد مُحرّض نصي (لنماذج الصور): حتى 32,000 حرف (ملاحظة: توثّق OpenAI هذا كحد طول النص لنماذج صور GPT). استخدمه للمحرّضات الطويلة الثقيلة بالقيود.
مدخلات الصور: يقبل معرّفات الملفات (مفضلة للتدفقات متعددة الجولات) أو البايتات الخام؛ يمكن تقديم صور متعددة للتركيب والمرجع.
المخرجات: PNG/JPEG أو عناصر صور بحسب النظام الأساسي التي تعيدها الواجهة (أو كمرفقات داخل ChatGPT). يمكن أن تتضمن المخرجات عدة صور مرشحة وتدعم الطلبات التكرارية لصقل النتيجة.
أوضاع التوليد: من النص إلى الصورة، تحرير الصورة (رسم داخل الصورة/توسيع مع تعليمات)، والنسخ البديلة. يدعم التحرير متعدد الجولات تعليمات بأسلوب “إضافة/حذف/دمج”.
تحرير مدرِك للتعليمات: النماذج مُحسّنة للالتزام بالتعليمات (الحفاظ على ثوابت محددة مثل “لا تغيّر الشعار”، “حافظ على الوضعية والإضاءة”). تقلّل أنماط هندسة المُحرّض (تكرار الثوابت صراحةً في كل تكرار) من الانحراف الدلالي.

أداء القياسات المعيارية

التموضع على لوائح المتصدرين: أشار تقرير تجميعي إلى تصدر GPT Image 1.5 لتصنيفات التحويل من النص إلى الصورة مع ~1264 نقطة على لوحة تصنيف Artificial Analysis، متقدمًا على أقرب نموذج بفارق ملموس.
مقاييس على مستوى المهام (التحرير والحفاظ): تُظهر خلاصة تقييم من Microsoft Foundry تحقيق GPT-Image-1.5 لنجاح تعديل ثنائي شبه كامل (100% في اختبار BinaryEval أحادي الجولة) ودرجات قوية في الحفاظ على الوجوه (حوالي 90% على مقاييس AuraFace) في جدول المقارنة مقابل المنافسين ونماذج OpenAI السابقة. تضع هذه المقارنات GPT-Image-1.5 أمام بعض المنافسين في الحفاظ والالتزام بالتحرير.

GPT Image 1.5

كيف يقارن GPT-Image-1.5 مع نظرائه

مقارنة بـ GPT Image 1 (جيل OpenAI السابق): أسرع (حتى 4×)، أرخص (انخفاض تكاليف إدخال/إخراج الصور بنحو ~20%)، وأقوى في التزام التحرير — يستهدف الانتقال من “نموذج أولي/عرض” إلى سير عمل صور مناسب للإنتاج.
مقارنة بـ Google’s Nano Banana Pro / نماذج Gemini للصور: يُعد GPT-Image-1.5 وعائلة Google’s Nano Banana Pro / Gemini منافسين متقاربين — لكل منهما نقاط قوة في فئات مُحرّضات مختلفة. تؤكد رسائل OpenAI على التزام التحرير وسرعة التكرار؛ وقد حظيت عروض Google بالثناء على الواقعية بمستوى الاستوديو في بعض الأمثلة.
مقارنة بـ Qwen Image ونماذج مفتوحة/مغلقة أخرى: يتفوق GPT-Image-1.5 على Qwen Image في عدة مقاييس للتحرير والحفاظ في تقييمات أحادية الجولة، لكن الفروق تضيق في التحرير متعدد الجولات أو اختبارات مجال محددة.

أين يتفوق GPT-Image-1.5

تصوير منتجات التجارة الإلكترونية: نسخ جماعية، استبدال الخلفيات، كتالوجات منتجات متسقة من صورة واحدة (الحفاظ على العلامة/الشعار).
إنتاج الأصول الإبداعية والتسويقية: تكرارات سريعة للمفاهيم، نماذج فوتوريالية، نقل أسلوب مضبوط.
تنقيح الصور وسير العمل التحريري: تجارب واقعية على الملابس/تسريحات الشعر، تنقيح انتقائي يحافظ على الهوية والإضاءة.
تكامل أدوات التصميم: الربط بمنصات التصميم أو أنظمة إدارة المحتوى لإنتاج نسخ صور عند الطلب (تساعد أدوات ضبط الوفاء في التحكم بالتكلفة).
خطوط تركيب متعددة الخطوات: تسمح المدخلات المتعددة للصور بالتركيب والتوليد القائم على المراجع للمشاهد المعقدة.

كيفية الوصول إلى GPT Image 1.5 API

الخطوة 1: التسجيل للحصول على مفتاح API

سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يُرجى التسجيل أولًا. سجّل الدخول إلى CometAPI console. احصل على بيانات الاعتماد (مفتاح API) للواجهة. انقر “Add Token” ضمن رموز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسِل.

الخطوة 2: إرسال الطلبات إلى GPT Image 1.5 API

اختر نقطة النهاية “gpt-image-1.5” لإرسال طلب الواجهة واضبط جسم الطلب. طريقة الطلب وجسم الطلب متاحان في وثائق واجهة برمجة التطبيقات على موقعنا. يوفّر موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي من حسابك. عنوان URL الأساسي هو الصور (https://api.cometapi.com/v1/images/generations) و [تحرير الصور]

أدرج سؤالك أو طلبك في حقل المحتوى — هذا ما سيستجيب له النموذج. عالج استجابة الواجهة للحصول على النتيجة المولدة.

الخطوة 3: الاسترجاع والتحقق من النتائج

عالج استجابة الواجهة للحصول على النتيجة المولدة. بعد المعالجة، تستجيب الواجهة بحالة المهمة وبيانات المخرجات.

انظر أيضًا Gemini 3 Pro Preview API

سعر كوميت (USD / M Tokens)	السعر الرسمي (USD / M Tokens)	خصم
مدخل:$6.4/M الإخراج:$25.6/M	مدخل:$8/M الإخراج:$32/M	-20%

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

ما هي واجهة برمجة تطبيقات GPT-Image-1.5؟

التحويل من النص إلى صورة (الإنشاء انطلاقًا من مُحرِّض)،
تحرير الصور / الرسم داخل الصورة / التركيب (تطبيق التعليمات على صور موجودة، مع السماح بمدخلات صور متعددة)، و
سير عمل تحرير تكراري متعدد الجولات عبر Responses API (يُمكّن واجهات “التعديل والتكرار”).

الميزات الرئيسية (عملية)

قابلية تحرير محسّنة / اتساق عبر جولات متعددة: يحافظ على مظهر الشخصية والإضاءة والسمات البصرية الأساسية عبر التحريرات التكرارية. يجعل ذلك “النموذج نفسه، تحريرات متكررة” أكثر موثوقية لسير عمل مثل كتالوجات المنتجات أو أصول العلامات التجارية.
معدل نقل أعلى — تحسينات سرعة 4× مقارنة بـ GPT Image 1، بهدف خفض الكمون لسير العمل الإبداعية التكرارية.
تحسينات التكلفة — خفض تكاليف إدخال/إخراج الصور بنحو 20% مقارنة بـ GPT Image 1، ما يقلل تكلفة كل تكرار للصورة للمستخدمين ذوي الحجم الكبير.
تركيب متعدد الصور والإحالة الأسلوبية — يقبل صورًا مرجعية متعددة لتركيب المشاهد أو نقل الأسلوب/الإضاءة.
أدوات ضبط الجودة/الوفاء — معاملات في الواجهة توازن بين السرعة والدقة (استخدم جودة أقل للإنتاج بالجملة؛ جودة أعلى للأصول الإنتاجية).
تحرير متعدد الجولات / تكامل مع Responses API — يتيح سير عمل خطوة بخطوة (اطلب تغييرات، ثم “أجرِ تعديلات” مع الحفاظ على الحالة).

القدرات التقنية

حد مُحرّض نصي (لنماذج الصور): حتى 32,000 حرف (ملاحظة: توثّق OpenAI هذا كحد طول النص لنماذج صور GPT). استخدمه للمحرّضات الطويلة الثقيلة بالقيود.
مدخلات الصور: يقبل معرّفات الملفات (مفضلة للتدفقات متعددة الجولات) أو البايتات الخام؛ يمكن تقديم صور متعددة للتركيب والمرجع.
المخرجات: PNG/JPEG أو عناصر صور بحسب النظام الأساسي التي تعيدها الواجهة (أو كمرفقات داخل ChatGPT). يمكن أن تتضمن المخرجات عدة صور مرشحة وتدعم الطلبات التكرارية لصقل النتيجة.
أوضاع التوليد: من النص إلى الصورة، تحرير الصورة (رسم داخل الصورة/توسيع مع تعليمات)، والنسخ البديلة. يدعم التحرير متعدد الجولات تعليمات بأسلوب “إضافة/حذف/دمج”.
تحرير مدرِك للتعليمات: النماذج مُحسّنة للالتزام بالتعليمات (الحفاظ على ثوابت محددة مثل “لا تغيّر الشعار”، “حافظ على الوضعية والإضاءة”). تقلّل أنماط هندسة المُحرّض (تكرار الثوابت صراحةً في كل تكرار) من الانحراف الدلالي.

أداء القياسات المعيارية

التموضع على لوائح المتصدرين: أشار تقرير تجميعي إلى تصدر GPT Image 1.5 لتصنيفات التحويل من النص إلى الصورة مع ~1264 نقطة على لوحة تصنيف Artificial Analysis، متقدمًا على أقرب نموذج بفارق ملموس.
مقاييس على مستوى المهام (التحرير والحفاظ): تُظهر خلاصة تقييم من Microsoft Foundry تحقيق GPT-Image-1.5 لنجاح تعديل ثنائي شبه كامل (100% في اختبار BinaryEval أحادي الجولة) ودرجات قوية في الحفاظ على الوجوه (حوالي 90% على مقاييس AuraFace) في جدول المقارنة مقابل المنافسين ونماذج OpenAI السابقة. تضع هذه المقارنات GPT-Image-1.5 أمام بعض المنافسين في الحفاظ والالتزام بالتحرير.

GPT Image 1.5

كيف يقارن GPT-Image-1.5 مع نظرائه

مقارنة بـ GPT Image 1 (جيل OpenAI السابق): أسرع (حتى 4×)، أرخص (انخفاض تكاليف إدخال/إخراج الصور بنحو ~20%)، وأقوى في التزام التحرير — يستهدف الانتقال من “نموذج أولي/عرض” إلى سير عمل صور مناسب للإنتاج.
مقارنة بـ Google’s Nano Banana Pro / نماذج Gemini للصور: يُعد GPT-Image-1.5 وعائلة Google’s Nano Banana Pro / Gemini منافسين متقاربين — لكل منهما نقاط قوة في فئات مُحرّضات مختلفة. تؤكد رسائل OpenAI على التزام التحرير وسرعة التكرار؛ وقد حظيت عروض Google بالثناء على الواقعية بمستوى الاستوديو في بعض الأمثلة.
مقارنة بـ Qwen Image ونماذج مفتوحة/مغلقة أخرى: يتفوق GPT-Image-1.5 على Qwen Image في عدة مقاييس للتحرير والحفاظ في تقييمات أحادية الجولة، لكن الفروق تضيق في التحرير متعدد الجولات أو اختبارات مجال محددة.

أين يتفوق GPT-Image-1.5

تصوير منتجات التجارة الإلكترونية: نسخ جماعية، استبدال الخلفيات، كتالوجات منتجات متسقة من صورة واحدة (الحفاظ على العلامة/الشعار).
إنتاج الأصول الإبداعية والتسويقية: تكرارات سريعة للمفاهيم، نماذج فوتوريالية، نقل أسلوب مضبوط.
تنقيح الصور وسير العمل التحريري: تجارب واقعية على الملابس/تسريحات الشعر، تنقيح انتقائي يحافظ على الهوية والإضاءة.
تكامل أدوات التصميم: الربط بمنصات التصميم أو أنظمة إدارة المحتوى لإنتاج نسخ صور عند الطلب (تساعد أدوات ضبط الوفاء في التحكم بالتكلفة).
خطوط تركيب متعددة الخطوات: تسمح المدخلات المتعددة للصور بالتركيب والتوليد القائم على المراجع للمشاهد المعقدة.

GPT Image 1.5

Playground لـ GPT Image 1.5

ما هي واجهة برمجة تطبيقات GPT-Image-1.5؟

الميزات الرئيسية (عملية)

القدرات التقنية

أداء القياسات المعيارية

كيف يقارن GPT-Image-1.5 مع نظرائه

أين يتفوق GPT-Image-1.5

كيفية الوصول إلى GPT Image 1.5 API

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى GPT Image 1.5 API

الخطوة 3: الاسترجاع والتحقق من النتائج

الأسئلة الشائعة

التسعير لـ GPT Image 1.5

نموذج الكود وواجهة برمجة التطبيقات لـ GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

إصدارات GPT Image 1.5

GPT Image 1.5

Playground لـ GPT Image 1.5

ما هي واجهة برمجة تطبيقات GPT-Image-1.5؟

الميزات الرئيسية (عملية)

القدرات التقنية

أداء القياسات المعيارية

كيف يقارن GPT-Image-1.5 مع نظرائه

أين يتفوق GPT-Image-1.5

كيفية الوصول إلى GPT Image 1.5 API

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى GPT Image 1.5 API

الخطوة 3: الاسترجاع والتحقق من النتائج

الأسئلة الشائعة

التسعير لـ GPT Image 1.5

نموذج الكود وواجهة برمجة التطبيقات لـ GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

إصدارات GPT Image 1.5