X

GPT Image 1 mini

مدخل:$6.4/M
الإخراج:$25.6/M
سياق:2M
الحد الأقصى للإخراج:30K
إصدار مُحسَّن من حيث التكلفة من GPT Image 1. إنه نموذج لغوي متعدد الوسائط أصلاً يقبل مدخلات نصية وصورية وينتج مخرجات صورية.
جديد
الاستخدام التجاري

الميزات الرئيسية

  • توليد النص→صورة: يحوّل المطالبات باللغة الطبيعية إلى صور مع التزام قوي بالتعليمات.
  • تحرير الصور / التلوين الداخلي: يقبل الصور المرجعية والأقنعة لإجراء تعديلات مستهدفة.
  • تصميم مُحسَّن من حيث التكلفة ("mini"): بصمة أصغر تصفها OpenAI والمراقبون بأنها أرخص بكثير لكل صورة من النموذج الكبير (تشير رسائل OpenAI/DevDay والتقارير المبكرة إلى تكلفة أقل بحوالي ~80%).
  • عناصر تحكم مرنة في الإخراج: يدعم الحجم، وتنسيق الإخراج (JPEG/PNG/WEBP)، والضغط، ومؤشرًا للجودة (low/medium/high/auto في cookbook).

التفاصيل التقنية (البنية والقدرات)

  • عائلة النموذج والإدخال/الإخراج: عضو في عائلة gpt-image-1؛ يقبل مطالبات نصية ومدخلات صور (للتعديلات) ويُرجع مخرجات صور مُولَّدة. تتحكم معلمات الجودة/الحجم في الدقة (الحد الأقصى المعتاد ~1536×1024 في هذه العائلة—راجع الوثائق لمعرفة الأحجام المدعومة الدقيقة).
  • المفاضلات التشغيلية: صُمم كنموذج ذي بصمة أصغر—يُبادل بعضًا من أعلى مستويات الدقة مقابل تحسينات في الإنتاجية والتكلفة مع الحفاظ على اتباع قوي للمطالبات وميزات التحرير.
  • السلامة والبيانات الوصفية: يتبع ضوابط السلامة الخاصة بصور OpenAI ويضمّن خيارات بيانات وصفية C2PA لإثبات المصدر عند توفرها.

المدخلات والمخرجات — يدعم الاستخدام القياسي ما يلي:

  • مطالبة نصية (string) لإنشاء صورة جديدة.
  • صورة + قناع لإجراء تعديلات مستهدفة/تلوين داخلي.
  • صور مرجعية للتحكم في الأسلوب أو التكوين.
    يتم إتاحة هذه عبر Images API (اسم النموذج gpt-image-1-mini).

القيود

  • انخفاض الدقة القصوى: مقارنةً بالنموذج الكبير gpt-image-1، قد يفقد mini بعض التفاصيل الدقيقة جدًا وأعلى مستويات الواقعية الفوتوغرافية (وهي مفاضلة متوقعة مقابل التكلفة).
  • عرض النصوص والتفاصيل الصغيرة: مثل كثير من نماذج الصور، قد يواجه صعوبة مع النصوص الصغيرة المقروءة، والمخططات الكثيفة، أو القوامات الدقيقة جدًا؛ توقّع إجراء معالجة لاحقة أو استخدام نماذج ذات سعة أعلى لهذه الاحتياجات.
  • نطاق التحرير: تتوفر ميزات تحرير الصور/التلوين الداخلي، لكن توجد مؤشرات إلى بعض القيود في التحرير مقارنةً بأدوات ChatGPT التفاعلية على الويب—التحرير فعّال للعديد من المهام لكنه قد يتطلب تحسينًا تكراريًا.
  • قيود السلامة والسياسات: تخضع المخرجات لضوابط الإشراف/السلامة الخاصة بـ OpenAI (المحتوى الصريح، وقيود المحتوى المحمي بحقوق الطبع والنشر، والمخرجات غير المسموح بها). يمكن للمطورين التحكم في حساسية الإشراف عبر معلمات API حيثما كانت متاحة.

حالات الاستخدام الموصى بها

  • إنشاء محتوى بكميات كبيرة (أصول تسويقية، صور مصغرة، فن مفاهيمي سريع) — حيث تكون التكلفة لكل صورة هي العامل الأساسي.
  • التحرير البرمجي / القوالب — التلوين الداخلي المجمع أو إنشاء متغيرات انطلاقًا من أصل أساسي.
  • التطبيقات التفاعلية ذات القيود الميزانية — واجهات الدردشة أو أدوات التصميم المدمجة حيث تهم سرعة الاستجابة والتكلفة أكثر من أعلى دقة مطلقة.
  • النمذجة الأولية وتوليد الصور لاختبارات A/B — إنشاء العديد من الصور المرشحة بسرعة ثم تحسينها أو إعادة تشغيلها انتقائيًا على نماذج أكبر للنسخ النهائية.
  • كيفية الوصول إلى واجهة gpt-image-1-mini API

الخطوة 1: التسجيل للحصول على مفتاح API

سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، فيرجى التسجيل أولاً. سجّل الدخول إلى وحدة تحكم CometAPI الخاصة بك. احصل على بيانات اعتماد الوصول، أي مفتاح API الخاص بالواجهة. انقر على “Add Token” في قسم API token في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسله.

الخطوة 2: إرسال الطلبات إلى واجهة gpt-image-1-mini API

حدّد نقطة النهاية “\**gpt-image-1-mini \**” لإرسال طلب API وقم بتعيين نص الطلب. يتم الحصول على طريقة الطلب ونص الطلب من وثائق API على موقعنا. كما يوفر موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي الخاص بك من حسابك.

أدرج سؤالك أو طلبك في حقل content—فهذا هو ما سيرد عليه النموذج. عالج استجابة API للحصول على الإجابة المُولَّدة.

الخطوة 3: استرجاع النتائج والتحقق منها

عالج استجابة API للحصول على الإجابة المُولَّدة. بعد المعالجة، تستجيب API بحالة المهمة وبيانات الإخراج.

المزيد من النماذج