FLUX.2 [max] هو نموذج ذكاء بصري رفيع المستوى من Black Forest Labs (BFL) مصمم لتدفقات العمل الإنتاجية: التسويق، تصوير المنتجات، التجارة الإلكترونية، خطوط العمل الإبداعية، وأي تطبيق يتطلب اتساق هوية الشخصيات/المنتجات، وعرضًا دقيقًا للنصوص، وتفاصيل فوتوغرافية واقعية بدقة متعددة الميغابكسل. تم هندسة البنية لتحقيق امتثال قوي للتعليمات النصية، والدمج متعدد المراجع (حتى عشر صور إدخال)، والتوليد المؤسس (القدرة على دمج أحدث سياق من الويب عند إنتاج الصور).
المواصفات التقنية (جدول)
| الحقل | القيمة / ملاحظات |
|---|---|
| اسم النموذج / المتغير | FLUX.2 [max] (يُكتب غالبًا FLUX 2 Max). |
| أنواع الإدخال | مطالبات نصية + صور مرجعية (يُقبل إدخال الصور). |
| أنواع الإخراج | صورة (واقعية فوتوغرافيًا ومؤسلَبة)، تعديلات على الصور (الترميم الداخلي/الخارجي/إعادة التكسية) |
| الصور المرجعية (الحد الأقصى) | حتى 8 صور مرجعية عبر API |
| الدقة القصوى الأصلية | حتى 4 ميغابكسل (مثلًا، ~2048×2048 أو تكوينات MP مكافئة)؛ الأحجام الموصى بها للإنتاج عادة ≤2MP لموازنة السرعة/التكلفة. |
| نافذة السياق (نص) | 32K من رموز النص (سعة الرموز المُوثَّقة لإدخال عائلة FLUX.2). |
| زمن الاستجابة / السرعة | سرعات توليد «أقل من 10 ثوانٍ» مذكورة للتكوينات المعتادة |
ما هو واجهة برمجة تطبيقات FLUX.2 [max]؟
واجهة برمجة تطبيقات FLUX.2 [max] هي نقطة نهاية مُدارة من BFL تتيح الاستخدام البرمجي لتوليد الصور من النص، وتحرير الصور متعدد المراجع، والتوليد المؤسس. تقبل طلبات JSON مع نص الطلب وخيارات صور مرجعية، وتدعم معلمات توليد الصور القياسية (الأبعاد، الخطوات، معامل التوجيه، البذور)، وتُرجع عناوين URL للصور المُولدة أو بيانات Blob للصور وفقًا لصيغة استجابة المزود.
قدرات API النموذجية المتاحة:
- نقطة نهاية لتوليد الصور من النص.
- نقاط نهاية لتحرير الصور/الترميم الداخلي/الخارجي تقبل صورًا مرجعية.
- فهرسة متعددة المراجع (وضع علامات على الصور المرجعية داخل الطلب).
- تكامل اختياري للتأصيل/بحث الويب للحصول على سياق حديث في الصور المُولدة (متاح في فئة [max]).
الميزات الرئيسية
- التوليد المؤسس (سياق الويب): [max] يمكنه دمج سياق ويب حديث ومصدر خارجي في عمليات التوليد بحيث تعكس الصور منتجات رائجة أو أحداثًا جارية عند الطلب. هذه ميزة فارقة أساسية.
- جودة عالية/خرج أصلي 4MP: إضاءة واقعية، وخامات، وهندسة مستقرة بدقة ملائمة للإنتاج.
- تحرير متعدد المراجع واتساق قوي للهوية: يحافظ على الوجوه وهوية المنتج عبر التعديلات واللقطات؛ يدعم مراجع عديدة للحفاظ على اتساق الهوية عبر المخرجات.
- امتثال متقدم للتعليمات ودقة الأسلوب: مضبوط لإعادة إنتاج تعليمات الأسلوب المعقدة بأمانة والحفاظ على دقة الطباعة/النصوص الصغيرة بشكل أفضل من النماذج الصورية المعتادة (بحسب اختبارات المزوّد).
- عناصر تحكم إنتاجية: مقابض تحكم عبر JSON، توجيه الوضعيات، أدوات إعادة التكسية، وتحكم عالٍ في الألوان (أكواد hex) والتكوين لبيئات الاستوديو.
أداء المعايير
- الترتيب في LM Arena / Image Arena: يحتل FLUX.2 [max] مرتبة مرتفعة في لوائح تقييم توليد الصور العامة؛ تُظهر تصنيفات ELO المعتمدة على الحشود أنه في نطاق 1150–1170 ELO (مثال: 1168 ELO على ساحة Text-to-Image وقت التقرير)، ما يضعه ضمن أفضل النماذج غير التابعة لكبرى الشركات، مع تأخر طفيف عن بعض أعلى الإدخالات من أكبر المزوّدين.
- معايير عملية: جودة بصرية قوية مقابل النماذج النظيرة (توازن ألوان أفضل بشكل ملحوظ، وتفاصيل خامات أمتن، ونطاق أسلوبي إبداعي أوسع في العديد من الاختبارات المباشرة).
FLUX 2 Max مقابل Midjourney مقابل Nano Banana
- مقابل Midjourney v7 / عائلة Midjourney: يشير المراجعون إلى أن إصدارات FLUX.2 (Pro/Max) تستهدف مباشرة جودة الإنتاج واتساق الهوية متعدد المراجع، بينما تبقى قوة Midjourney في الأسلوب واستكشاف الجماليات. في اختبارات الهوية/الاتساق الصارمة، يضعه بعض المراجعين في المقدمة، فيما يظل Midjourney متفوقًا في بعض المؤسلَبات الإبداعية. (انظر: مراجعات الصناعة ومقالات المقارنة المباشرة).
- مقابل Nano Banana Pro (ونماذج الاستوديو المماثلة): يُعد Nano Banana Pro وعدة نماذج مغلقة أخرى أدوات قوية للاستوديو متعدد المراجع؛ ينافس FLUX.2 [max] بقوة في اتساق التحرير والواقعية الفوتوغرافية، مع تقديم عائلة منتجات أوسع لخيارات المفاضلة بين السرعة/التحكم.
حالات استخدام إنتاجية نموذجية
- التجارة الإلكترونية/تصوير المنتجات: إنشاء لقطات منتجات متسقة ومتوافقة مع العلامة التجارية وتوليد نسخ متعددة لاختبارات A/B بدون جلسة تصوير فعلية.
- أصول الإعلان والتسويق: إنتاج صور بارزة، وملصقات، ولقطات أسلوب حياة بجودة تصل إلى 4MP لاحتياجات الحملات.
- استمرارية الشخصيات والملكية الفكرية: استوديوهات تحتاج إلى ظهور نفس الشخصية/المنتج عبر مشاهد وتعديلات متعددة مع الحفاظ على الهوية.
- تصورات تحريرية ومؤسَّسة: تصور أحداث راهنة/واقعية أو مفاهيم منتجات رائجة باستخدام التوليد المؤسس لإضافة سياق حديث. (ينبغي الحذر من المخاطر القانونية/الأخلاقية للأشخاص الحقيقيين).
- التصميم والنمذجة الأولية: نماذج واجهات المستخدم، والإنفوجرافيك، والملصقات حيث تُطلب قابلية قراءة النص وتحكم دقيق في الطباعة.
كيفية الوصول إلى Flux 2 Max API
الخطوة 1: التسجيل للحصول على مفتاح API
سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يرجى التسجيل أولًا. سجّل الدخول إلى CometAPI console. احصل على بيانات اعتماد مفتاح API للواجهة. انقر على "Add Token" في قسم رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسله.

الخطوة 2: إرسال الطلبات إلى Flux 2 Max API
حدّد نقطة النهاية "flux-2-max" لإرسال طلب API واضبط جسم الطلب. يمكن الحصول على طريقة الطلب وجسم الطلب من وثائق API على موقعنا. كما يوفر موقعنا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي من حسابك. عنوان URL الأساسي هو flux generate image(https://api.cometapi.com/flux/v1/flux-2-max)
أدرِج سؤالك أو طلبك في حقل content — فهذا ما سيستجيب له النموذج. عالِج استجابة API للحصول على النتيجة المُولَّدة.
الخطوة 3: استرجاع النتائج والتحقق منها
بعد التوليد، يمكنك استخدام نقطة النهاية /flux/v1/get_result للاستعلام عن الصور المُولدة أو لمراقبة حالة العملية.. بعد المعالجة، يستجيب API بحالة المهمة وبيانات الإخراج.
👇 ابدأ البناء الآن Flux لتوليد الصور – وثائق API