FLUX.2 [max] هو نموذج ذكاء بصري رفيع المستوى من Black Forest Labs (BFL) مصمم لسيناريوهات الإنتاج: التسويق، تصوير المنتجات، التجارة الإلكترونية، خطوط العمل الإبداعية، وأي تطبيق يتطلب ثبات الهوية للشخصيات/المنتجات، ودقة عالية في عرض النصوص، وتفاصيل فوتوغرافية بدقة متعددة الميغابكسل. تم تصميم البنية لتحقيق التزام قوي بالتعليمات النصية، ودمج متعدد المراجع (حتى عشر صور إدخال)، والتوليد المرتكز إلى السياق (القدرة على إدماج سياق ويب حديث عند إنتاج الصور).
المواصفات التقنية (جدول)
| الحقل | القيمة / ملاحظات |
|---|---|
| اسم النموذج / النسخة | FLUX.2 [max] (يُكتب غالبًا FLUX 2 Max). |
| أنواع الإدخال | مطالبات نصية + صور مرجعية (يُقبل إدخال الصور). |
| أنواع الإخراج | صورة (فوتوغرافية وذات أسلوب)، تعديلات على الصور (الاستكمال الداخلي/الخارجي وإعادة الإكساء) |
| الصور المرجعية (الحد الأقصى) | حتى 8 صور مرجعية عبر API |
| الدقة القصوى الأصلية | حتى 4 ميغابكسل (مثلًا، ~2048×2048 أو تشكيلات مكافئة بالميغابكسل)؛ الأحجام الموصى بها للإنتاج عادة ≤2MP لتحقيق توازن السرعة/التكلفة. |
| نافذة السياق (نص) | 32K رموز نصية (سعة الرموز المدخلة المُوثَّقة لعائلة FLUX.2). |
| زمن الاستجابة / السرعة | سرعات توليد “أقل من 10 ثوانٍ” مذكورة للتشكيلات النموذجية |
ما هي واجهة برمجة تطبيقات FLUX.2 [max]؟
واجهة برمجة تطبيقات FLUX.2 [max] هي نقطة نهاية مُدارة من BFL تتيح نموذج FLUX.2 [max] لأغراض توليد الصور من النص برمجيًا (text→image)، وتحرير الصور متعدد المراجع، وتدفقات التوليد المرتكز إلى السياق. تستقبل طلبات JSON تتضمن نص المطالبة ومراجع صور اختيارية، وتدعم معلمات توليد الصور القياسية (الأبعاد، الخطوات، مقياس الإرشاد، البذور)، وتُعيد عناوين URL للصور المُولَّدة أو كُتل الصور وفق تنسيق استجابة المزوّد.
القدرات النموذجية المتاحة عبر API:
- نقطة نهاية لتوليد الصور من النص (Text→Image).
- نقاط نهاية لتحرير الصور / الاستكمال الداخلي/الخارجي تقبل صورًا مرجعية.
- فهرسة متعددة المراجع (وَسْمُ الصور المرجعية ضمن الطلب).
- تكامل اختياري مع الإسناد/البحث على الويب لتزويد الصور المُولَّدة بسياق مُحدَّث (متاح في فئة [max]).
الميزات الرئيسية
- التوليد المرتكز إلى السياق (سياق الويب): يمكن لـ [max] دمج سياق ويب حديثًا من مصادر خارجية ضمن عملياته بحيث تعكس المرئيات المنتجات الدارجة أو الأحداث الجارية عند الطلب. هذه ميزة فارقة بارزة.
- دقة عالية / مخرجات أصلية 4MP: إضاءة واقعية، وخامات دقيقة، وهندسة مستقرة بدقات بمستوى الإنتاج.
- تحرير متعدد المراجع واتساق قوي للهوية: يحافظ على الوجوه وهوية المنتج عبر التعديلات واللقطات؛ ويدعم مراجع عديدة للحفاظ على اتساق الهوية عبر المخرجات.
- امتثال متقدم للتعليمات ودقة الأسلوب: مُعدَّل لإعادة إنتاج التعليمات الأسلوبية المعقدة بأمانة والحفاظ على الطباعية/النصوص الصغيرة بدرجة أفضل من النماذج الصورية المعتادة (وفقًا لاختبارات المورّد).
- ضوابط إنتاج: مُقابض تحكم عبر JSON، توجيه الوضعيات، أدوات إعادة الإكساء، وتحكم مرتفع بالألوان (hex codes) وبالتكوين لبيئات الاستديو.
أداء المعايير
- ترتيب LM Arena / Image Arena: يحتل FLUX.2 [max] مرتبة عالية على لوائح التصنيف العامة لتوليد الصور؛ تُظهر تصنيفات ELO المبنية على آراء الجمهور (LM Arena / Image Arena) أنه في نطاق 1150–1170 ELO (مثال: 1168 ELO على ساحة Text-to-Image وقت الإبلاغ)، ما يضعه ضمن أفضل النماذج غير التابعة لكبرى شركات التقنية مع تخلف طفيف عن بعض أفضل النماذج من أكبر المورّدين.
- معايير عملية: جودة بصرية قوية مقارنة بالنماذج النظيرة (توازن ألوان أفضل بشكل ملحوظ، وتفاصيل خامات أدق، ونطاق أساليب إبداعي أوسع في العديد من الاختبارات المباشرة).
FLUX 2 max مقابل Midjourney وNano Banana
- مقابل Midjourney v7 / عائلة Midjourney: يشير المراجعون إلى أن نسخ FLUX.2 (Pro/Max) تستهدف مباشرةً دقة الإنتاج واتساق الهوية متعدد المراجع، في حين تبقى نقاط قوة Midjourney في الأسلوب واستكشاف الجماليات. في اختبارات الهوية/الاتساق الصارمة، يضع بعض المراجعين FLUX.2 في المقدمة، بينما يواصل Midjourney التفوق في بعض الأساليب الإبداعية الخاصة. (انظر: مراجعات الصناعة ومقالات المقارنة المباشرة بين النماذج).
- مقابل Nano Banana Pro (ونماذج الاستديو المماثلة): يُقدَّم Nano Banana Pro وعدد من النماذج المُغلقة الأخرى كأدوات قوية متعددة المراجع/استديو افتراضي؛ ينافس FLUX.2 [max] بقوة في اتساق التحرير والدقة الفوتوغرافية، مع تقديم عائلة منتجات أوسع لخيارات المفاضلة بين السرعة والتحكم.
نسخ النموذج
| النسخة | الاستخدام المستهدف | نقطة القوة الأساسية |
|---|---|---|
| FLUX.2 [max] | تدفقات عمل احترافية | أعلى دقة واتساق في التحرير |
| FLUX.2 [pro] | أداء متوازن | مفاضلة جيدة بين السرعة والجودة |
| FLUX.2 [flex] | تحكم قابل للضبط | معلمات توليد دقيقة |
| FLUX.2 [dev] | بحث مفتوح الأوزان | تطوير محلي وتجريب |
حالات استخدام إنتاجية نموذجية
- التجارة الإلكترونية/تصوير المنتجات: إنشاء صور منتجات متسقة ومتوافقة مع العلامة، وإنتاج عدة متغيرات لاختبارات A/B دون جلسة تصوير فعلية.
- أصول الإعلان والتسويق: إنتاج صور بارزة، وملصقات، ولقطات أسلوب حياة جاهزة للنشر بدقة تصل إلى 4MP لتلبية احتياجات الحملات.
- استمرارية الشخصيات والملكية الفكرية: لاستديوهات تحتاج ظهور الشخصية/المنتج ذاته عبر مشاهد وتعديلات متعددة مع الحفاظ على الهوية.
- تصويرات تحريرية ومرتكزة إلى السياق: تصوير أحداث راهنة/واقعية أو مفاهيم منتجات رائجة باستخدام التوليد المرتكز إلى السياق لإضافة معلومات حديثة. (الحذر واجب بخصوص المخاطر القانونية/الأخلاقية للأشخاص الحقيقيين.)
- التصميم والنمذجة الأولية: نماذج واجهات المستخدم، والرسوم المعلوماتية، والملصقات حيث يلزم نص مقروء وطباعية مضبوطة.
كيفية الوصول إلى واجهة Flux 2 Max API
الخطوة 1: التسجيل للحصول على مفتاح API
سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، يرجى التسجيل أولًا. سجّل الدخول إلى وحدة تحكم CometAPI. احصل على مفتاح API كبيانات اعتماد الوصول للواجهة. انقر “Add Token” في قسم رموز API بمركزك الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسِل.
الخطوة 2: إرسال الطلبات إلى Flux 2 Max API
اختر نقطة النهاية “flux-2-max” لإرسال طلب API واضبط جسم الطلب. تُستقى طريقة الطلب وجسمه من وثائق API على موقعنا. يوفر موقعنا أيضًا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الحقيقي من حسابك. عنوان الأساس هو توليد صور Flux(https://api.cometapi.com/flux/v1/flux-2-max)
أدخل سؤالك أو طلبك في حقل content — فهذا ما سيستجيب له النموذج. عالج استجابة API للحصول على النتيجة المُولَّدة.
الخطوة 3: استرجاع النتائج والتحقق منها
بعد التوليد، يمكنك استخدام نقطة النهاية /flux/v1/get_result للاستعلام عن الصور المُولَّدة أو مراقبة حالة العملية. بعد المعالجة، تستجيب API بحالة المهمة وبيانات المخرجات.
👇 ابدأ البناء الآن Flux لتوليد الصور – وثائق API