FLUX.2 هو عائلة مُعلَن عنها حديثًا من نماذج توليد الصور وتحريرها من Black Forest Labs، وتقدّم دقة بمستوى الإنتاج، وتحريرًا متعدد المراجع (حتى 10 مراجع)، وإصدارات قابلة للنشر تتراوح من Dev ذي الأوزان المفتوحة إلى Pro المخصص للإنتاج وFlex القابل للتحكم.
ما هو FLUX.2؟
FLUX.2 هو عائلة Black Forest Labs لتوليد الصور + تحريرها بمستوى إنتاجي، تجمع بين التكييف متعدد المراجع، وفضاء كامن مُعاد العمل عليه (VAE)، وأدوات تحكم متقدمة (توجيه ألوان hex، وJSON prompting، وتوجيه الوضعية) لتقديم نتائج متسقة وعالية الدقة لسير العمل الإبداعي والتجاري. وهو يدعم كلًا من توليد النص→صورة وتحرير الصور متعدد المراجع ضمن عائلة نماذج واحدة، كما توفّر BFL نقاط نهاية API مستضافة بالإضافة إلى ملفات بأوزان مفتوحة للبحث والاستدلال المحلي. ويتوفر هذا العرض عبر عدة قنوات توزيع: أوزان مفتوحة للباحثين/المطورين (FLUX.2)، ونماذج إنتاج مستضافة مثل Flux.2 Pro، ونقاط نهاية مستضافة قابلة للتخصيص مثل Flux.2 Flex.
القدرات الأساسية
- التحرير متعدد المراجع: دمج ما يصل إلى 8–10 صور مرجعية لإخراج واحد مع الحفاظ على اتساق الهوية والأسلوب. وهذا مفيد بشكل خاص للإعلانات، ونماذج المنتجات، أو استمرارية الشخصيات عبر التنويعات الإبداعية.
- دقة عالية (حتى 4MP): مخرجات تصل إلى 4 ميغابكسل (على سبيل المثال 2048×2048 وأكبر، بحسب نسبة الأبعاد).
- واقعية تصويرية + تفاصيل دقيقة: تحسينات في الأيدي والوجوه والأنسجة والاستدلال المكاني مقارنةً بالنماذج المفتوحة الأقدم.
- مطالبات منظمة وJSON prompts: يدعم FLUX.2 المطالبات المنظمة/مطالبات JSON التي تتوافق طبيعيًا مع عناصر تحكم الواجهة (scene, subjects[], style, lighting, camera)، ما يتيح توليدًا برمجيًا وقابلًا لإعادة الإنتاج.
- دقة الطباعة والألوان: عرض نصوص جيد بشكل غير معتاد وتوجيه دقيق للألوان (hex) لسير العمل الحساس للعلامة التجارية.
- إثبات مصدر المحتوى والسلامة: يطبق Pro API بيانات C2PA الوصفية الموقعة تشفيريًا على الصور المنتَجة ويشغّل تصفية متعددة الطبقات لفئات المحتوى غير المسموح بها.
Pro مقابل Flex مقابل Dev: أي نموذج تختار؟
| Variant | Latency & cost | Quality | Control & features | Multi-reference |
|---|---|---|---|---|
| FLUX.2 | مُحسّن لزمن استجابة منخفض (<10s في إعدادات API النموذجية)، ويتضمن مرشحات محتوى وبيانات C2PA وصفية موقعة تشفيريًا لإثبات المصدر. | الأعلى (4MP، أفضل دقة) | ميزات كاملة، واتفاقيات مستوى خدمة للإنتاج | حتى 8 (API، حد 9MP) |
| FLUX.2 | زمن استجابة أعلى من pro لكنه يوفّر معلمات استدلال قابلة للضبط (steps, guidance scale, إلخ) | عالٍ | دقة قابلة للضبط مقابل التنوع؛ وخطوات استدلال قابلة للتعديل، وguidance scale، وعناصر تحكم أخرى في أخذ العينات لمقايضات الجودة/السرعة. | حتى 10 |
| FLUX.2 | يعتمد على العتاد | قوي (أوزان مفتوحة) | تحرير كامل + مراجع متعددة؛ نقطة تحقق مفتوحة | الحد الأقصى الموصى به 6 |
| FLUX.2 | طرفي / منخفض الموارد | متوسط (مُقطّر) | سريع، وبصمة VRAM صغيرة |
متى تختار كل واحد
- اختر dev إذا كان يجب عليك التشغيل محليًا، أو كنت بحاجة إلى بحث خوارزمي، أو تتطلب تخصيصات بأوزان مفتوحة (مع تقبّل متطلبات عتادية مرتفعة).
- اختر pro عندما تحتاج إلى صور إنتاجية متوقعة ومنخفضة الاستجابة مع ميزات سلامة وإثبات مصدر مدمجة.
- اختر flex إذا كنت تكرر ضبط معلمات التوليد (tuning steps, guidance scale, إلخ) وتريد نقطة نهاية مُدارة تتيح هذا التحكم.
كيف يعمل FLUX.2؟
يجمع FLUX.2 بين ثلاثة عناصر معمارية رئيسية:
1. العمود الفقري Transformer بتدفق مُصحّح
في جوهره، يستخدم FLUX.2 معمارية transformer من نوع flow-matching / rectified-flow تعمل في فضاء كامن متعلَّم (بديل حديث للانتشار لبعض خطوط الإنتاج). يتيح هذا العمود الفقري عرضًا عالي الدقة واستدلالًا مكانيًا يحسّن الاتساق عبر مراجع متعددة. ويقدّم نهج “flow matching” مقايضات مختلفة في سرعة أخذ العينات والدقة مقارنة بالانتشار التقليدي.
2. مُرمّز تلقائي متبايني جديد (VAE)
يقوم مُرمّز تلقائي مُصمَّم خصيصًا بضغط الصور إلى تمثيل كامن مُحسّن لمهام التوليد والتحرير في FLUX.2. وتذكر BFL أن VAE الجديد يحسّن قابلية الضغط والدقة (ديناميكيات تعلم أفضل وإعادات بناء أعلى جودة من الأجيال السابقة). ويُعد VAE مساهمًا رئيسيًا في الارتقاء النظيف إلى 4MP وتحسين التفاصيل.
3. نموذج رؤية–لغة طويل السياق (VLM)
يوفّر VLM (أُفيد بأنه مرتبط بمشفّرات الرؤية–اللغة من فئة Mistral في الملاحظات المنشورة) تكييف اللغة والمعرفة بالعالم الحقيقي، ما يجعل المطالبات أكثر وفاءً ويجعل النموذج أفضل في اتباع التعليمات المعقدة (توجيه الوضعية، والتحريرات السياقية، إلخ). ويتيح الجمع بين VLM وعمود فقري قائم على التدفق لـ FLUX.2 الاستدلال حول التركيب والدلالات ضمن نوافذ سياق أكبر.
كيف تتفاعل هذه الأجزاء (تدفق وقت التشغيل)
- ترميز الإدخال/الإدخالات: تُرمَّز الصور المرجعية عبر VAE إلى رموز كامنة؛ وتُرمَّز المطالبات النصية بواسطة VLM.
- الدمج متعدد الوسائط: يستوعب العمود الفقري transformer الكامنات الصورية + الرموز النصية ويُنمذج العلاقات المكانية وميزات الهوية وتعليمات التحرير.
- التوليد القائم على التدفق: تقوم عينات rectified-flow بتوليد الصور الكامنة أو تحريرها وفقًا للتمثيل المدمج المشروط.
- فك الترميز: يقوم VAE بفك ترميز الكامنات إلى فضاء البكسل، مع إمكانية تطبيق قيود لونية نهائية وبيانات watermark/C2PA الوصفية.
لماذا تهم هذه المعمارية
يوفّر هذا المزيج ثلاث مزايا عملية: (1) تماسك متعدد المراجع لأن الهوية والأسلوب يُنمذجان صراحةً في الكامن؛ (2) نصوص وطباعة أفضل بفضل التكامل الأوثق بين VLM وفضاء الصورة الكامن؛ (3) خيارات نشر قابلة للتوسع — إذ يمكن شحن عائلة النموذج الأساسية نفسها كأوزان مفتوحة للاستخدام المحلي (dev)، أو كخدمة مُدارة منخفضة الاستجابة (pro)، أو كخدمة قابلة للضبط للمطورين (flex).
ما مدى جودة FLUX.2؟
الأداء في المقاييس
نشرت Black Forest Labs تقييمات ومخططات مقارنة تُظهر تفوق FLUX.2 على عدة نماذج معاصرة ذات أوزان مفتوحة في اختبارات تفضيل بشرية/معدل فوز وجهاً لوجه، وفي تحليلات ELO مقابل التكلفة. وتتضمن أبرز النقاط المُبلغ عنها في ملخص المورّد/الصحافة المنشور ما يلي:
- معدل فوز Text→Image: أبلغ FLUX.2 عن معدل فوز ≈66.6% (مقابل ~51.3% لـ Qwen-Image، و48.1% لـ Hunyuan Image 3.0).
- التحرير بمرجع واحد: معدل فوز ≈59.8% (مقابل ~49.3% لـ Qwen-Image، و41.2% لـ FLUX.1 Kontext).
- التحرير متعدد المراجع: معدل فوز ≈63.6% (مقابل ~36.4% لـ Qwen-Image).
- ELO مقابل التكلفة: تتجمع عائلة FLUX.2 (Pro, Flex, Dev) ضمن شريحة عالية الجودة ومنخفضة التكلفة نسبيًا (ELO ≈1030–1050 مع العمل بحوالي ~2–6 سنتات لكل صورة في مخطط تسعير المورّد).
التوليد متعدد المراجع
إحدى أكبر ميزات FLUX.2 هي قدرته على توليد عدة مخرجات متسقة باستخدام عدة صور مرجعية.
على سبيل المثال، عند تصوير منتج، يمكنك رفع عدة صور ملتقطة من زوايا مختلفة، وفي ظروف إضاءة مختلفة، وعلى خلفيات مختلفة، وتوليد عدة تنويعات للصورة نفسها دفعة واحدة.
تتيح لك هذه الميزة إنشاء صور كتالوج المنتجات بسرعة لمواقع التجارة الإلكترونية، ولافتات الإعلانات، ومجموعات صور وسائل التواصل الاجتماعي، وغير ذلك.
وعلى عكس التوليد التقليدي بالاعتماد على صورة واحدة، تُعد آلية تعدد المراجع هذه مثالية لسير العمل الواقعي الذي يركز على الاتساق والسلامة.
دقة عالية، وجودة تجارية (حتى 4MP)
يدعم FLUX.2 مخرجات تصل إلى 4 ميغابكسل (حوالي 2000-3000 بكسل)، ما يوفّر جودة صور مناسبة للتطبيقات العملية مثل الإعلانات، والطباعة، واللافتات، والملصقات.
وهو يتعامل مع النصوص، والشعارات، ونماذج واجهات المستخدم، والرسوم المعلوماتية، وغير ذلك بشكل ممتاز، ما يجعله مناسبًا ليس فقط للإبداع الفني بل أيضًا للتصميم والاستخدام التجاري.
وفي الوقت نفسه، تم أيضًا تحسين جودة عرض الخطوط والنصوص، ما يجعله مناسبًا لإنشاء لافتات إعلانية وملصقات المنتجات.
يدعم التنفيذ على GPU محليًا: تكلفة منخفضة وحاجز دخول أقل
حتى الآن، لا تكون العديد من نماذج توليد الصور عالية الأداء عملية إلا في مراكز البيانات ذات الموارد الحاسوبية الضخمة. ومع ذلك، جرى تحسين FLUX.2 ليعمل على وحدات GPU قياسية (مثل NVIDIA RTX) مع استهلاك أقل لذاكرة VRAM.
ولم تعد النماذج بحاجة إلى الوصول عبر السحابة؛ بل يمكن تحريرها وتوليدها محليًا، مما يقلل التكاليف بشكل كبير ويزيد المرونة التشغيلية.
وهذه ميزة كبرى ليس فقط للشركات، بل أيضًا للمبدعين الأفراد والفرق الصغيرة.
سير عمل موحّد للإنشاء والتحرير
يدعم FLUX.2 ليس فقط النص إلى صورة (text → image generation) بل أيضًا الصورة إلى صورة (تحرير الصور الحالية وتطبيق الأنماط عليها).
ويتيح لك ذلك استخدام نموذج واحد باستمرار لمهام مثل “رسم صورة جديدة من الصفر”، و“تحرير الصور الموجودة وتنقيحها”، و“إعادة استخدام صور متعددة لإنشاء تنويعات موحّدة”.
فعلى سبيل المثال، من السهل تغيير خلفية صورة منتج إلى أجواء مختلفة أو إعادة تحجيمها لوسائل التواصل الاجتماعي.
كيفية الوصول إلى Flux.2 API
يسرّنا أن نعلن أن CometAPI قد دمجت Flux.2 API. ويدعم الآن Replicate Format Model (بسعر أقل من التسعير الرسمي لـ Replicate)، ونقاط نهاية FLUX.2:
- black-forest-labs/flux-2-pro
- black-forest-labs/flux-2-dev
- black-forest-labs/flux-2-flex
ابدأ البناء الآن Create Predictions – API Doc,
هل تريد التجربة أولًا؟ اختبر FLUX.2 وفي playground بعد التسجيل وتسجيل الدخول إلى CometAPI، وإذا كنت تريد البدء في البناء باستخدام API الآن: Create Predictions – API Doc.
FLUX.2 ليس مجرد إصدار جديد آخر لنموذج؛ بل هو استراتيجية منتج على مستوى العائلة تعالج حقائق الإنتاج: الدقة، وقابلية التحرير، وتماسك تعدد المراجع، ومسارات النشر العملية (واجهات API مُدارة ونقاط تحقق مفتوحة). وبالنسبة للمؤسسات التي تنتج محتوى بصريًا على نطاق واسع، يعد FLUX.2 بمكاسب إنتاجية ملموسة — شريطة أن تقرن الفرق التبني التقني بحوكمة ترخيص قوية وضبط جودة محكم.
الاستخدامات الرئيسية وحالات الاستخدام المقصودة لـ FLUX.2
إنشاء صور المنتجات/كتالوجات التجارة الإلكترونية
لدى شركات التجارة الإلكترونية والعلامات التجارية طلب مرتفع على التقاط العديد من صور المنتجات من زوايا متعددة، وبإضاءات وخلفيات وأنماط ألوان مختلفة.
- باستخدام FLUX.2، يمكنك بسرعة إنشاء تأثيرات متعددة متسقة بصريًا دون تصوير أي محتوى فعليًا.
- يتيح لك ذلك توسيع كتالوج منتجاتك بسرعة مع تقليل تكاليف التصوير والوقت وتكاليف الإدارة.
إنشاء مواد إعلانية وتسويقية
الطلب على المواد التصميمية واسع، بما في ذلك لافتات الإعلانات، وصور منشورات وسائل التواصل الاجتماعي، ومرئيات الحملات الترويجية، وملصقات العلاقات العامة.
- ما عليك سوى تقديم وصف نصي للحصول على صور بالنمط والتركيب والأجواء المطلوبة، مما يقلل بشكل كبير العبء على المصممين والمعلنين.
- وعلاوة على ذلك، وبما أن التنويعات يمكن توليدها باستخدام عدة صور مرجعية، فهو مناسب أيضًا لاختبار A/B للأفكار الإبداعية وإنشاء مواد متوافقة مع لغات ومناطق متعددة.
تصميم واجهة المستخدم/تجربة المستخدم، والنمذجة الأولية
يدعم FLUX.2 أيضًا تحرير الشعارات، والخطوط، والتخطيطات، والخلفيات، ما يجعله مناسبًا ليس فقط لتوليد الصور، بل أيضًا للتصميم البصري للمنتجات الرقمية.
- يمكنك بسرعة إنشاء تصاميم أولية، وwireframes، ومواقع فعاليات، ونماذج شاشات التطبيقات، وغير ذلك.
- وهذا حل إنتاج فعّال من حيث التكلفة، ومناسب بشكل خاص للشركات الناشئة وفرق التصميم الصغيرة.
الأعمال الفنية/الإبداعية والاستخدام الشخصي
وبالطبع، يمكن استخدامه أيضًا بشكل بحت في “الأعمال الفنية”، أو “الرسوم التوضيحية”، أو “التصميم الجرافيكي”.
- وسّع آفاقك الإبداعية من خلال إنشاء أعمال بمزاجات وأنماط متنوعة باستخدام المطالبات النصية والصور المرجعية.
- ويمكنك أيضًا استخدام ميزات تحرير الصور لإعادة توظيف الصور الحالية بحرية إلى أنماط فنية، أو تجربة مناظر خيالية أو تصاميم شخصيات.
ما الذي يميّزه عن النماذج الحالية والمنافسين—لماذا تختار FLUX.2؟
مقارنة مع نماذج توليد الصور بالذكاء الاصطناعي الأخرى
يوجد حاليًا العديد من النماذج (مفتوحة المصدر وتجارية) في مجال توليد الصور بالذكاء الاصطناعي، مثل نماذج الانتشار التقليدية وأحدث النماذج المنافسة. إذًا، لماذا يُعد FLUX.2 مقنعًا إلى هذا الحد؟ الأسباب كما يلي:
- التوليد والتحرير المتكاملان: تركّز العديد من النماذج إما على “التوليد (text to image)” أو “التحرير (image to image)”. يدعم FLUX.2 الوظيفتين معًا، محققًا سير عمل عالي الاتساق.
- مدخلات مراجع متعددة: الاستفادة من عدة صور مرجعية لتسهيل تصوير المنتجات وتحقيق اتساق بصري ثابت.
- جودة تجارية ودقة عالية: يدعم 4MP للإعلانات، وتصوير المنتجات، والطباعة.
- سهولة التنفيذ المحلي: مستقل عن السحابة ويمكن تشغيله على وحدات GPU قياسية، ما يوفر مزايا من حيث التكلفة والمرونة.
- مرونة اختيار النموذج: يقدّم مجموعة متنوعة من النماذج التي تغطي كل شيء من التطبيقات القياسية إلى التجارية والبحثية، مما يتيح لك اختيار ما يناسب احتياجاتك وميزانيتك.
وهذا يجعل FLUX.2 خيارًا قويًا لسير العمل الاحترافي، والاستخدام التجاري، والإنتاج بكميات كبيرة، والمشاريع التي تكون فيها التكلفة والسرعة عاملين حاسمين.
أفكار ختامية:
يقع FLUX.2 عند تقاطع عملي: فهو يوفّر خيارات بحث بأوزان مفتوحة للفرق التي تحتاج إلى التحكم وقابلية إعادة الإنتاج، وواجهات API إنتاجية مُدارة للفرق التي تعطي الأولوية لزمن استجابة منخفض، ومخرجات متوقعة، وإثبات المصدر. ومن خلال توفير كل من الإصدارات المفتوحة والمُدارة (dev/pro/flex)، تقرّ BFL بأن سير العمل المختلف — التجريب، والتصميم التكراري، والإنتاج — يتطلب مقايضات مختلفة بين الدقة، والسرعة، والتخصيص، والحوكمة
يمكن للمطورين الوصول إلى Flux.2 Dev API، وFlux.2 Flex API وFlux.2 Pro API عبر CometAPI. وللبدء، استكشف قدرات النماذج في CometAPI داخل Playground. وقبل الوصول، يُرجى التأكد من أنك سجلت الدخول إلى CometAPI وحصلت على مفتاح API. وتقدم CometAPI سعرًا أقل بكثير من السعر الرسمي لمساعدتك على التكامل.
هل أنت مستعد للانطلاق؟→ Sign up for CometAPI today !
إذا كنت تريد معرفة المزيد من النصائح، والأدلة، والأخبار حول الذكاء الاصطناعي، فتابعنا على VK، وX وDiscord!
