FLUX.2 [max]، Black Forest Labs (BFL) کا ایک اعلیٰ درجے کا بصری-ذہانت ماڈل ہے جو پروڈکشن ورک فلوز کے لیے ڈیزائن کیا گیا ہے: مارکیٹنگ، پروڈکٹ فوٹوگرافی، ای-کامرس، تخلیقی پائپ لائنز، اور وہ تمام ایپلی کیشنز جنہیں مستقل کردار/پروڈکٹ شناخت، درست متن رینڈرنگ، اور ملٹی-میگاپکسل ریزولوشن پر فوٹو ریئل تفصیل درکار ہو۔ آرکیٹیکچر مضبوط پرومپٹ کی پیروی، ملٹی-ریفرنس فیوژن (زیادہ سے زیادہ دس ان پٹ تصاویر)، اور گراؤنڈڈ جنریشن (تصاویر بناتے وقت تازہ ترین ویب کانٹیکسٹ کو شامل کرنے کی صلاحیت) کے لیے انجینیئرڈ ہے۔
تکنیکی خصوصیات (جدول)
| فیلڈ | قدر / نوٹس |
|---|---|
| ماڈل کا نام / تغیر | FLUX.2 [max] (اکثر FLUX 2 Max لکھا جاتا ہے). |
| ان پٹ اقسام | ٹیکسٹ پرومپٹس + حوالہ جاتی تصاویر (امیج ان پٹس قبول ہیں). |
| آؤٹ پٹ اقسام | امیج (فوٹو ریئلسٹک اور اسٹائلائزڈ)، امیج ایڈیٹس (inpainting/outpainting/retexturing) |
| حوالہ جاتی تصاویر (زیادہ سے زیادہ) | API کے ذریعے زیادہ سے زیادہ 8 حوالہ جاتی تصاویر |
| اصل زیادہ سے زیادہ ریزولوشن | زیادہ سے زیادہ 4 میگا پکسلز (مثلاً، ~2048×2048 یا مساوی MP کنفیگریشنز)؛ رفتار/لاگت کے توازن کے لیے عموماً ≤2MP پروڈکشن سائز تجویز کیے جاتے ہیں۔ |
| کانٹیکسٹ (متن) ونڈو | 32K ٹیکسٹ ٹوکنز (FLUX.2 فیملی کے لیے دستاویزی ان پٹ ٹوکن گنجائش). |
| لیٹنسی / رفتار | “10 سیکنڈ سے کم” جنریشن رفتاریں عام کنفیگریشنز کے لیے رپورٹ کی گئی ہیں |
FLUX.2 [max] API کیا ہے؟
FLUX.2 [max] API، BFL کا مینیجڈ اینڈ پوائنٹ ہے جو FLUX.2 [max] ماڈل کو پروگراماتی ٹیکسٹ→امیج جنریشن، ملٹی-ریفرنس امیج ایڈیٹنگ، اور گراؤنڈڈ جنریشن ورک فلو کے لیے فراہم کرتا ہے۔ یہ JSON درخواستیں قبول کرتا ہے جن میں پرومپٹ ٹیکسٹ اور اختیاری امیج ریفرنسز شامل ہوتے ہیں، معیاری امیج جنریشن پیرامیٹرز (dimensions, steps, guidance scale, seeds) کو سپورٹ کرتا ہے، اور پرووائیڈر کے ریسپانس فارمیٹ کے مطابق جنریٹڈ امیج URLs یا امیج blobs واپس کرتا ہے۔
عام API صلاحیتیں:
- ٹیکسٹ→امیج جنریشن اینڈ پوائنٹ۔
- امیج ایڈیٹنگ / inpainting / outpainting اینڈ پوائنٹس جو حوالہ جاتی تصاویر قبول کرتے ہیں۔
- ملٹی-ریفرنس انڈیکسنگ (درخواست کے اندر حوالہ جاتی تصاویر کو ٹیگ کرنا)۔
- Generated imagery میں تازہ ترین کانٹیکسٹ کے لیے اختیاری گراؤنڈنگ / ویب سرچ انضمام (یہ خصوصیت [max] ٹئیر میں دستیاب ہے)۔
اہم خصوصیات
- Grounded generation (ویب کانٹیکسٹ): [max] اپنی جنریشنز میں حالیہ، بیرونی ذرائع سے حاصل شدہ ویب کانٹیکسٹ شامل کر سکتا ہے تاکہ بصریات درخواست پر رجحان ساز مصنوعات یا موجودہ واقعات کی عکاسی کر سکیں۔ یہ ایک نمایاں امتیاز ہے۔
- اعلیٰ فیڈیلیٹی / 4MP نیٹو آؤٹ پٹ: حقیقت پسندانہ لائٹنگ، ٹیکسچرز، اور مستحکم جیومیٹری پروڈکشن گریڈ ریزولوشنز پر۔
- ملٹی-ریفرنس ایڈیٹنگ اور مضبوط شناختی مستقل مزاجی: چہروں اور پروڈکٹ شناخت کو ترمیمات اور مختلف شاٹس میں محفوظ رکھتا ہے؛ متعدد حوالہ جات کے ذریعے آؤٹ پٹس میں مستقل شناخت برقرار رہتی ہے۔
- اعلی درجے کی پرومپٹ پیروی اور اسٹائل فیڈیلیٹی: پیچیدہ اسٹائل ہدایات کی وفادار باز تخلیق کے لیے ٹیون کیا گیا، اور ٹائپوگرافی/چھوٹے متن کی درستگی عام امیج ماڈلز کے مقابلے میں بہتر برقرار رکھتا ہے (وینڈر ٹیسٹس کے مطابق)۔
- پروڈکشن کنٹرولز: JSON کنٹرول knobs، پوز گائیڈنس، ری ٹیکسچرنگ ٹولز، اور اسٹوڈیو ورک فلو کے لیے رنگوں (hex codes) اور کمپوزیشن پر اعلیٰ کنٹرول۔
بینچ مارک کارکردگی
- LM Arena / Image Arena میں درجہ بندی: FLUX.2 [max] عوامی امیج-جنریشن لیڈر بورڈز پر اعلیٰ پوزیشن پر ہے؛ کروڈ سورسڈ ELO رینکنگز (LM Arena / Image Arena) اسے تقریباً 1150–1170 ELO رینج میں دکھاتی ہیں (مثال: رپورٹنگ کے وقت Text-to-Image arena پر 1168 ELO)، جو اسے چند بڑے وینڈرز کے سرفہرست اندراجات سے کچھ پیچھے رہتے ہوئے سرفہرست non-BigTech امیج ماڈلز میں شامل کرتی ہے۔
- عملی بینچ مارکس: ہم مرتبہ ماڈلز کے مقابلے میں مضبوط بصری معیار (کئی ہیڈ-ٹو-ہیڈ ٹیسٹس میں رنگی توازن، ٹیکسچر تفصیل اور تخلیقی اسٹائل رینج نمایاں طور پر بہتر)۔
FLUX 2 max بمقابلہ Midjourney بمقابلہ Nano Banana
- بمقابلہ Midjourney v7 / Midjourney فیملی: ریویوئرز نوٹ کرتے ہیں کہ FLUX.2 ویریئنٹس (Pro/Max) براہِ راست پروڈکشن فیڈیلیٹی اور ملٹی-ریفرنس شناختی مستقل مزاجی پر مرتکز ہیں، جبکہ Midjourney کی طاقتیں اب بھی اسٹائل اور جمالیاتی جستجو میں نمایاں ہیں۔ سخت شناخت/سِمٹنے کی آزمائشوں میں بعض ریویوئرز FLUX.2 کو آگے رکھتے ہیں، جب کہ Midjourney مخصوص تخلیقی اسٹائلائزیشنز میں اب بھی ممتاز ہے۔ (موازنہ: انڈسٹری ریویوز اور براہِ راست ماڈل تقابلی مضامین)۔
- بمقابلہ Nano Banana Pro (اور اسی نوعیت کے اسٹوڈیو-گریڈ ماڈلز): Nano Banana Pro اور چند دیگر proprietary ماڈلز مضبوط ملٹی-ریفرنس/ورچوئل-اسٹوڈیو ٹولز کے طور پر پوزیشنڈ ہیں؛ FLUX.2 [max] ایڈیٹنگ کی مستقل مزاجی اور فوٹو ریئل فیڈیلیٹی پر قریبی مقابلہ کرتا ہے، جبکہ رفتار/کنٹرول کے توازن کے لیے وسیع تر پروڈکٹ فیملی پیش کرتا ہے۔
عام پروڈکشن استعمال کے کیسز
- ای-کامرس / پروڈکٹ فوٹوگرافی: بغیر فزیکل فوٹو شوٹ کے مستقل، برانڈ-کمپلائنٹ پروڈکٹ رینڈرز اور متعدد ویریئنٹس (A/B ٹیسٹنگ) تیار کریں۔
- اشتہارات اور مارکیٹنگ اسٹس: 4MP تک کیمپین ضروریات کے لیے مارکیٹ پلیس-ریڈی ہیرو امیجز، پوسٹرز، اور لائف اسٹائل شاٹس تیار کریں۔
- کردار اور IP تسلسل: اسٹوڈیوز جو چاہتے ہیں کہ ایک ہی کردار/پروڈکٹ متعدد مناظر اور ترامیم میں شناخت محفوظ رکھتے ہوئے نظر آئے۔
- اداریہ اور گراؤنڈڈ ویژولائزیشنز: موجودہ/حقیقی دنیا کے واقعات یا رجحان ساز پروڈکٹ تصورات کو گراؤنڈڈ جنریشن کے ذریعے حالیہ کانٹیکسٹ کے ساتھ بصری شکل دیں۔ (حقیقی اشخاص کے لیے قانونی/اخلاقی خطرات سے محتاط رہیں۔)
- ڈیزائن اور پروٹوٹائپنگ: UI ماک اپس، انفوگرافکس اور پوسٹرز جہاں قابلِ مطالعہ متن اور کنٹرولڈ ٹائپوگرافی درکار ہو۔
Flux 2 Max API تک رسائی کیسے حاصل کریں
مرحلہ 1: API Key کے لیے سائن اپ کریں
cometapi.com میں لاگ ان کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن ان کریں۔ انٹرفیس کا ایکسیس کریڈینشل API key حاصل کریں۔ پرسنل سینٹر میں API ٹوکن پر “Add Token” پر کلک کریں، ٹوکن key حاصل کریں: sk-xxxxx اور سبمٹ کریں۔

مرحلہ 2: Flux 2 Max API کو درخواستیں بھیجیں
“flux-2-max” اینڈ پوائنٹ منتخب کریں تاکہ API درخواست بھیج سکیں اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کے API ڈاک سے حاصل کیے جاتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ اپنی اکاؤنٹ سے حاصل کردہ حقیقی CometAPI key کے ساتھ <YOUR_API_KEY> کو تبدیل کریں۔ base url ہے flux generate image(https://api.cometapi.com/flux/v1/flux-2-max)
اپنا سوال یا درخواست content فیلڈ میں داخل کریں—ماڈل اسی کا جواب دے گا۔ Generated جواب حاصل کرنے کے لیے API ریسپانس کو پروسیس کریں۔
مرحلہ 3: نتائج حاصل کریں اور تصدیق کریں
جنریشن کے بعد، آپ /flux/v1/get_result اینڈ پوائنٹ استعمال کرکے جنریٹڈ امیجز کی پوچھ گچھ کر سکتے ہیں یا پراسیس اسٹیٹس مانیٹر کر سکتے ہیں.. پراسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔
👇 ابھی تعمیر شروع کریں Flux ایمیج جنریشن – API دستاویزات