FLUX.2 Flex کیا ہے
FLUX.2، Black Forest Labs کے FLUX.2 پروڈکٹ فیملی کا “لچکدار” (managed API) رکن ہے۔ یہ ان ڈویلپرز اور تخلیقی ٹیموں کے لیے ڈیزائن کیا گیا ہے جنہیں درکار ہو:
- جنریشن پیرا میٹرز پر واضح کنٹرول (inference steps, guidance scale وغیرہ) تاکہ وہ تکراری ورک فلو کے دوران رفتار اور وفاداری کے درمیان توازن قائم کر سکیں؛
- مضبوط typography / text rendering اور نہایت باریک جزئیات کی ہینڈلنگ (انفوگرافکس، UI ماک اپس، پروڈکٹ لیبلز)؛ اور
- قابلِ اعتماد multi-reference editing (متعدد تصاویر میں موجود عناصر کو یکجا کرنا جبکہ شناخت/تسلسل برقرار رہے)۔
FLUX.2 کو مختلف پروڈکٹ ویریئنٹس (Pro, Flex, Dev, Klein) کی صورت میں پیش کیا جاتا ہے جو مختلف استعمال کے انداز کو ہدف بناتے ہیں — Flex، Pro (اعلیٰ ترین کوالٹی + مقررہ لیٹینسی) اور Dev (ریسرچ/لوکل استعمال کے لیے اوپن ویٹ چیک پوائنٹ) کے درمیان واقع ہے۔
کلیدی فیچرز (FLUX.2 Flex کیا لاتا ہے)
- قابلِ کنٹرول جنریشن: واضح پیرا میٹرز (steps, guidance scale) تاکہ رفتار بمقابلہ پرامپٹ وفاداری کا توازن قائم کیا جا سکے۔
- اعلیٰ ریزولوشن آؤٹ پٹ: پیداواری سطح کے آؤٹ پٹس تک قابل، زیادہ سے زیادہ 4 میگا پکسل (4MP) کے ساتھ، جبکہ جزئیات محفوظ رہتی ہیں۔
- ملٹی ریفرنس اِن پٹس: متعدد حوالہ تصاویر قبول کرتا ہے (Flex میں زیادہ سے زیادہ 10 ریفرنس تصاویر؛ Dev/Pro میں یہ تعداد ٹئیر کے مطابق مختلف ہے)۔ اس سے مختلف آؤٹ پٹس میں کردار/پروڈکٹ کی یکسان رینڈرنگ ممکن ہوتی ہے۔
- بہتر ٹائپوگرافی اور ٹیکسٹ رینڈرنگ: BFL نے گلفس، کرننگ اور ملٹی لائن لے آؤٹس کی رینڈرنگ میں نمایاں بہتری پر زور دیا ہے — جس سے FLUX.2 UI، پیکیجنگ اور انفोगرافکس کے لیے پرکشش بنتا ہے۔
- Managed API کے ساتھ میگا پکسل پرائزنگ (قابلِ پیش بینی لاگت ماڈل): Flex کے لیے قیمت فی میگا پکسل ماڈل پر مبنی ہے (قیمت کے سیکشن ملاحظہ کریں)۔
FLUX.2 Flex کی تکنیکی تفصیلات
بنیادی ساخت: FLUX.2 ایک latent flow-matching بیک بون (flow transformer) استعمال کرتا ہے جسے ایک vision-language model کے ساتھ ملایا گیا ہے (BFL کے مطابق یہ Mistral-3 24B VLM کو rectified flow transformer کے ساتھ جوڑتا ہے)۔ FLUX.2 میں استعمال ہونے والا VAE دوبارہ تربیت کیا گیا تاکہ learnability/quality/compression کے توازن میں بہتری لائی جا سکے۔ یہ انتخاب world knowledge، ترکیبی منطق اور پرامپٹ کی سخت پابندی میں مدد دیتے ہیں۔
FLUX.2 : عام طور پر رپورٹ کردہ جنریشن اوقات ~22 s (صرف متن) اور ~40 s (اِن پٹ امیج کے ساتھ) ہیں، زیادہ سے زیادہ 10 اِن پٹس قبول کرتا ہے اور CometAPI پر تقریباً $0.048 فی میگا پکسل (اِن پٹ + آؤٹ پٹ مجموعی) قیمت پر دستیاب ہے۔
ماڈل نام: black-forest-labs/flux-2-flex
Input constraints: Flex متعدد اِن پٹس قبول کرتا ہے (managed پیشکش میں زیادہ سے زیادہ 10 اِن پٹس) اور کُل اِن پٹ میگا پکسل حد نافذ ہے (ایک مجموعی اِن پٹ کی زیادہ سے زیادہ حد 14MP بتائی گئی ہے)۔ 4MP سے زائد آؤٹ پٹ ریزولوشن عموماً ڈاؤن سیمپل کیا جاتا ہے یا سروس کے ذریعے محدود ہوتا ہے۔
FLUX.2 Flex کی بینچ مارک کارکردگی
ہیومن اسٹائل ون ریٹ ایویلیوایشن (vendor benchmark): BFL کے شائع کردہ سربہ سر ٹیسٹس میں، FLUX.2 ویریئنٹس (خصوصاً ) نے معاصر اوپن ماڈلز کے مقابلے میں مضبوط جیت کی شرح دکھائی: ~66.6% ٹیکسٹ ٹو امیج میں، 59.8% سنگل ریفرنس ایڈٹنگ میں اور 63.6% ملٹی ریفرنس ایڈٹنگ میں۔ BFL نے ELO بمقابلہ فی تصویر لاگت کا ایک چارٹ بھی پیش کیا جس میں FLUX.2 ویریئنٹس کو ~1030–1050 ELO بینڈ میں رکھا گیا، جبکہ فی تصویر لاگت 2–6 سینٹ کی حد میں تھی۔
FLUX.2 Flex کی حدود
- ریفرنسز/ریزولوشن کے ساتھ لاگت کا بڑھنا: Flex فی میگا پکسل پرائزنگ استعمال کرتا ہے۔ متعدد ریفرنس تصاویر شامل کرنے یا آؤٹ پٹ ریزولوشن بڑھانے سے، اعلان کردہ میگا پکسل ماڈل کے تحت لاگت خطی طور پر بڑھتی ہے۔ ایسے ورک فلو میں جو بہت سے ریفرنسز کے ساتھ تکرار کرتے ہیں، لاگت تیزی سے جمع ہو سکتی ہے۔
- پرامپٹ/تسلسل کی ناکامی کے امکانات: اگرچہ FLUX.2 کردار کے تسلسل میں بہتری لاتا ہے، پیچیدہ ملٹی ایٹریبیوٹ پرامپٹس اب بھی ناکامیاں پیدا کر سکتے ہیں (آرٹیفیکٹس، غیر متوقع بلینڈنگ، یا پوز/شناخت میں ڈرفٹ) جو پرامپٹ ڈیزائن اور ریفرنسز کی تعداد پر منحصر ہیں۔
- مواد اور سیفٹی: اگرچہ BFL اعتدال/خلاف ورزی اِن پٹس کے ٹیسٹس میں مضبوط مزاحمت کی رپورٹ دیتا ہے، امیج ماڈلز کامل نہیں؛ بحقِ کاپی مواد، نقالی یا غیر محفوظ مواد پیدا ہونے کے خطرات برقرار رہتے ہیں۔
عمومی / تجویز کردہ استعمالات
- اشتہاری اور مارکیٹنگ امیج ویریئنٹس جہاں ایک ہی ماڈل/اداکار/پروڈکٹ کو متعدد مناظر یا پس منظر میں یکساں رکھنا ضروری ہو (ملٹی ریفرنس تسلسل)۔
- پروڈکٹ فوٹوگرافی اور ورچوئل ٹرائی آن (پس منظر بدلنے کے ساتھ پروڈکٹ کی جزئیات برقرار رکھنا)۔
- اداریہ/فیشن اسپریڈز جن میں متعدد شاٹس میں ایک ہی شناخت درکار ہو۔
- تیز رفتار پروٹو ٹائپنگ اور ریسرچ (Dev چیک پوائنٹ تجربات، فائن ٹیوننگ اور LoRA/ایڈاپٹر ورک فلو کی سہولت دیتا ہے)۔
Flux.2 Flex API تک کیسے رسائی حاصل کریں
Step 1: API Key کے لیے سائن اپ کریں
cometapi.com پر لاگ ان کریں۔ اگر آپ ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI کنسول میں سائن ان کریں۔ انٹرفیس کی رسائی اسناد API key حاصل کریں۔ پرسنل سینٹر میں API ٹوکن پر “Add Token” پر کلک کریں، ٹوکن کلید حاصل کریں: sk-xxxxx اور سبمٹ کریں۔
Step 2: Flux.2 Flex API کو ریکویسٹ بھیجیں
“black-forest-labs/flux-2-flex ” اینڈ پوائنٹ منتخب کریں تاکہ API ریکویسٹ بھیجی جا سکے اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کے API ڈاک سے حاصل کیے جاتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ <YOUR_API_KEY> کو اپنے اکاؤنٹ کے اصل CometAPI key سے تبدیل کریں۔
اپنا سوال یا درخواست content فیلڈ میں درج کریں — اسی پر ماڈل ردعمل دے گا۔ API ریسپانس کو پروسیس کریں تاکہ تیار شدہ جواب حاصل ہو۔
Step 3: نتائج حاصل کریں اور توثیق کریں
API ریسپانس کو پروسیس کریں تاکہ تیار شدہ جواب حاصل ہو۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔
CometAPI اب Replicate فارمیٹ ماڈلز کو سپورٹ کرتا ہے: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
محدود مدت کی پیشکش: Replicate کی آفیشل پرائزنگ سے کم!
👇 ابھی بلڈنگ شروع کریں Predictions بنائیں — API دستاویز
⚡ لچکدار انتخاب:
- Pro: اعلیٰ کارکردگی والی پیداوار اور تیز تر ڈیلیوری کے لیے ڈیزائن کیا گیا۔
- Flex: قابلِ ایڈجسٹ پیرا میٹرز کے ساتھ امیج کوالٹی کو زیادہ سے زیادہ کرتا ہے۔
- Dev: ڈویلپر دوست آپٹمائزیشن۔