اہم خصوصیات (Flux.2 Dev کیا کرتا ہے)
- متن→تصویر جنریشن بہترین پرامپٹ پابندی اور بہتر ٹائپوگرافی / چھوٹی تفصیلات کی رینڈرنگ کے ساتھ۔
- ملٹی-ریفرنس ایڈیٹنگ — متعدد حوالہ جاتی تصاویر کو ایک ہی آؤٹ پٹ میں یکجا کریں، جبکہ شناخت/اسٹائل کی مطابقت برقرار رہے
- جنریشن + ایڈیٹنگ کے لیے ایک ہی چیک پوائنٹ (الگ ایڈیٹنگ ماڈل درکار نہیں)۔
- بڑا اوپن-ویٹ چیک پوائنٹ (32B) جو لوکل ریسرچ، کوانٹائزیشن، اور کمیونٹی ایڈاپٹیشن کی اجازت دیتا ہے۔)
- آپٹمائزڈ VAE بہتر learnability–quality–compression توازن کے لیے (4MP ایڈیٹنگ/آؤٹ پٹس کو ممکن بناتا ہے)۔
تکنیکی تفصیلات (آرکیٹیکچر اور انجینئرنگ)
- پیرامیٹر کاؤنٹ: FLUX.2 چیک پوائنٹ کے لیے 32 ارب پیرامیٹرز۔
- بنیادی ڈیزائن: latent flow-matching / rectified flow transformer کو ایک vision-language model کے ساتھ ملایا گیا ہے (BFL کے مطابق وہ semantic grounding کے لیے ایک Mistral-3 24B VLM کو transformer backbone کے ساتھ couple کرتے ہیں)۔ VLM دنیاوی علم اور متنی grounding فراہم کرتا ہے جبکہ transformer مکانی/ترکیبی ساخت کو ماڈل کرتا ہے۔
- VAE: نیا FLUX.2 VAE (Apache-2.0 کے تحت جاری کیا گیا) reconstruction fidelity اور latent learnability کو بہتر بنانے کے لیے دوبارہ تربیت دیا گیا، جس سے ہائی-ریزولوشن ایڈیٹنگ ممکن ہوتی ہے۔
- سیمپلنگ اور ڈسٹلیشن: inference efficiency اور fidelity کو بہتر بنانے کے لیے guidance-distillation تکنیکوں کے ساتھ تربیت دی گئی۔
بینچ مارک کارکردگی
Black Forest Labs نے تقابلی جائزے اور چارٹس شائع کیے ہیں جو FLUX.2 کی کارکردگی کو موجودہ open-weight اور hosted image models کے مقابلے میں دکھاتے ہیں۔ اہم شائع شدہ اعداد و شمار (BFL / پریس خلاصے):
- متن سے تصویر جیت کی شرح: FLUX.2 ~66.6% (vs. Qwen-Image 51.3%, Hunyuan ~48.1% BFL کے head-to-head dataset میں)۔
- سنگل-ریفرنس ایڈیٹنگ جیت کی شرح: FLUX.2 ~59.8% (vs. Qwen-Image 49.3%, FLUX.1 Kontext ~41.2%)۔
- ملٹی-ریفرنس ایڈیٹنگ جیت کی شرح: FLUX.2 ~63.6% (vs. Qwen-Image 36.4%)۔ BFL اپنی evaluation suite میں 10 references تک ملٹی-ریفرنس صلاحیت کی بھی رپورٹ کرتا ہے۔
عام / تجویز کردہ استعمال کے کیسز
- اشتہاری اور مارکیٹنگ تصویری ویریئنٹس جہاں ایک ہی ماڈل/اداکار/پروڈکٹ کو متعدد مناظر یا بیک گراؤنڈز میں یکساں رہنا ہو (ملٹی-ریفرنس مطابقت)۔
- پروڈکٹ فوٹوگرافی اور ورچوئل ٹرائی-آن (مختلف بیک گراؤنڈز میں پروڈکٹ کی تفصیلات محفوظ رکھنا)۔
- ادارتی/فیشن اسپریڈز جن میں متعدد شاٹس میں ایک ہی شناخت درکار ہو۔
- تیز رفتار پروٹو ٹائپنگ اور ریسرچ (dev چیک پوائنٹ تجربات، فائن-ٹیوننگ، اور LoRA/adapter ورک فلوز کی اجازت دیتا ہے)۔
Flux.2 dev API تک رسائی کیسے حاصل کریں
مرحلہ 1: API Key کے لیے سائن اپ کریں
cometapi.com میں لاگ ان کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن ان کریں۔ انٹرفیس کی رسائی کی اسناد API key حاصل کریں۔ ذاتی مرکز میں API token پر “Add Token” پر کلک کریں، token key حاصل کریں: sk-xxxxx اور جمع کریں۔

مرحلہ 2: Flux.2 dev API کو Requests بھیجیں
API request بھیجنے کے لیے “black-forest-labs/flux-2-dev ”endpoint منتخب کریں اور request body سیٹ کریں۔ request method اور request body ہماری ویب سائٹ کے API doc سے حاصل کیے جاتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ <YOUR_API_KEY> کو اپنے اکاؤنٹ سے حاصل کردہ حقیقی CometAPI key سے تبدیل کریں۔
اپنا سوال یا درخواست content field میں درج کریں—اسی کا ماڈل جواب دے گا۔ generated answer حاصل کرنے کے لیے API response کو پروسیس کریں۔
مرحلہ 3: نتائج حاصل کریں اور تصدیق کریں
generated answer حاصل کرنے کے لیے API response کو پروسیس کریں۔ پروسیسنگ کے بعد، API task status اور output data کے ساتھ جواب دیتا ہے۔
CometAPI اب Replicate Format Models کو سپورٹ کر رہا ہے: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
محدود وقت کی پروموشن: Replicate کی سرکاری قیمتوں سے بھی کم!
👇 ابھی بنانا شروع کریں Create Predictions – API Doc
⚡ Flexible Selection:
- Pro: اعلیٰ کارکردگی والی پروڈکشن اور تیز تر ڈیلیوری کے لیے ڈیزائن کیا گیا۔
- Flex: قابلِ ایڈجسٹ پیرامیٹرز کے ساتھ تصویر کے معیار کو زیادہ سے زیادہ بناتا ہے۔
- Dev: ڈویلپر دوست آپٹمائزیشن۔