คุณสมบัติหลัก (สิ่งที่ Flux.2 Dev ทำได้)
- การสร้างภาพจากข้อความ ด้วยความสอดคล้องตามพรอมป์สูงและการเรนเดอร์ตัวพิมพ์ / รายละเอียดเล็กๆ ที่ดีขึ้น
- การแก้ไขแบบหลายอ้างอิง — ผสานภาพอ้างอิงหลายภาพเป็นเอาต์พุตเดียว โดยคงความสม่ำเสมอของตัวตน/สไตล์
- เช็กพอยต์เดียวสำหรับการสร้าง + การแก้ไข (ไม่ต้องใช้โมเดลแก้ไขแยกต่างหาก)
- เช็กพอยต์แบบเปิดที่มีขนาดใหญ่ (32B) รองรับการวิจัยภายในเครื่อง การควอนไทซ์ และการปรับใช้โดยชุมชน.)
- VAE ที่ปรับให้เหมาะสม เพื่อสมดุลระหว่างความสามารถในการเรียนรู้–คุณภาพ–การบีบอัดที่ดียิ่งขึ้น (รองรับการแก้ไข/ผลลัพธ์ระดับ 4MP)
รายละเอียดทางเทคนิค (สถาปัตยกรรม & วิศวกรรม)
- จำนวนพารามิเตอร์: 32 พันล้านพารามิเตอร์สำหรับเช็กพอยต์ FLUX.2
- การออกแบบหลัก: latent flow-matching / rectified flow transformer ผสานกับโมเดลวิสัยทัศน์–ภาษา (BFL ระบุว่าผสาน Mistral-3 24B VLM เข้ากับแกนหลักของทรานส์ฟอร์เมอร์เพื่อการยึดโยงเชิงความหมาย) โดย VLM ให้ความรู้เกี่ยวกับโลกและการยึดโยงเชิงข้อความ ส่วนทรานส์ฟอร์เมอร์ทำหน้าที่จำลองโครงสร้างเชิงพื้นที่/เชิงองค์ประกอบ
- VAE: FLUX.2 VAE ใหม่ (เผยแพร่ภายใต้ Apache-2.0) ฝึกใหม่เพื่อปรับปรุงความเที่ยงตรงในการกู้คืนภาพและความสามารถในการเรียนรู้ของ latent ช่วยให้แก้ไขความละเอียดสูงได้
- การสุ่มตัวอย่าง & การกลั่น: ฝึกด้วยเทคนิค guidance-distillation เพื่อเพิ่มประสิทธิภาพและความเที่ยงตรงในการอนุมาน
ผลงานบนเบนช์มาร์ก
Black Forest Labs เผยแพร่การประเมินและกราฟเปรียบเทียบที่แสดงประสิทธิภาพของ FLUX.2 เมื่อเทียบกับโมเดลสร้างภาพแบบเปิดน้ำหนักและแบบโฮสต์ร่วมสมัย ตัวเลขสำคัญที่เผยแพร่ (จาก BFL / สรุปข่าวประชาสัมพันธ์):
- อัตราการชนะ Text-to-image: FLUX.2 ~66.6% (เทียบกับ Qwen-Image 51.3%, Hunyuan ~48.1% บนชุดข้อมูลเปรียบเทียบตัวต่อตัวของ BFL)
- อัตราการชนะการแก้ไขแบบอ้างอิงเดียว: FLUX.2 ~59.8% (เทียบกับ Qwen-Image 49.3%, FLUX.1 Kontext ~41.2%)
- อัตราการชนะการแก้ไขแบบหลายอ้างอิง: FLUX.2 ~63.6% (เทียบกับ Qwen-Image 36.4%) BFL ยังรายงานความสามารถแบบหลายอ้างอิงได้สูงสุดถึง 10 อ้างอิง ในชุดประเมินของตน
กรณีใช้งานทั่วไป / แนะนำ
- เวอร์ชันภาพโฆษณาและการตลาด ที่ต้องรักษาความคงที่ของโมเดล/นักแสดง/สินค้า ผ่านหลายฉากหรือพื้นหลัง (ความสม่ำเสมอแบบหลายอ้างอิง)
- ภาพถ่ายสินค้า & การลองสวมใส่เสมือน (รักษารายละเอียดสินค้าแม้เปลี่ยนพื้นหลัง)
- สกู๊ปบรรณาธิการ/แฟชัน ที่ต้องคงตัวตนเดียวกันในหลายช็อต
- การสร้างต้นแบบรวดเร็วและงานวิจัย (เช็กพอยต์สำหรับนักพัฒนา รองรับการทดลอง ปรับแต่ง และเวิร์กโฟลว์ LoRA/adapter)
วิธีเข้าถึง Flux.2 dev API
ขั้นตอนที่ 1: สมัครรับ API Key
เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ โปรดลงทะเบียนก่อน จากนั้นลงชื่อเข้าใช้ คอนโซล CometAPI รับ API key ของอินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx และส่ง

ขั้นตอนที่ 2: ส่งคำขอถึง Flux.2 dev API
เลือกปลายทาง “black-forest-labs/flux-2-dev” เพื่อส่งคำขอ API และกำหนด request body วิธีการเรียกและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมี Apifox สำหรับทดสอบเพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ
ใส่คำถามหรือคำขอลงในฟิลด์ content — ซึ่งเป็นสิ่งที่โมเดลจะตอบสนอง จากนั้นประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น
ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์
ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต
CometAPI ขณะนี้รองรับโมเดลรูปแบบ Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
โปรโมชันเวลาจำกัด: ราคาต่ำกว่าทางการของ Replicate!
👇 เริ่มสร้างตอนนี้ Create Predictions – เอกสาร API
⚡ ตัวเลือกที่ยืดหยุ่น:
- Pro: ออกแบบเพื่อการผลิตที่มีประสิทธิภาพสูงและส่งมอบรวดเร็ว
- Flex: เพิ่มคุณภาพภาพให้สูงสุดพร้อมพารามิเตอร์ที่ปรับได้
- Dev: การปรับให้เหมาะกับนักพัฒนา