Is FLUX.2 [dev] free to use?

ใช่ FLUX.2 [dev] เปิดให้ใช้งานฟรีสำหรับการพัฒนาและการทดสอบภายในเครื่องที่ไม่ใช่เชิงพาณิชย์

Can I use FLUX.2 [dev] for commercial projects?

ไม่ได้ FLUX.2 [dev] ได้รับอนุญาตให้ใช้สำหรับการใช้งานที่ไม่ใช่เชิงพาณิชย์เท่านั้น สำหรับการใช้งานเชิงพาณิชย์ คุณควรใช้โมเดล API [pro], [flex] หรือ [max]

Where can I download the FLUX.2 [dev] weights?

weights ของ FLUX.2 [dev] พร้อมให้ดาวน์โหลดบน HuggingFace สำหรับการดีพลอย inference ภายในเครื่อง

What are the hardware requirements for running FLUX.2 [dev] locally?

แม้ว่าข้อกำหนดที่แน่นอนจะแตกต่างกันไป แต่โดยทั่วไปการพัฒนาภายในเครื่องต้องใช้ GPU ประสิทธิภาพสูงที่มี VRAM จำนวนมาก (เช่น 24GB+) เพื่อรองรับสถาปัตยกรรมของโมเดลได้อย่างมีประสิทธิภาพ

Does FLUX.2 [dev] support the same features as the API models?

FLUX.2 [dev] อนุญาตให้ปรับแต่งได้เต็มรูปแบบและรองรับฟีเจอร์หลัก เช่น text-to-image และการแก้ไขพื้นฐาน แต่ไม่มีฟีเจอร์เฉพาะบนคลาวด์ เช่น grounding search ที่มีอยู่ใน [max]

What is the recommended multi-reference limit for FLUX.2 [dev]?

สำหรับการพัฒนาภายในเครื่องด้วย FLUX.2 [dev] เอกสารแนะนำให้ใช้ภาพอ้างอิงสูงสุด 6 ภาพ เมื่อเทียบกับ 8-10 ภาพที่รองรับผ่าน API

Can I fine-tune FLUX.2 [dev]?

ได้ ในฐานะโมเดล open-weight นั้น FLUX.2 [dev] สามารถใช้เป็นฐานสำหรับการปรับจูนโดยชุมชนและการพัฒนา LoRA แบบกำหนดเอง

API Black Forest Labs/FLUX 2 DEV ราคาประหยัด | text-to-image

คุณสมบัติหลัก (สิ่งที่ Flux.2 Dev ทำได้)

การสร้างภาพจากข้อความ ด้วยความสอดคล้องตามพรอมป์สูงและการเรนเดอร์ตัวพิมพ์ / รายละเอียดเล็กๆ ที่ดีขึ้น
การแก้ไขแบบหลายอ้างอิง — ผสานภาพอ้างอิงหลายภาพเป็นเอาต์พุตเดียว โดยคงความสม่ำเสมอของตัวตน/สไตล์
เช็กพอยต์เดียวสำหรับการสร้าง + การแก้ไข (ไม่ต้องใช้โมเดลแก้ไขแยกต่างหาก)
เช็กพอยต์แบบเปิดที่มีขนาดใหญ่ (32B) รองรับการวิจัยภายในเครื่อง การควอนไทซ์ และการปรับใช้โดยชุมชน.)
VAE ที่ปรับให้เหมาะสม เพื่อสมดุลระหว่างความสามารถในการเรียนรู้–คุณภาพ–การบีบอัดที่ดียิ่งขึ้น (รองรับการแก้ไข/ผลลัพธ์ระดับ 4MP)

รายละเอียดทางเทคนิค (สถาปัตยกรรม & วิศวกรรม)

จำนวนพารามิเตอร์: 32 พันล้านพารามิเตอร์สำหรับเช็กพอยต์ FLUX.2
การออกแบบหลัก: latent flow-matching / rectified flow transformer ผสานกับโมเดลวิสัยทัศน์–ภาษา (BFL ระบุว่าผสาน Mistral-3 24B VLM เข้ากับแกนหลักของทรานส์ฟอร์เมอร์เพื่อการยึดโยงเชิงความหมาย) โดย VLM ให้ความรู้เกี่ยวกับโลกและการยึดโยงเชิงข้อความ ส่วนทรานส์ฟอร์เมอร์ทำหน้าที่จำลองโครงสร้างเชิงพื้นที่/เชิงองค์ประกอบ
VAE: FLUX.2 VAE ใหม่ (เผยแพร่ภายใต้ Apache-2.0) ฝึกใหม่เพื่อปรับปรุงความเที่ยงตรงในการกู้คืนภาพและความสามารถในการเรียนรู้ของ latent ช่วยให้แก้ไขความละเอียดสูงได้
การสุ่มตัวอย่าง & การกลั่น: ฝึกด้วยเทคนิค guidance-distillation เพื่อเพิ่มประสิทธิภาพและความเที่ยงตรงในการอนุมาน

ผลงานบนเบนช์มาร์ก

Black Forest Labs เผยแพร่การประเมินและกราฟเปรียบเทียบที่แสดงประสิทธิภาพของ FLUX.2 เมื่อเทียบกับโมเดลสร้างภาพแบบเปิดน้ำหนักและแบบโฮสต์ร่วมสมัย ตัวเลขสำคัญที่เผยแพร่ (จาก BFL / สรุปข่าวประชาสัมพันธ์):

อัตราการชนะ Text-to-image: FLUX.2 ~66.6% (เทียบกับ Qwen-Image 51.3%, Hunyuan ~48.1% บนชุดข้อมูลเปรียบเทียบตัวต่อตัวของ BFL)
อัตราการชนะการแก้ไขแบบอ้างอิงเดียว: FLUX.2 ~59.8% (เทียบกับ Qwen-Image 49.3%, FLUX.1 Kontext ~41.2%)
อัตราการชนะการแก้ไขแบบหลายอ้างอิง: FLUX.2 ~63.6% (เทียบกับ Qwen-Image 36.4%) BFL ยังรายงานความสามารถแบบหลายอ้างอิงได้สูงสุดถึง 10 อ้างอิง ในชุดประเมินของตน

กรณีใช้งานทั่วไป / แนะนำ

เวอร์ชันภาพโฆษณาและการตลาด ที่ต้องรักษาความคงที่ของโมเดล/นักแสดง/สินค้า ผ่านหลายฉากหรือพื้นหลัง (ความสม่ำเสมอแบบหลายอ้างอิง)
ภาพถ่ายสินค้า & การลองสวมใส่เสมือน (รักษารายละเอียดสินค้าแม้เปลี่ยนพื้นหลัง)
สกู๊ปบรรณาธิการ/แฟชัน ที่ต้องคงตัวตนเดียวกันในหลายช็อต
การสร้างต้นแบบรวดเร็วและงานวิจัย (เช็กพอยต์สำหรับนักพัฒนา รองรับการทดลอง ปรับแต่ง และเวิร์กโฟลว์ LoRA/adapter)

วิธีเข้าถึง Flux.2 dev API

ขั้นตอนที่ 1: สมัครรับ API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ โปรดลงทะเบียนก่อน จากนั้นลงชื่อเข้าใช้ คอนโซล CometAPI รับ API key ของอินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx และส่ง

Flux.2 Dev API

ขั้นตอนที่ 2: ส่งคำขอถึง Flux.2 dev API

เลือกปลายทาง “black-forest-labs/flux-2-dev” เพื่อส่งคำขอ API และกำหนด request body วิธีการเรียกและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมี Apifox สำหรับทดสอบเพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ

ใส่คำถามหรือคำขอลงในฟิลด์ content — ซึ่งเป็นสิ่งที่โมเดลจะตอบสนอง จากนั้นประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต

CometAPI ขณะนี้รองรับโมเดลรูปแบบ Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex

โปรโมชันเวลาจำกัด: ราคาต่ำกว่าทางการของ Replicate!

👇 เริ่มสร้างตอนนี้ Create Predictions – เอกสาร API

⚡ ตัวเลือกที่ยืดหยุ่น:

Pro: ออกแบบเพื่อการผลิตที่มีประสิทธิภาพสูงและส่งมอบรวดเร็ว
Flex: เพิ่มคุณภาพภาพให้สูงสุดพร้อมพารามิเตอร์ที่ปรับได้
Dev: การปรับให้เหมาะกับนักพัฒนา

Black Forest Labs/FLUX 2 DEV