R

Black Forest Labs/FLUX 2 DEV

ต่อคำขอ:$0.06
FLUX 2 DEV เป็นเวอร์ชันที่เป็นมิตรต่อนักพัฒนา ซึ่งได้รับการปรับแต่งเพื่อการวิจัย การทดลอง และการใช้งานที่ไม่เชิงพาณิชย์ มอบความสามารถในการสร้างภาพที่ทรงพลังให้แก่นักพัฒนา โดยรักษาสมดุลระหว่างคุณภาพและประสิทธิภาพในการประมวลผล เหมาะอย่างยิ่งสำหรับการสร้างต้นแบบ งานวิจัยเชิงวิชาการ และโครงการสร้างสรรค์ส่วนบุคคล
ใหม่
ใช้งานเชิงพาณิชย์

คุณสมบัติหลัก (สิ่งที่ Flux.2 Dev ทำได้)

  • การสร้างภาพจากข้อความ ด้วยความสอดคล้องตามพรอมป์สูงและการเรนเดอร์ตัวพิมพ์ / รายละเอียดเล็กๆ ที่ดีขึ้น
  • การแก้ไขแบบหลายอ้างอิง — ผสานภาพอ้างอิงหลายภาพเป็นเอาต์พุตเดียว โดยคงความสม่ำเสมอของตัวตน/สไตล์
  • เช็กพอยต์เดียวสำหรับการสร้าง + การแก้ไข (ไม่ต้องใช้โมเดลแก้ไขแยกต่างหาก)
  • เช็กพอยต์แบบเปิดที่มีขนาดใหญ่ (32B) รองรับการวิจัยภายในเครื่อง การควอนไทซ์ และการปรับใช้โดยชุมชน.)
  • VAE ที่ปรับให้เหมาะสม เพื่อสมดุลระหว่างความสามารถในการเรียนรู้–คุณภาพ–การบีบอัดที่ดียิ่งขึ้น (รองรับการแก้ไข/ผลลัพธ์ระดับ 4MP)

รายละเอียดทางเทคนิค (สถาปัตยกรรม & วิศวกรรม)

  • จำนวนพารามิเตอร์: 32 พันล้านพารามิเตอร์สำหรับเช็กพอยต์ FLUX.2
  • การออกแบบหลัก: latent flow-matching / rectified flow transformer ผสานกับโมเดลวิสัยทัศน์–ภาษา (BFL ระบุว่าผสาน Mistral-3 24B VLM เข้ากับแกนหลักของทรานส์ฟอร์เมอร์เพื่อการยึดโยงเชิงความหมาย) โดย VLM ให้ความรู้เกี่ยวกับโลกและการยึดโยงเชิงข้อความ ส่วนทรานส์ฟอร์เมอร์ทำหน้าที่จำลองโครงสร้างเชิงพื้นที่/เชิงองค์ประกอบ
  • VAE: FLUX.2 VAE ใหม่ (เผยแพร่ภายใต้ Apache-2.0) ฝึกใหม่เพื่อปรับปรุงความเที่ยงตรงในการกู้คืนภาพและความสามารถในการเรียนรู้ของ latent ช่วยให้แก้ไขความละเอียดสูงได้
  • การสุ่มตัวอย่าง & การกลั่น: ฝึกด้วยเทคนิค guidance-distillation เพื่อเพิ่มประสิทธิภาพและความเที่ยงตรงในการอนุมาน

ผลงานบนเบนช์มาร์ก

Black Forest Labs เผยแพร่การประเมินและกราฟเปรียบเทียบที่แสดงประสิทธิภาพของ FLUX.2 เมื่อเทียบกับโมเดลสร้างภาพแบบเปิดน้ำหนักและแบบโฮสต์ร่วมสมัย ตัวเลขสำคัญที่เผยแพร่ (จาก BFL / สรุปข่าวประชาสัมพันธ์):

  • อัตราการชนะ Text-to-image: FLUX.2 ~66.6% (เทียบกับ Qwen-Image 51.3%, Hunyuan ~48.1% บนชุดข้อมูลเปรียบเทียบตัวต่อตัวของ BFL)
  • อัตราการชนะการแก้ไขแบบอ้างอิงเดียว: FLUX.2 ~59.8% (เทียบกับ Qwen-Image 49.3%, FLUX.1 Kontext ~41.2%)
  • อัตราการชนะการแก้ไขแบบหลายอ้างอิง: FLUX.2 ~63.6% (เทียบกับ Qwen-Image 36.4%) BFL ยังรายงานความสามารถแบบหลายอ้างอิงได้สูงสุดถึง 10 อ้างอิง ในชุดประเมินของตน

กรณีใช้งานทั่วไป / แนะนำ

  • เวอร์ชันภาพโฆษณาและการตลาด ที่ต้องรักษาความคงที่ของโมเดล/นักแสดง/สินค้า ผ่านหลายฉากหรือพื้นหลัง (ความสม่ำเสมอแบบหลายอ้างอิง)
  • ภาพถ่ายสินค้า & การลองสวมใส่เสมือน (รักษารายละเอียดสินค้าแม้เปลี่ยนพื้นหลัง)
  • สกู๊ปบรรณาธิการ/แฟชัน ที่ต้องคงตัวตนเดียวกันในหลายช็อต
  • การสร้างต้นแบบรวดเร็วและงานวิจัย (เช็กพอยต์สำหรับนักพัฒนา รองรับการทดลอง ปรับแต่ง และเวิร์กโฟลว์ LoRA/adapter)

วิธีเข้าถึง Flux.2 dev API

ขั้นตอนที่ 1: สมัครรับ API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ โปรดลงทะเบียนก่อน จากนั้นลงชื่อเข้าใช้ คอนโซล CometAPI รับ API key ของอินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx และส่ง

Flux.2 Dev API

ขั้นตอนที่ 2: ส่งคำขอถึง Flux.2 dev API

เลือกปลายทาง “black-forest-labs/flux-2-dev” เพื่อส่งคำขอ API และกำหนด request body วิธีการเรียกและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมี Apifox สำหรับทดสอบเพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ

ใส่คำถามหรือคำขอลงในฟิลด์ content — ซึ่งเป็นสิ่งที่โมเดลจะตอบสนอง จากนั้นประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต

CometAPI ขณะนี้รองรับโมเดลรูปแบบ Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex

โปรโมชันเวลาจำกัด: ราคาต่ำกว่าทางการของ Replicate!

👇 เริ่มสร้างตอนนี้ Create Predictions – เอกสาร API

⚡ ตัวเลือกที่ยืดหยุ่น:

  • Pro: ออกแบบเพื่อการผลิตที่มีประสิทธิภาพสูงและส่งมอบรวดเร็ว
  • Flex: เพิ่มคุณภาพภาพให้สูงสุดพร้อมพารามิเตอร์ที่ปรับได้
  • Dev: การปรับให้เหมาะกับนักพัฒนา

คำถามที่พบบ่อย