คุณสมบัติหลัก (สิ่งที่ FLUX.2-Pro นำเสนอ)
- คุณภาพเชิงผลิตจริง: มุ่งเป้าไปที่สายงานเชิงพาณิชย์ด้วยเวลาแฝงที่คาดการณ์ได้และความสมจริงทางภาพสูง (เอาต์พุตเหมือนภาพถ่ายสูงสุดประมาณ ~4 เมกะพิกเซล)
- การกำหนดเงื่อนไขจากหลายอ้างอิง: API รองรับการใช้อ้างอิงได้สูงสุด 8 รายการผ่าน API และรักษาความคงเส้นคงวาของตัวละคร/สไตล์ระหว่างเอาต์พุต — มีประโยชน์สำหรับความต่อเนื่องของแบรนด์หรือตัวละคร
- ไทโปกราฟีและเลย์เอาต์ที่ดีขึ้น: การเรนเดอร์ข้อความที่เด่นชัด อ่านง่ายขึ้นสำหรับ UI, อินโฟกราฟิก และโลโก้ เมื่อเทียบกับโมเดลก่อนหน้าหลายตัว
- เอาต์พุตแบบกำหนดแน่นอนและความแปรปรวนต่ำ: ระดับ Pro ได้รับการปรับแต่งเพื่อลดการพรอมป์แบบวนซ้ำและรอบเวลาในการผลิต
- เครื่องมือด้านแหล่งที่มาของเนื้อหาและความปลอดภัย: API ฝังเมทาดาตา C2PA ที่ลงนามด้วยการเข้ารหัสไว้ในเอาต์พุต; เอ็นด์พอยต์ที่โฮสต์มีตัวกรองและการกลั่นกรองระหว่างการอนุมาน
- การอนุมานแบบหน่วงต่ำและคาดการณ์ได้ (ความเร็วการสร้าง “ต่ำกว่า 10 วินาที” และ SLA สำหรับ Pro)
รายละเอียดเชิงเทคนิคของ FLUX.2 Pro
- สถาปัตยกรรมแกนหลัก: FLUX.2 ใช้วิธีการแบบ latent flow-matching ร่วมกับ rectified-flow transformer ที่ทำงานใน latent space ที่เรียนรู้แล้ว การออกแบบนี้ผสานแกน transformer นั้นเข้ากับ Mistral-3 24B vision-language model เพื่อให้การยึดโยงเชิงความหมายและความรู้เกี่ยวกับโลกระหว่างการสังเคราะห์
- VAE และการออกแบบ latent ใหม่: BFL เปิดตัว FLUX.2 VAE เวอร์ชันอัปเดต (Apache-2.0) ที่ปรับสมดุลระหว่างการบีบอัด ความเที่ยงตรงของการกู้คืน และความสามารถในการเรียนรู้ — ช่วยให้การแก้ไขคุณภาพสูงขึ้นที่ความละเอียดระดับหลายเมกะพิกเซล VAE ที่ใช้ร่วมกันนี้เป็นฐานให้กับทุกรุ่นย่อยของ FLUX.2 เพื่อการทำงานร่วมกันและผลลัพธ์การแก้ไขที่สม่ำเสมอมากขึ้น
- พฤติกรรมการอนุมาน / เทคนิคการฝึก: เช็คพอยต์ Dev ได้รับการฝึกด้วยเทคนิคอย่าง guidance distillation เพื่อให้การสุ่มตัวอย่างมีประสิทธิภาพขึ้นและรองรับการสุ่มตัวอย่างคุณภาพสูงที่จำนวนสเต็ปต่ำกว่า; รุ่น Pro ที่โฮสต์อาจใช้กระบวนการทางวิศวกรรมและสายงานการสุ่มตัวอย่างเพิ่มเติมเพื่อลดเวลาแฝง
ชื่อโมเดล: black-forest-labs/flux-2-pro
ประสิทธิภาพตามเกณฑ์วัดผล
การประเมินของ Black Forest Labs เองและรายงานอิสระที่เผยแพร่ในช่วงเปิดตัวระบุว่า FLUX.2 แสดงให้เห็นถึงความก้าวหน้าที่วัดได้เมื่อเทียบกับระบบสร้างภาพร่วมสมัยหลายตัว ในอัตราชนะจากการประเมินโดยมนุษย์สำหรับงาน text→image และงานแก้ไข:
- Text→image: รายงานอัตราชนะประมาณ ~66.6% ในการเปรียบเทียบแบบตัวต่อตัวโดยมนุษย์กับโมเดลที่คัดเลือก (มีการอ้างอิงตัวอย่างการเปรียบเทียบในสื่อ)
- การแก้ไขแบบอ้างอิงเดียว: อัตราชนะ ~59.8% เมื่อเทียบกับ Qwen-Image ในการเปรียบเทียบที่รายงาน; การแก้ไขแบบหลายอ้างอิง: อัตราชนะ ~63.6% ตัวเลขอัตราชนะเหล่านี้ถูกเน้นย้ำโดยสื่อในช่วงเปิดตัวว่าเป็นหลักฐานของคุณภาพและความแม่นยำในการแก้ไขที่สม่ำเสมอ
FLUX.2 เทียบกับ Nano Banana Pro และ Qwen-Image
- Nano Banana Pro / Google Gemini image tiers: BFL วางตำแหน่ง FLUX.2 ว่าเทียบเคียงผู้นำแบบปิดซอร์สในด้านความตรงต่อพรอมป์และคุณภาพภาพ พร้อมต้นทุนต่อภาพที่ต่ำกว่า (BFL เผยแพร่การเปรียบเทียบราคาต่อ MP) คู่แข่งแบบ Proprietary อาจยังอ้างคะแนน ELO สูงสุดในบางการทดสอบที่คัดเลือก แต่มีต้นทุนต่อภาพสูงกว่า
- Hunyuan Image / Qwen-Image / โมเดลเปิดอื่น ๆ: มีรายงานว่า FLUX.2 เหนือกว่าหลายเช็คพอยต์แบบเปิดร่วมสมัยในการทดสอบอัตราชนะตัวต่อตัว ทั้งงาน T2I และงานแก้ไข (อ้างอิงการเปรียบเทียบที่เผยแพร่โดย BFL) ความแตกต่างเด่นชัดที่สุดในความคงเส้นคงวาแบบหลายอ้างอิงและไทโปกราฟี
- FLUX.1 lineage: FLUX.2 เป็นการออกแบบสถาปัตยกรรมใหม่ทั้งหมด (ไม่ใช่การแทนที่แบบ drop-in) ที่ปรับปรุงบล็อก DiT, ออโต้เอนโคเดอร์ และการคัปปลิงกับ VLM คาดหวังการพัฒนาที่เห็นได้ชัดในความตรงต่อการแก้ไขและความสอดคล้องแบบหลายอ้างอิงเมื่อเทียบกับ FLUX.1
วิธีเข้าถึง Flux.2 Pro API
ขั้นตอนที่ 1: สมัครเพื่อรับ API Key
เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน ลงชื่อเข้าใช้ CometAPI console รับ API key สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับคีย์โทเคน: sk-xxxxx แล้วส่ง
ขั้นตอนที่ 2: ส่งคำขอไปยัง Flux.2 Pro API
เลือกเอ็นด์พอยต์ “black-forest-labs/flux-2-pro” เพื่อส่งคำขอ API และกำหนดค่า request body วิธีการคำขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ
ใส่คำถามหรือคำขอของคุณลงในช่อง content — นี่คือสิ่งที่โมเดลจะตอบสนอง ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น
ขั้นตอนที่ 3: ดึงและยืนยันผลลัพธ์
ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต
ดูเพิ่มเติม Gemini 3 Pro Image( Nano Banana Pro) API
CometAPI ขณะนี้รองรับโมเดลในรูปแบบ Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
โปรโมชันจำกัดเวลา: ราคาต่ำกว่าราคาอย่างเป็นทางการของ Replicate!
👇 เริ่มสร้างเลย Create Predictions – เอกสาร API
⚡ ทางเลือกที่ยืดหยุ่น:
- Pro: ออกแบบเพื่อการผลิตประสิทธิภาพสูงและการส่งมอบที่รวดเร็ว
- Flex: เพิ่มคุณภาพภาพให้สูงสุดด้วยพารามิเตอร์ที่ปรับได้
- Dev: การปรับแต่งที่เป็นมิตรต่อผู้พัฒนา