คุณสมบัติหลัก (สิ่งที่ FLUX.2-Pro นำเสนอ)

คุณภาพเชิงผลิตจริง: มุ่งเป้าไปที่สายงานเชิงพาณิชย์ด้วยเวลาแฝงที่คาดการณ์ได้และความสมจริงทางภาพสูง (เอาต์พุตเหมือนภาพถ่ายสูงสุดประมาณ ~4 เมกะพิกเซล)
การกำหนดเงื่อนไขจากหลายอ้างอิง: API รองรับการใช้อ้างอิงได้สูงสุด 8 รายการผ่าน API และรักษาความคงเส้นคงวาของตัวละคร/สไตล์ระหว่างเอาต์พุต — มีประโยชน์สำหรับความต่อเนื่องของแบรนด์หรือตัวละคร
ไทโปกราฟีและเลย์เอาต์ที่ดีขึ้น: การเรนเดอร์ข้อความที่เด่นชัด อ่านง่ายขึ้นสำหรับ UI, อินโฟกราฟิก และโลโก้ เมื่อเทียบกับโมเดลก่อนหน้าหลายตัว
เอาต์พุตแบบกำหนดแน่นอนและความแปรปรวนต่ำ: ระดับ Pro ได้รับการปรับแต่งเพื่อลดการพรอมป์แบบวนซ้ำและรอบเวลาในการผลิต
เครื่องมือด้านแหล่งที่มาของเนื้อหาและความปลอดภัย: API ฝังเมทาดาตา C2PA ที่ลงนามด้วยการเข้ารหัสไว้ในเอาต์พุต; เอ็นด์พอยต์ที่โฮสต์มีตัวกรองและการกลั่นกรองระหว่างการอนุมาน
การอนุมานแบบหน่วงต่ำและคาดการณ์ได้ (ความเร็วการสร้าง “ต่ำกว่า 10 วินาที” และ SLA สำหรับ Pro)

รายละเอียดเชิงเทคนิคของ FLUX.2 Pro

สถาปัตยกรรมแกนหลัก: FLUX.2 ใช้วิธีการแบบ latent flow-matching ร่วมกับ rectified-flow transformer ที่ทำงานใน latent space ที่เรียนรู้แล้ว การออกแบบนี้ผสานแกน transformer นั้นเข้ากับ Mistral-3 24B vision-language model เพื่อให้การยึดโยงเชิงความหมายและความรู้เกี่ยวกับโลกระหว่างการสังเคราะห์
VAE และการออกแบบ latent ใหม่: BFL เปิดตัว FLUX.2 VAE เวอร์ชันอัปเดต (Apache-2.0) ที่ปรับสมดุลระหว่างการบีบอัด ความเที่ยงตรงของการกู้คืน และความสามารถในการเรียนรู้ — ช่วยให้การแก้ไขคุณภาพสูงขึ้นที่ความละเอียดระดับหลายเมกะพิกเซล VAE ที่ใช้ร่วมกันนี้เป็นฐานให้กับทุกรุ่นย่อยของ FLUX.2 เพื่อการทำงานร่วมกันและผลลัพธ์การแก้ไขที่สม่ำเสมอมากขึ้น
พฤติกรรมการอนุมาน / เทคนิคการฝึก: เช็คพอยต์ Dev ได้รับการฝึกด้วยเทคนิคอย่าง guidance distillation เพื่อให้การสุ่มตัวอย่างมีประสิทธิภาพขึ้นและรองรับการสุ่มตัวอย่างคุณภาพสูงที่จำนวนสเต็ปต่ำกว่า; รุ่น Pro ที่โฮสต์อาจใช้กระบวนการทางวิศวกรรมและสายงานการสุ่มตัวอย่างเพิ่มเติมเพื่อลดเวลาแฝง

ชื่อโมเดล: black-forest-labs/flux-2-pro

ประสิทธิภาพตามเกณฑ์วัดผล

การประเมินของ Black Forest Labs เองและรายงานอิสระที่เผยแพร่ในช่วงเปิดตัวระบุว่า FLUX.2 แสดงให้เห็นถึงความก้าวหน้าที่วัดได้เมื่อเทียบกับระบบสร้างภาพร่วมสมัยหลายตัว ในอัตราชนะจากการประเมินโดยมนุษย์สำหรับงาน text→image และงานแก้ไข:

Text→image: รายงานอัตราชนะประมาณ ~66.6% ในการเปรียบเทียบแบบตัวต่อตัวโดยมนุษย์กับโมเดลที่คัดเลือก (มีการอ้างอิงตัวอย่างการเปรียบเทียบในสื่อ)
การแก้ไขแบบอ้างอิงเดียว: อัตราชนะ ~59.8% เมื่อเทียบกับ Qwen-Image ในการเปรียบเทียบที่รายงาน; การแก้ไขแบบหลายอ้างอิง: อัตราชนะ ~63.6% ตัวเลขอัตราชนะเหล่านี้ถูกเน้นย้ำโดยสื่อในช่วงเปิดตัวว่าเป็นหลักฐานของคุณภาพและความแม่นยำในการแก้ไขที่สม่ำเสมอ

FLUX.2 เทียบกับ Nano Banana Pro และ Qwen-Image

Nano Banana Pro / Google Gemini image tiers: BFL วางตำแหน่ง FLUX.2 ว่าเทียบเคียงผู้นำแบบปิดซอร์สในด้านความตรงต่อพรอมป์และคุณภาพภาพ พร้อมต้นทุนต่อภาพที่ต่ำกว่า (BFL เผยแพร่การเปรียบเทียบราคาต่อ MP) คู่แข่งแบบ Proprietary อาจยังอ้างคะแนน ELO สูงสุดในบางการทดสอบที่คัดเลือก แต่มีต้นทุนต่อภาพสูงกว่า
Hunyuan Image / Qwen-Image / โมเดลเปิดอื่น ๆ: มีรายงานว่า FLUX.2 เหนือกว่าหลายเช็คพอยต์แบบเปิดร่วมสมัยในการทดสอบอัตราชนะตัวต่อตัว ทั้งงาน T2I และงานแก้ไข (อ้างอิงการเปรียบเทียบที่เผยแพร่โดย BFL) ความแตกต่างเด่นชัดที่สุดในความคงเส้นคงวาแบบหลายอ้างอิงและไทโปกราฟี
FLUX.1 lineage: FLUX.2 เป็นการออกแบบสถาปัตยกรรมใหม่ทั้งหมด (ไม่ใช่การแทนที่แบบ drop-in) ที่ปรับปรุงบล็อก DiT, ออโต้เอนโคเดอร์ และการคัปปลิงกับ VLM คาดหวังการพัฒนาที่เห็นได้ชัดในความตรงต่อการแก้ไขและความสอดคล้องแบบหลายอ้างอิงเมื่อเทียบกับ FLUX.1

วิธีเข้าถึง Flux.2 Pro API

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน ลงชื่อเข้าใช้ CometAPI console รับ API key สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับคีย์โทเคน: sk-xxxxx แล้วส่ง

ขั้นตอนที่ 2: ส่งคำขอไปยัง Flux.2 Pro API

เลือกเอ็นด์พอยต์ “black-forest-labs/flux-2-pro” เพื่อส่งคำขอ API และกำหนดค่า request body วิธีการคำขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ

ใส่คำถามหรือคำขอของคุณลงในช่อง content — นี่คือสิ่งที่โมเดลจะตอบสนอง ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและยืนยันผลลัพธ์

ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต

ดูเพิ่มเติม Gemini 3 Pro Image( Nano Banana Pro) API

CometAPI ขณะนี้รองรับโมเดลในรูปแบบ Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex

โปรโมชันจำกัดเวลา: ราคาต่ำกว่าราคาอย่างเป็นทางการของ Replicate!

👇 เริ่มสร้างเลย Create Predictions – เอกสาร API

⚡ ทางเลือกที่ยืดหยุ่น:

Pro: ออกแบบเพื่อการผลิตประสิทธิภาพสูงและการส่งมอบที่รวดเร็ว
Flex: เพิ่มคุณภาพภาพให้สูงสุดด้วยพารามิเตอร์ที่ปรับได้
Dev: การปรับแต่งที่เป็นมิตรต่อผู้พัฒนา

คุณสมบัติหลัก (สิ่งที่ FLUX.2-Pro นำเสนอ)

คุณภาพเชิงผลิตจริง: มุ่งเป้าไปที่สายงานเชิงพาณิชย์ด้วยเวลาแฝงที่คาดการณ์ได้และความสมจริงทางภาพสูง (เอาต์พุตเหมือนภาพถ่ายสูงสุดประมาณ ~4 เมกะพิกเซล)
การกำหนดเงื่อนไขจากหลายอ้างอิง: API รองรับการใช้อ้างอิงได้สูงสุด 8 รายการผ่าน API และรักษาความคงเส้นคงวาของตัวละคร/สไตล์ระหว่างเอาต์พุต — มีประโยชน์สำหรับความต่อเนื่องของแบรนด์หรือตัวละคร
ไทโปกราฟีและเลย์เอาต์ที่ดีขึ้น: การเรนเดอร์ข้อความที่เด่นชัด อ่านง่ายขึ้นสำหรับ UI, อินโฟกราฟิก และโลโก้ เมื่อเทียบกับโมเดลก่อนหน้าหลายตัว
เอาต์พุตแบบกำหนดแน่นอนและความแปรปรวนต่ำ: ระดับ Pro ได้รับการปรับแต่งเพื่อลดการพรอมป์แบบวนซ้ำและรอบเวลาในการผลิต
เครื่องมือด้านแหล่งที่มาของเนื้อหาและความปลอดภัย: API ฝังเมทาดาตา C2PA ที่ลงนามด้วยการเข้ารหัสไว้ในเอาต์พุต; เอ็นด์พอยต์ที่โฮสต์มีตัวกรองและการกลั่นกรองระหว่างการอนุมาน
การอนุมานแบบหน่วงต่ำและคาดการณ์ได้ (ความเร็วการสร้าง “ต่ำกว่า 10 วินาที” และ SLA สำหรับ Pro)

รายละเอียดเชิงเทคนิคของ FLUX.2 Pro

สถาปัตยกรรมแกนหลัก: FLUX.2 ใช้วิธีการแบบ latent flow-matching ร่วมกับ rectified-flow transformer ที่ทำงานใน latent space ที่เรียนรู้แล้ว การออกแบบนี้ผสานแกน transformer นั้นเข้ากับ Mistral-3 24B vision-language model เพื่อให้การยึดโยงเชิงความหมายและความรู้เกี่ยวกับโลกระหว่างการสังเคราะห์
VAE และการออกแบบ latent ใหม่: BFL เปิดตัว FLUX.2 VAE เวอร์ชันอัปเดต (Apache-2.0) ที่ปรับสมดุลระหว่างการบีบอัด ความเที่ยงตรงของการกู้คืน และความสามารถในการเรียนรู้ — ช่วยให้การแก้ไขคุณภาพสูงขึ้นที่ความละเอียดระดับหลายเมกะพิกเซล VAE ที่ใช้ร่วมกันนี้เป็นฐานให้กับทุกรุ่นย่อยของ FLUX.2 เพื่อการทำงานร่วมกันและผลลัพธ์การแก้ไขที่สม่ำเสมอมากขึ้น
พฤติกรรมการอนุมาน / เทคนิคการฝึก: เช็คพอยต์ Dev ได้รับการฝึกด้วยเทคนิคอย่าง guidance distillation เพื่อให้การสุ่มตัวอย่างมีประสิทธิภาพขึ้นและรองรับการสุ่มตัวอย่างคุณภาพสูงที่จำนวนสเต็ปต่ำกว่า; รุ่น Pro ที่โฮสต์อาจใช้กระบวนการทางวิศวกรรมและสายงานการสุ่มตัวอย่างเพิ่มเติมเพื่อลดเวลาแฝง

ชื่อโมเดล: black-forest-labs/flux-2-pro

ประสิทธิภาพตามเกณฑ์วัดผล

Text→image: รายงานอัตราชนะประมาณ ~66.6% ในการเปรียบเทียบแบบตัวต่อตัวโดยมนุษย์กับโมเดลที่คัดเลือก (มีการอ้างอิงตัวอย่างการเปรียบเทียบในสื่อ)
การแก้ไขแบบอ้างอิงเดียว: อัตราชนะ ~59.8% เมื่อเทียบกับ Qwen-Image ในการเปรียบเทียบที่รายงาน; การแก้ไขแบบหลายอ้างอิง: อัตราชนะ ~63.6% ตัวเลขอัตราชนะเหล่านี้ถูกเน้นย้ำโดยสื่อในช่วงเปิดตัวว่าเป็นหลักฐานของคุณภาพและความแม่นยำในการแก้ไขที่สม่ำเสมอ

FLUX.2 เทียบกับ Nano Banana Pro และ Qwen-Image

Nano Banana Pro / Google Gemini image tiers: BFL วางตำแหน่ง FLUX.2 ว่าเทียบเคียงผู้นำแบบปิดซอร์สในด้านความตรงต่อพรอมป์และคุณภาพภาพ พร้อมต้นทุนต่อภาพที่ต่ำกว่า (BFL เผยแพร่การเปรียบเทียบราคาต่อ MP) คู่แข่งแบบ Proprietary อาจยังอ้างคะแนน ELO สูงสุดในบางการทดสอบที่คัดเลือก แต่มีต้นทุนต่อภาพสูงกว่า
Hunyuan Image / Qwen-Image / โมเดลเปิดอื่น ๆ: มีรายงานว่า FLUX.2 เหนือกว่าหลายเช็คพอยต์แบบเปิดร่วมสมัยในการทดสอบอัตราชนะตัวต่อตัว ทั้งงาน T2I และงานแก้ไข (อ้างอิงการเปรียบเทียบที่เผยแพร่โดย BFL) ความแตกต่างเด่นชัดที่สุดในความคงเส้นคงวาแบบหลายอ้างอิงและไทโปกราฟี
FLUX.1 lineage: FLUX.2 เป็นการออกแบบสถาปัตยกรรมใหม่ทั้งหมด (ไม่ใช่การแทนที่แบบ drop-in) ที่ปรับปรุงบล็อก DiT, ออโต้เอนโคเดอร์ และการคัปปลิงกับ VLM คาดหวังการพัฒนาที่เห็นได้ชัดในความตรงต่อการแก้ไขและความสอดคล้องแบบหลายอ้างอิงเมื่อเทียบกับ FLUX.1

วิธีเข้าถึง Flux.2 Pro API

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง Flux.2 Pro API

ขั้นตอนที่ 3: ดึงและยืนยันผลลัพธ์

ดูเพิ่มเติม Gemini 3 Pro Image( Nano Banana Pro) API

โปรโมชันจำกัดเวลา: ราคาต่ำกว่าราคาอย่างเป็นทางการของ Replicate!

👇 เริ่มสร้างเลย Create Predictions – เอกสาร API

⚡ ทางเลือกที่ยืดหยุ่น:

Pro: ออกแบบเพื่อการผลิตประสิทธิภาพสูงและการส่งมอบที่รวดเร็ว
Flex: เพิ่มคุณภาพภาพให้สูงสุดด้วยพารามิเตอร์ที่ปรับได้
Dev: การปรับแต่งที่เป็นมิตรต่อผู้พัฒนา

Black Forest Labs/FLUX 2 PRO

คุณสมบัติหลัก (สิ่งที่ FLUX.2-Pro นำเสนอ)

รายละเอียดเชิงเทคนิคของ FLUX.2 Pro

ประสิทธิภาพตามเกณฑ์วัดผล

FLUX.2 เทียบกับ Nano Banana Pro และ Qwen-Image

วิธีเข้าถึง Flux.2 Pro API

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง Flux.2 Pro API

ขั้นตอนที่ 3: ดึงและยืนยันผลลัพธ์

โมเดลเพิ่มเติม

Nano Banana 2

Doubao Seedream 5

FLUX 2 MAX

Black Forest Labs/FLUX 2 MAX

GPT Image 1.5

Doubao Seedream 4.5

Black Forest Labs/FLUX 2 PRO

คุณสมบัติหลัก (สิ่งที่ FLUX.2-Pro นำเสนอ)

รายละเอียดเชิงเทคนิคของ FLUX.2 Pro

ประสิทธิภาพตามเกณฑ์วัดผล

FLUX.2 เทียบกับ Nano Banana Pro และ Qwen-Image

วิธีเข้าถึง Flux.2 Pro API

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง Flux.2 Pro API

ขั้นตอนที่ 3: ดึงและยืนยันผลลัพธ์

โมเดลเพิ่มเติม

Nano Banana 2

Doubao Seedream 5

FLUX 2 MAX

Black Forest Labs/FLUX 2 MAX

GPT Image 1.5

Doubao Seedream 4.5