FLUX.2 Flex คืออะไร
FLUX.2 คือสมาชิกแบบ “ยืดหยุ่น” (Managed API) ของตระกูลผลิตภัณฑ์ FLUX.2 จาก Black Forest Labs โดยออกแบบมาสำหรับนักพัฒนาและทีมครีเอทีฟที่ต้องการ:
- การควบคุมพารามิเตอร์การสร้างอย่างชัดเจน (เช่น steps, guidance scale เป็นต้น) เพื่อให้สามารถแลกเปลี่ยนระหว่างความเร็วกับความแม่นยำของผลลัพธ์ได้ระหว่างเวิร์กโฟลว์แบบทำซ้ำ;
- งานตัวอักษร / การเรนเดอร์ข้อความ ที่มีความเสถียร และการจัดการรายละเอียดที่ละเอียดมาก (อินโฟกราฟิก, UI mockup, ฉลากสินค้า); และ
- การแก้ไขแบบหลายภาพอ้างอิง ที่เชื่อถือได้ (ผสานองค์ประกอบจากภาพถ่ายหลายภาพโดยยังคงอัตลักษณ์/ความสอดคล้องไว้)
FLUX.2 มีให้ใช้งานในหลายรุ่นผลิตภัณฑ์ (Pro, Flex, Dev, Klein) ซึ่งรองรับรูปแบบการใช้งานที่แตกต่างกัน — Flex อยู่กึ่งกลางระหว่าง Pro (คุณภาพสูงสุด + latency คงที่) และ Dev (checkpoint แบบ open-weight สำหรับการวิจัย/การใช้งานภายในเครื่อง)
คุณสมบัติหลัก (สิ่งที่ FLUX.2 Flex นำเสนอ)
- การสร้างที่ควบคุมได้: พารามิเตอร์แบบชัดเจน (steps, guidance scale) เพื่อปรับสมดุลระหว่างความเร็วกับความสอดคล้องต่อ prompt
- เอาต์พุตความละเอียดสูง: รองรับงานระดับ production ได้สูงสุดถึง 4 เมกะพิกเซล (4MP) โดยยังคงรายละเอียดไว้
- รองรับอินพุตแบบหลายภาพอ้างอิง: รับภาพอ้างอิงได้หลายภาพ (Flex รองรับได้สูงสุด 10 ภาพอ้างอิง; จำนวนของ Dev/Pro จะแตกต่างกันตามแต่ละ tier) ซึ่งช่วยให้การเรนเดอร์ตัวละคร/สินค้าในหลายเอาต์พุตมีความสม่ำเสมอ
- ปรับปรุง typography และการเรนเดอร์ข้อความ: BFL เน้นย้ำว่ามีการปรับปรุงอย่างมากในการเรนเดอร์ glyph, kerning และเลย์เอาต์หลายบรรทัด — ทำให้ FLUX.2 เหมาะสำหรับงาน UI, บรรจุภัณฑ์ และอินโฟกราฟิก
- Managed API พร้อมการคิดราคาแบบเมกะพิกเซล (โมเดลต้นทุนที่คาดการณ์ได้): ราคาของ Flex ใช้โมเดลคิดค่าบริการต่อเมกะพิกเซล (ดูส่วน Pricing)
รายละเอียดทางเทคนิคของ FLUX.2 Flex
สถาปัตยกรรมหลัก: FLUX.2 ใช้ backbone แบบ latent flow-matching (flow transformer) ร่วมกับ vision-language model (BFL ระบุว่าใช้ Mistral-3 24B VLM ควบคู่กับ rectified flow transformer) VAE ที่ใช้ใน FLUX.2 ได้รับการฝึกใหม่เพื่อปรับปรุงสมดุลระหว่างความสามารถในการเรียนรู้/คุณภาพ/การบีบอัด การเลือกเหล่านี้ช่วยในด้านความรู้เกี่ยวกับโลกจริง, ตรรกะแบบ composition และการยึดตาม prompt ที่เข้มงวดยิ่งขึ้น
FLUX.2 : เวลาการสร้างโดยทั่วไปที่รายงานคือ ~22 วินาที (เฉพาะข้อความ) และ ~40 วินาที (พร้อมภาพอินพุต), รองรับอินพุตได้สูงสุด 10 รายการ และมีราคาประมาณ $0.048 ต่อเมกะพิกเซล (รวมอินพุต + เอาต์พุต) บน CometAPI
ชื่อโมเดล: black-forest-labs/flux-2-flex
ข้อจำกัดของอินพุต: Flex รองรับอินพุตหลายรายการ (สูงสุด 10 อินพุตในบริการแบบ managed) และมีการบังคับใช้ขีดจำกัดเมกะพิกเซลรวมของอินพุต (มีการอ้างถึงค่าสูงสุดรวม 14MP สำหรับอินพุต) โดยปกติความละเอียดเอาต์พุตที่เกิน 4MP จะถูก downsample หรือถูกจำกัดโดยบริการ
ประสิทธิภาพเบนช์มาร์กของ FLUX.2 Flex
การประเมินอัตราชนะในสไตล์มนุษย์ (เบนช์มาร์กจากผู้ให้บริการ): ในการทดสอบเปรียบเทียบแบบตัวต่อตัวที่ BFL เผยแพร่ รุ่นต่าง ๆ ของ FLUX.2 (โดยเฉพาะ ) แสดงอัตราชนะที่แข็งแกร่งเมื่อเทียบกับโมเดลเปิดร่วมสมัย: อัตราชนะประมาณ ~66.6% ในงาน text-to-image, 59.8% ในงานแก้ไขแบบภาพอ้างอิงเดี่ยว และ 63.6% ในงานแก้ไขแบบหลายภาพอ้างอิง เมื่อเทียบกับโมเดลเปิดอื่น ๆ ที่ถูกอ้างถึง BFL ยังได้นำเสนอกราฟ ELO เทียบกับต้นทุนต่อภาพ ซึ่งจัดวางรุ่นของ FLUX.2 ไว้ในช่วง ~1030–1050 ELO ที่ต้นทุนต่อภาพในช่วง 2–6 เซนต์
ข้อจำกัดของ FLUX.2 Flex
- ต้นทุนเพิ่มตามจำนวนภาพอ้างอิง / ความละเอียด: Flex ใช้การคิดราคาแบบต่อเมกะพิกเซล การเพิ่มภาพอ้างอิงหลายภาพหรือเพิ่มความละเอียดเอาต์พุตจะทำให้ต้นทุนเพิ่มขึ้นแบบเชิงเส้นภายใต้โมเดลเมกะพิกเซลที่โฆษณาไว้ สำหรับเวิร์กโฟลว์ที่ทำซ้ำโดยใช้ภาพอ้างอิงจำนวนมาก ต้นทุนอาจสะสมได้อย่างรวดเร็ว
- โหมดความล้มเหลวของ prompt/ความสม่ำเสมอ: แม้ว่า FLUX.2 จะปรับปรุงความสม่ำเสมอของตัวละคร แต่ prompt ที่ซับซ้อนและมีหลายคุณลักษณะยังอาจทำให้เกิดความล้มเหลวได้ (artifacts, การผสานที่ไม่คาดคิด หรือการ drift ของท่าทาง/อัตลักษณ์) ขึ้นอยู่กับการออกแบบ prompt และจำนวนภาพอ้างอิง
- เนื้อหาและความปลอดภัย: แม้ BFL จะรายงานถึงความทนทานที่แข็งแกร่งในการทดสอบ moderation/อินพุตที่ละเมิดข้อกำหนด แต่โมเดลภาพยังไม่สมบูรณ์แบบ; ยังคงมีความเสี่ยงในการสร้างเนื้อหาที่มีลิขสิทธิ์, การปลอมแปลงตัวตน หรือเนื้อหาที่ไม่ปลอดภัย
กรณีการใช้งานทั่วไป / ที่แนะนำ
- ภาพโฆษณาและการตลาดหลายเวอร์ชัน ที่ต้องให้โมเดล/นักแสดง/สินค้าเดิมคงความสม่ำเสมอในหลายฉากหรือหลายพื้นหลัง (ความสม่ำเสมอแบบหลายภาพอ้างอิง)
- ภาพถ่ายสินค้าและ virtual try-on (คงรายละเอียดของสินค้าไว้ข้ามพื้นหลังต่าง ๆ)
- งาน editorial/แฟชั่นเซ็ต ที่ต้องใช้อัตลักษณ์เดียวกันในหลายช็อต
- การทำต้นแบบอย่างรวดเร็วและการวิจัย (checkpoint รุ่น dev เปิดให้ทดลอง, fine-tuning และเวิร์กโฟลว์ LoRA/adapter)
วิธีเข้าถึง Flux.2 Flex API
ขั้นตอนที่ 1: สมัครเพื่อรับ API Key
เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่ได้เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน ลงชื่อเข้าใช้ CometAPI console ของคุณ รับ API key สำหรับเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ในส่วน API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx แล้วส่งคำขอ
ขั้นตอนที่ 2: ส่งคำขอไปยัง Flux.2 Flex API
เลือก endpoint “black-forest-labs/flux-2-flex” เพื่อส่งคำขอ API และกำหนด request body วิธีการ request และ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ
ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—นี่คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น
ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์
ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต
CometAPI รองรับโมเดลรูปแบบ Replicate แล้วตอนนี้: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
โปรโมชันเวลาจำกัด: ราคาต่ำกว่าราคาอย่างเป็นทางการของ Replicate!
👇 เริ่มสร้างได้เลยตอนนี้ Create Predictions – API Doc
⚡ ตัวเลือกที่ยืดหยุ่น:
- Pro: ออกแบบมาสำหรับการผลิตที่มีประสิทธิภาพสูงและการส่งมอบที่รวดเร็ว
- Flex: ให้คุณภาพของภาพสูงสุดด้วยพารามิเตอร์ที่ปรับได้
- Dev: ปรับให้เหมาะกับนักพัฒนา