FLUX.2 Flex là gì
FLUX.2 là thành viên “linh hoạt” (API được quản lý) trong họ sản phẩm FLUX.2 của Black Forest Labs. Sản phẩm được thiết kế cho các nhà phát triển và đội ngũ sáng tạo cần:
- khả năng kiểm soát tường minh các tham số sinh (số bước suy luận, thang hướng dẫn, v.v.) để có thể đánh đổi tốc độ lấy độ trung thực trong quy trình lặp;
- khả năng kiểu chữ/kết xuất văn bản vững chắc và xử lý chi tiết rất tinh vi (đồ họa thông tin, mockup UI, nhãn sản phẩm); và
- khả năng chỉnh sửa đa tham chiếu đáng tin cậy (kết hợp các thành phần từ nhiều ảnh đồng thời duy trì danh tính/tính nhất quán).
FLUX.2 được cung cấp dưới nhiều biến thể sản phẩm (Pro, Flex, Dev, Klein) nhắm tới các kiểu sử dụng khác nhau — Flex nằm giữa Pro (chất lượng cao nhất + độ trễ cố định) và Dev (checkpoint trọng số mở cho nghiên cứu/sử dụng cục bộ).
Tính năng chính (FLUX.2 Flex mang lại điều gì)
- Sinh có thể điều khiển: tham số tường minh (số bước, thang hướng dẫn) để cân bằng tốc độ và độ trung thực với prompt.
- Đầu ra độ phân giải cao: có khả năng tạo đầu ra sản xuất lên tới 4 megapixel (4MP) trong khi vẫn giữ chi tiết.
- Đầu vào đa tham chiếu: chấp nhận nhiều ảnh tham chiếu (Flex hỗ trợ tới 10 ảnh tham chiếu; Dev/Pro thay đổi theo hạng). Điều này cho phép tái hiện nhân vật/sản phẩm nhất quán giữa các đầu ra.
- Cải thiện kiểu chữ và kết xuất văn bản: BFL nhấn mạnh việc cải thiện đáng kể kết xuất glyph, kerning và bố cục nhiều dòng — khiến FLUX.2 hấp dẫn cho UI, bao bì và đồ họa thông tin.
- API được quản lý với định giá theo megapixel (mô hình chi phí có thể dự đoán): giá của Flex sử dụng mô hình tính phí theo mỗi megapixel (xem phần Giá).
Thông tin kỹ thuật của FLUX.2 Flex
Kiến trúc lõi: FLUX.2 sử dụng xương sống flow-matching ẩn (flow transformer) kết hợp với mô hình thị giác-ngôn ngữ (BFL cho biết kết hợp một Mistral-3 24B VLM với một rectified flow transformer). VAE được FLUX.2 sử dụng đã được huấn luyện lại để cải thiện sự đánh đổi giữa khả năng học/chất lượng/nén. Những lựa chọn này giúp tăng hiểu biết thế giới, logic cấu thành và tuân thủ prompt chặt chẽ hơn.
FLUX.2: thời gian sinh điển hình được báo cáo ~22 s (chỉ văn bản) và ~40 s (có ảnh đầu vào), chấp nhận tối đa 10 đầu vào và được định giá khoảng $0.048 mỗi megapixel (tổng đầu vào + đầu ra) trên CometAPI.
Tên mô hình: black-forest-labs/flux-2-flex
Ràng buộc đầu vào: Flex chấp nhận nhiều đầu vào (tối đa 10 đầu vào trong gói được quản lý) và có giới hạn tổng megapixel đầu vào (nêu tối đa 14MP đầu vào tổng hợp). Độ phân giải đầu ra vượt quá 4MP thường bị giảm mẫu hoặc bị giới hạn bởi dịch vụ.
Hiệu năng điểm chuẩn của FLUX.2 Flex
Đánh giá tỷ lệ thắng theo kiểu con người (điểm chuẩn của nhà cung cấp): Trong các thử nghiệm đối đầu do BFL công bố, các biến thể FLUX.2 (đáng chú ý là ) cho thấy tỷ lệ thắng mạnh mẽ so với các mô hình mở đương thời: ~66.6% ở tác vụ văn bản–sang–ảnh, 59.8% ở chỉnh sửa một tham chiếu và 63.6% ở chỉnh sửa đa tham chiếu so với các mô hình mở khác được trích dẫn. BFL cũng trình bày biểu đồ ELO so với chi phí mỗi ảnh, đặt các biến thể FLUX.2 trong dải ~1030–1050 ELO với chi phí mỗi ảnh trong khoảng 2–6 cent.
Hạn chế của FLUX.2 Flex
- Chi phí tỉ lệ theo số tham chiếu/độ phân giải: Flex dùng định giá theo mỗi megapixel. Thêm nhiều ảnh tham chiếu hoặc tăng độ phân giải đầu ra sẽ làm chi phí tăng tuyến tính theo mô hình megapixel đã công bố. Với quy trình lặp chứa nhiều tham chiếu, chi phí có thể tăng nhanh.
- Chế độ lỗi về prompt/tính nhất quán: Dù FLUX.2 cải thiện tính nhất quán về nhân vật, các prompt đa thuộc tính phức tạp vẫn có thể tạo lỗi (artifact, hòa trộn ngoài ý muốn hoặc trôi tư thế/danh tính) tùy thuộc thiết kế prompt và số tham chiếu.
- Nội dung & an toàn: Mặc dù BFL báo cáo khả năng chống chịu tốt trong các bài kiểm tra kiểm duyệt/đầu vào vi phạm, các mô hình ảnh không hoàn hảo; vẫn tồn tại rủi ro tạo nội dung có bản quyền, mạo danh hoặc không an toàn.
Trường hợp sử dụng điển hình/khuyến nghị
- Biến thể hình ảnh quảng cáo và tiếp thị nơi cùng một người mẫu/diễn viên/sản phẩm cần giữ nhất quán trên nhiều bối cảnh (tính nhất quán đa tham chiếu).
- Ảnh sản phẩm & thử nghiệm ảo (giữ chi tiết sản phẩm trên nhiều nền).
- Bài/bộ ảnh biên tập/thời trang yêu cầu cùng một danh tính trên nhiều khung hình.
- Tạo mẫu nhanh và nghiên cứu (checkpoint dành cho dev cho phép thử nghiệm, tinh chỉnh và các quy trình LoRA/adapter).
Cách truy cập Flux.2 Flex API
Bước 1: Đăng ký API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy API key thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu đến Flux.2 Flex API
Chọn endpoint “black-forest-labs/flux-2-flex ” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng CometAPI key thực tế từ tài khoản của bạn.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo ra.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.
CometAPI Hiện hỗ trợ các mô hình định dạng Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Khuyến mãi thời gian có hạn: Thấp hơn giá chính thức của Replicate!
👇 Bắt đầu xây dựng ngay Tạo dự đoán – Tài liệu API
⚡ Lựa chọn linh hoạt:
- Pro: Thiết kế cho sản xuất hiệu quả cao và giao hàng nhanh.
- Flex: Tối đa hóa chất lượng hình ảnh với tham số có thể điều chỉnh.
- Dev: Tối ưu cho nhà phát triển.