FLUX.2 Flex là thành viên tầm trung, tập trung vào nhà phát triển của dòng sản phẩm tạo ảnh FLUX.2 của Black Forest Labs. Sản phẩm này cung cấp các thông số tạo ảnh (đáng chú ý là số bước lấy mẫu và thang đo hướng dẫn) để các nhà phát triển có thể cân nhắc giữa độ trễ với độ trung thực của văn bản/kiểu chữ và độ chi tiết của hình ảnh.
FLUX.2 Flex là gì?
FLUX.2 là thành viên “linh hoạt” (API được quản lý) của dòng sản phẩm FLUX.2 từ Black Forest Labs. Sản phẩm được thiết kế dành cho các nhà phát triển và nhóm sáng tạo cần:
- kiểm soát rõ ràng đối với các tham số thế hệ (suy luận bước, thang hướng dẫn, v.v.) để họ có thể đánh đổi tốc độ lấy độ trung thực trong các quy trình làm việc lặp đi lặp lại;
- mạnh mẽ kiểu chữ / kết xuất văn bản và xử lý chi tiết rất tốt (đồ họa thông tin, mô hình UI, nhãn sản phẩm); và
- đáng tin cậy chỉnh sửa nhiều tài liệu tham khảo (kết hợp các yếu tố trong nhiều bức ảnh nhưng vẫn duy trì được bản sắc/tính nhất quán).
FLUX.2 được cung cấp dưới nhiều biến thể sản phẩm (Pro, Flex, Dev, Klein) nhắm đến các mô hình sử dụng khác nhau — Flex nằm giữa Pro (chất lượng cao nhất + độ trễ cố định) và Dev (điểm kiểm tra trọng lượng mở cho nghiên cứu/sử dụng tại địa phương).
Các tính năng chính (FLUX.2 Flex mang lại những gì)
- Thế hệ có thể kiểm soát: các thông số rõ ràng (các bước, thang hướng dẫn) để cân bằng tốc độ so với độ trung thực của lời nhắc.
- Đầu ra có độ phân giải cao: có khả năng sản xuất đầu ra lên đến 4 megapixel (4MP) trong khi vẫn giữ được chi tiết.
- Đầu vào đa tham chiếu: chấp nhận nhiều hình ảnh tham chiếu (Flex hỗ trợ tới 10 hình ảnh tham chiếu; số Dev/Pro thay đổi tùy theo từng cấp). Điều này cho phép kết xuất nhân vật/sản phẩm nhất quán trên các đầu ra.
- Cải thiện kiểu chữ và hiển thị văn bản: BFL nhấn mạnh vào việc cải thiện đáng kể khả năng hiển thị ký tự tượng hình, khoảng cách giữa các chữ cái và bố cục nhiều dòng — giúp FLUX.2 trở nên hấp dẫn đối với UI, bao bì và đồ họa thông tin.
- API được quản lý với giá megapixel (mô hình chi phí có thể dự đoán): giá cho Flex sử dụng mô hình theo megapixel (xem phần Giá).
Chi tiết kỹ thuật của FLUX.2 Flex
Kiến trúc cốt lõi: FLUX.2 sử dụng một khớp dòng chảy tiềm ẩn xương sống (biến áp lưu lượng) kết hợp với mô hình ngôn ngữ thị giác (BFL tuyên bố kết hợp một VLM Mistral-3 24B với một biến áp lưu lượng chỉnh lưu). VAE được FLUX.2 sử dụng đã được đào tạo lại để cải thiện sự cân bằng giữa khả năng học/chất lượng/nén. Những lựa chọn này giúp tăng cường kiến thức toàn cầu, logic thành phần và khả năng tuân thủ nhanh chóng hơn.
FLUX.2 : thời gian tạo ra điển hình được báo cáo ~ 22 giây (chỉ văn bản) và ~ 40 giây (với hình ảnh đầu vào), chấp nhận tối đa 10 đầu vào và có giá khoảng 0.048 đô la cho mỗi megapixel (kết hợp đầu vào + đầu ra) trên CometAPI.
Tên mẫu: black-forest-labs/flux-2-flex
Ràng buộc đầu vào: Flex chấp nhận nhiều đầu vào (tối đa 10 đầu vào trong dịch vụ được quản lý) và giới hạn tổng số megapixel đầu vào được áp dụng (ví dụ: đầu vào tổng hợp tối đa 14MP). Độ phân giải đầu ra vượt quá 4MP thường bị giảm mẫu hoặc bị giới hạn bởi dịch vụ.
Hiệu suất chuẩn của FLUX.2 Flex
Đánh giá tỷ lệ thắng theo phong cách con người (chuẩn mực nhà cung cấp): Trong các thử nghiệm đối đầu đã công bố của BFL, các biến thể FLUX.2 (đáng chú ý là ) cho thấy tỷ lệ thắng cao so với các mô hình mở hiện đại: ~ 66.6% tỷ lệ thắng trong văn bản thành hình ảnh, 59.8% trong việc chỉnh sửa tham chiếu đơn và 63.6% trong chỉnh sửa đa tham chiếu so với các mô hình mở khác được trích dẫn. BFL cũng trình bày biểu đồ chi phí ELO so với mỗi hình ảnh, đặt các biến thể FLUX.2 vào ~1030–1050 ELO băng tần với chi phí cho mỗi hình ảnh trong 2–6 xu phạm vi .
Hạn chế của FLUX.2 Flex
- Tỷ lệ chi phí theo tham chiếu/độ phân giải: Flex áp dụng giá theo megapixel. Việc thêm nhiều ảnh tham chiếu hoặc tăng độ phân giải đầu ra sẽ làm tăng chi phí tuyến tính theo mô hình megapixel được quảng cáo. Đối với các quy trình làm việc lặp lại với nhiều ảnh tham chiếu, chi phí có thể tăng nhanh.
- Chế độ lỗi nhanh chóng/không nhất quán: Mặc dù FLUX.2 cải thiện tính nhất quán của ký tự, nhưng các lời nhắc đa thuộc tính phức tạp vẫn có thể gây ra lỗi (hiện tượng lạ, pha trộn không mong muốn hoặc lệch tư thế/danh tính) tùy thuộc vào thiết kế lời nhắc và số lượng tham chiếu.
- Nội dung và an toàn: Mặc dù BFL báo cáo khả năng phục hồi mạnh mẽ trong các bài kiểm tra đầu vào vi phạm/kiểm duyệt, nhưng các mô hình hình ảnh vẫn chưa hoàn hảo; vẫn còn nguy cơ tạo ra tài liệu có bản quyền, mạo danh hoặc nội dung không an toàn.
Các trường hợp sử dụng điển hình / được đề xuất
- Các biến thể hình ảnh quảng cáo và tiếp thị trong đó cùng một mô hình/diễn viên/sản phẩm phải nhất quán trên nhiều cảnh hoặc nền (tính nhất quán đa tham chiếu).
- Chụp ảnh sản phẩm và thử đồ ảo (lưu giữ thông tin chi tiết sản phẩm trên nhiều nền).
- Biên tập/thời trang yêu cầu cùng một danh tính trong nhiều cảnh quay.
- Tạo mẫu nhanh và nghiên cứu (điểm kiểm tra phát triển cho phép thử nghiệm, tinh chỉnh và quy trình làm việc LoRA/bộ điều hợp).
Cách truy cập Flux.2 Flex API
Bước 1: Đăng ký Khóa API
Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào Bảng điều khiển CometAPI. Lấy khóa API thông tin đăng nhập của giao diện. Nhấp vào "Thêm mã thông báo" tại mã thông báo API trong trung tâm cá nhân, lấy khóa mã thông báo: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu đến Flux.2 Flex API
Chọn hàng**black-forest-labs/flux-2-flex** "Điểm cuối để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn. Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
Nhập câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để nhận được câu trả lời đã tạo.
Bước 3: Lấy và xác minh kết quả
Xử lý phản hồi API để nhận được câu trả lời đã tạo. Sau khi xử lý, API sẽ phản hồi với trạng thái tác vụ và dữ liệu đầu ra.
Sao chổiAPI Hiện đang hỗ trợ các mô hình định dạng Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Khuyến mãi có thời hạn: Thấp hơn giá chính thức của Replicate!
👇 Bắt đầu xây dựng ngay bây giờ Tạo dự đoán – Tài liệu API
⚡ Lựa chọn linh hoạt:
- Ưu điểm: Được thiết kế để sản xuất hiệu quả cao và giao hàng nhanh chóng.
- Flex: Tối đa hóa chất lượng hình ảnh với các thông số có thể điều chỉnh.
- Dev: Tối ưu hóa thân thiện với nhà phát triển.
