Tính năng chính (Flux.2 Dev làm được gì)
- Tạo ảnh từ văn bản (Text→Image) với độ bám prompt cao và khả năng hiển thị chữ / chi tiết nhỏ được cải thiện.
- Chỉnh sửa với nhiều ảnh tham chiếu — kết hợp nhiều ảnh tham chiếu vào một đầu ra duy nhất, đồng thời giữ được tính nhất quán về danh tính/phong cách.
- Một checkpoint duy nhất cho cả tạo sinh + chỉnh sửa (không cần mô hình chỉnh sửa riêng).
- Checkpoint open-weight lớn (32B) cho phép nghiên cứu cục bộ, lượng tử hóa và tùy biến bởi cộng đồng.)
- VAE được tối ưu hóa để có sự đánh đổi tốt hơn giữa khả năng học–chất lượng–nén (cho phép chỉnh sửa/đầu ra 4MP).
Chi tiết kỹ thuật (kiến trúc & kỹ thuật)
- Số lượng tham số: 32 tỷ tham số cho checkpoint FLUX.2.
- Thiết kế cốt lõi: latent flow-matching / rectified flow transformer kết hợp với một mô hình thị giác-ngôn ngữ (BFL cho biết họ ghép một VLM Mistral-3 24B với backbone transformer để làm nền tảng ngữ nghĩa). VLM đóng góp kiến thức thế giới và khả năng neo ngữ nghĩa văn bản, trong khi transformer mô hình hóa cấu trúc không gian/thành phần.
- VAE: VAE FLUX.2 mới (phát hành theo Apache-2.0) được huấn luyện lại để cải thiện độ trung thực tái tạo và khả năng học trong không gian latent, cho phép chỉnh sửa độ phân giải cao.
- Lấy mẫu & chưng cất: được huấn luyện bằng các kỹ thuật guidance-distillation để cải thiện hiệu quả suy luận và độ trung thực.
Hiệu năng benchmark
Black Forest Labs đã công bố các đánh giá so sánh và biểu đồ cho thấy hiệu năng của FLUX.2 so với các mô hình ảnh open-weight và hosted đương thời. Các số liệu chính được công bố (BFL / tóm tắt từ báo chí):
- Tỷ lệ thắng ở bài toán text-to-image: FLUX.2 ~66.6% (so với Qwen-Image 51.3%, Hunyuan ~48.1% trong bộ dữ liệu đối đầu trực tiếp của BFL).
- Tỷ lệ thắng ở chỉnh sửa với một ảnh tham chiếu: FLUX.2 ~59.8% (so với Qwen-Image 49.3%, FLUX.1 Kontext ~41.2%).
- Tỷ lệ thắng ở chỉnh sửa với nhiều ảnh tham chiếu: FLUX.2 ~63.6% (so với Qwen-Image 36.4%). BFL cũng báo cáo khả năng dùng nhiều tham chiếu lên tới 10 ảnh tham chiếu trong bộ đánh giá của họ.
Các trường hợp sử dụng điển hình / được khuyến nghị
- Biến thể hình ảnh quảng cáo và marketing khi cùng một người mẫu/diễn viên/sản phẩm phải giữ nhất quán qua nhiều cảnh hoặc nền khác nhau (tính nhất quán đa tham chiếu).
- Chụp ảnh sản phẩm & thử đồ ảo (giữ nguyên chi tiết sản phẩm qua các nền khác nhau).
- Bộ ảnh biên tập/thời trang yêu cầu cùng một danh tính xuyên suốt nhiều khung hình.
- Tạo mẫu nhanh và nghiên cứu (checkpoint dev cho phép thử nghiệm, fine-tuning và các quy trình LoRA/adapter).
Cách truy cập API Flux.2 dev
Bước 1: Đăng ký để lấy API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào bảng điều khiển CometAPI của bạn. Lấy khóa API dùng để truy cập giao diện. Nhấp vào “Add Token” tại mục API token trong trung tâm cá nhân, lấy token key: sk-xxxxx và gửi đi.

Bước 2: Gửi yêu cầu đến API Flux.2 dev
Chọn endpoint “black-forest-labs/flux-2-dev” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu có thể lấy từ tài liệu API trên website của chúng tôi. Website của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để nhận được câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để nhận được câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.
CometAPI hiện hỗ trợ các mô hình định dạng Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Khuyến mãi có thời hạn: Giá thấp hơn mức giá chính thức của Replicate!
👇 Bắt đầu xây dựng ngay Create Predictions – API Doc
⚡ Lựa chọn linh hoạt:
- Pro: Được thiết kế cho sản xuất hiệu quả cao và phân phối nhanh.
- Flex: Tối đa hóa chất lượng hình ảnh với các tham số có thể điều chỉnh.
- Dev: Tối ưu hóa thân thiện với nhà phát triển.