Tính năng chính (những gì FLUX.2-Pro cung cấp)
- Chất lượng định hướng sản xuất: Nhắm tới các quy trình thương mại với độ trễ có thể dự đoán và độ trung thực hình ảnh cao (đầu ra chân thực lên đến ~4 megapixel).
- Điều kiện đa tham chiếu: Hỗ trợ tối đa 8 tham chiếu qua API và duy trì tính nhất quán về nhân vật/phong cách giữa các đầu ra — hữu ích cho tính liên tục của thương hiệu hoặc nhân vật.
- Cải thiện kiểu chữ & bố cục: Kết xuất văn bản rõ ràng, dễ đọc hơn cho UI, đồ họa thông tin và logo so với nhiều mô hình trước đây.
- Đầu ra mang tính quyết định, độ biến thiên thấp: Gói Pro được tối ưu để giảm nhắc lặp và thời gian chu trình trong sản xuất.
- Công cụ nguồn gốc nội dung & an toàn: API áp dụng siêu dữ liệu C2PA được ký mật mã cho đầu ra; các điểm cuối được lưu trữ bao gồm bộ lọc và kiểm duyệt trong lúc suy luận.
- Suy luận độ trễ thấp, có thể dự đoán (“dưới 10 giây” tốc độ tạo và SLA dành cho Pro).
Chi tiết kỹ thuật của FLUX.2 Pro
- Kiến trúc lõi: FLUX.2 sử dụng phương pháp latent flow-matching với một rectified-flow transformer hoạt động trong không gian ẩn đã được học. Thiết kế ghép xương sống transformer đó với Mistral-3 24B vision-language model để cung cấp cơ sở ngữ nghĩa và tri thức về thế giới trong quá trình tổng hợp.
- VAE và tái thiết kế latent: BFL phát hành FLUX.2 VAE phiên bản cập nhật (Apache-2.0) cân bằng lại giữa nén, độ trung thực tái tạo và khả năng học — cho phép chỉnh sửa chất lượng cao ở độ phân giải đa megapixel. VAE dùng chung làm nền tảng cho tất cả biến thể FLUX.2 để bảo đảm khả năng tương tác và kết quả chỉnh sửa nhất quán hơn.
- Hành vi suy luận / kỹ thuật huấn luyện: Checkpoint Dev được huấn luyện với các kỹ thuật như guidance distillation nhằm tăng hiệu quả lấy mẫu và cho phép lấy mẫu chất lượng cao với ít bước hơn; bản Pro được lưu trữ có thể dùng thêm các quy trình kỹ thuật và pipeline lấy mẫu để giảm độ trễ.
Tên mô hình: black-forest-labs/flux-2-pro
Hiệu năng benchmark
Các đánh giá nội bộ của Black Forest Labs và các bài viết độc lập được công bố khi ra mắt cho biết rằng FLUX.2 cho thấy các mức cải thiện đo được so với một số hệ thống tạo ảnh đương thời về tỷ lệ chiến thắng trong đánh giá của con người cho các tác vụ văn bản→ảnh và chỉnh sửa:
- Văn bản→ảnh: tỷ lệ chiến thắng báo cáo ~66.6% trong các so sánh trực tiếp do con người đánh giá so với các mô hình được chọn (các so sánh mẫu được báo chí trích dẫn).
- Chỉnh sửa đơn tham chiếu: ~59.8% tỷ lệ thắng so với Qwen-Image trong các so sánh được báo cáo; chỉnh sửa đa tham chiếu: ~63.6% tỷ lệ thắng. Các con số tỷ lệ thắng này được truyền thông nhấn mạnh khi ra mắt như bằng chứng về chất lượng nhất quán và độ chính xác khi chỉnh sửa.
FLUX.2 so với Nano Banana Pro và Qwen-Image
- Nano Banana Pro / Google Gemini image tiers: BFL định vị FLUX.2 là sánh ngang các hệ thống đóng nguồn dẫn đầu về độ trung thực với prompt và chất lượng hình ảnh đồng thời có chi phí trên ảnh thấp hơn (BFL đã công bố so sánh giá theo per-MP). Các đối thủ sở hữu độc quyền vẫn có thể tuyên bố ELO cao nhất tuyệt đối trong một số bài kiểm tra được chọn lọc nhưng với chi phí trên ảnh cao hơn.
- Hunyuan Image / Qwen-Image / các mô hình mở khác: FLUX.2 được báo cáo vượt trội hơn nhiều checkpoint mở đương thời trong các bài kiểm tra tỷ lệ thắng đối đầu trên các tác vụ T2I và chỉnh sửa (theo các so sánh do BFL công bố). Chênh lệch thường rõ rệt nhất ở tính nhất quán đa tham chiếu và kiểu chữ.
- Dòng dõi FLUX.1: FLUX.2 là một bản tái thiết kế kiến trúc hoàn chỉnh (không phải thay thế drop-in) cải thiện các khối DiT, autoencoder và ghép nối VLM. Có thể kỳ vọng mức cải thiện đáng kể về độ trung thực chỉnh sửa và độ mạch lạc đa tham chiếu so với FLUX.1.
Cách truy cập Flux.2 Pro API
Bước 1: Đăng ký lấy API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy API key thông tin truy cập của giao diện. Nhấp “Add Token” tại phần API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới Flux.2 Pro API
Chọn “black-forest-labs/flux-2-pro” endpoint để gửi yêu cầu API và thiết lập request body. Phương thức yêu cầu và request body được lấy từ tài liệu API trên website của chúng tôi. Website của chúng tôi cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng CometAPI key thực tế trong tài khoản của bạn.
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để nhận câu trả lời được tạo.
Bước 3: Truy xuất và xác minh kết quả
Xử lý phản hồi API để nhận câu trả lời được tạo. Sau khi xử lý, API sẽ trả về trạng thái tác vụ và dữ liệu đầu ra.
Xem thêm Gemini 3 Pro Image( Nano Banana Pro) API
CometAPI Hiện đã hỗ trợ các mô hình định dạng Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Khuyến mãi thời gian có hạn: Thấp hơn giá chính thức của Replicate!
👇 Bắt đầu xây dựng ngay Create Predictions – API Doc
⚡ Lựa chọn linh hoạt:
- Pro: Thiết kế cho sản xuất hiệu suất cao và giao hàng nhanh.
- Flex: Tối đa hóa chất lượng ảnh với các tham số có thể điều chỉnh.
- Dev: Tối ưu hóa thân thiện với nhà phát triển.