FLUX.2 [max] là một mô hình thị giác thông minh hàng đầu từ Black Forest Labs (BFL) được thiết kế cho các quy trình sản xuất: tiếp thị, nhiếp ảnh sản phẩm, thương mại điện tử, pipeline sáng tạo và mọi ứng dụng cần nhận diện nhân vật/sản phẩm nhất quán, kết xuất văn bản chính xác và chi tiết ảnh thực ở độ phân giải nhiều megapixel. Kiến trúc được tối ưu để bám sát prompt mạnh mẽ, hợp nhất đa tham chiếu (tối đa mười ảnh đầu vào) và tạo sinh có căn cứ (khả năng kết hợp ngữ cảnh web cập nhật khi tạo ảnh).
Thông số kỹ thuật (bảng)
| Trường | Giá trị / ghi chú |
|---|---|
| Tên/biến thể mô hình | FLUX.2 [max] (thường viết là FLUX 2 Max). |
| Kiểu đầu vào | Prompt văn bản + ảnh tham chiếu (chấp nhận ảnh đầu vào). |
| Kiểu đầu ra | Ảnh (ảnh thực & phong cách hóa), chỉnh sửa ảnh (inpainting/outpainting/retexturing) |
| Ảnh tham chiếu (tối đa) | Tối đa 8 ảnh tham chiếu qua API |
| Độ phân giải gốc tối đa | Tối đa 4 megapixel (ví dụ: ~2048×2048 hoặc cấu hình MP tương đương); kích thước khuyến nghị cho sản xuất thường ≤2MP để cân bằng tốc độ/chi phí. |
| Cửa sổ ngữ cảnh (văn bản) | 32K token văn bản (dung lượng token đầu vào được ghi nhận cho dòng FLUX.2). |
| Độ trễ / tốc độ | Tốc độ tạo “dưới 10 giây” được trích dẫn cho các cấu hình điển hình |
FLUX.2 [max] API là gì?
FLUX.2 [max] API là điểm cuối do BFL quản lý, cung cấp mô hình FLUX.2 [max] cho các quy trình tạo ảnh theo lập trình từ văn bản, chỉnh sửa ảnh đa tham chiếu và tạo sinh có căn cứ. API nhận yêu cầu JSON với prompt văn bản và ảnh tham chiếu tùy chọn, hỗ trợ các tham số tạo ảnh tiêu chuẩn (kích thước, steps, guidance scale, seeds) và trả về URL ảnh được tạo hoặc blob ảnh theo định dạng phản hồi của nhà cung cấp.
Các khả năng API điển hình được cung cấp:
- Endpoint tạo Ảnh từ Văn bản.
- Endpoint chỉnh sửa ảnh / inpainting / outpainting chấp nhận ảnh tham chiếu.
- Lập chỉ mục đa tham chiếu (gắn thẻ ảnh tham chiếu trong một yêu cầu).
- Tùy chọn tích hợp grounding / tìm kiếm web để có ngữ cảnh cập nhật trong ảnh được tạo (có ở hạng [max]).
Tính năng chính
- Grounded generation (ngữ cảnh web): [max] có thể kết hợp ngữ cảnh web mới, từ nguồn bên ngoài vào quá trình tạo để hình ảnh phản ánh sản phẩm thịnh hành hoặc sự kiện hiện tại khi được yêu cầu. Đây là điểm khác biệt tiêu biểu.
- Độ trung thực cao / đầu ra gốc 4MP: ánh sáng, kết cấu và hình học ổn định ở độ phân giải cấp sản xuất.
- Chỉnh sửa đa tham chiếu & tính nhất quán nhận diện mạnh: giữ nguyên khuôn mặt và nhận diện sản phẩm xuyên suốt các chỉnh sửa và các góc chụp; hỗ trợ nhiều tham chiếu để duy trì nhận diện nhất quán giữa các đầu ra.
- Khả năng bám sát prompt nâng cao & độ trung thực phong cách: tinh chỉnh để tái hiện trung thực hướng dẫn phong cách phức tạp và duy trì độ chính xác của kiểu chữ/văn bản nhỏ tốt hơn so với các mô hình ảnh thông thường (theo thử nghiệm của nhà cung cấp).
- Điều khiển phục vụ sản xuất: nút điều khiển JSON, hướng dẫn dáng/pose, công cụ thay kết cấu và khả năng kiểm soát cao về màu sắc (mã hex) và bố cục cho quy trình studio.
Hiệu năng benchmark
- Vị trí trên LM Arena / Image Arena: FLUX.2 [max] xếp cao trên các bảng xếp hạng tạo ảnh công khai; xếp hạng ELO do cộng đồng đóng góp (LM Arena / Image Arena) cho thấy khoảng 1150–1170 ELO (ví dụ: 1168 ELO trên arena Text-to-Image tại thời điểm báo cáo), đặt nó vào nhóm mô hình ảnh hàng đầu không thuộc BigTech, dù vẫn kém một vài mục dẫn đầu từ các nhà cung cấp lớn nhất.
- Benchmark thực tế: Chất lượng hình ảnh mạnh so với các mô hình cùng nhóm (đặc biệt cân bằng màu tốt hơn, chi tiết kết cấu và dải phong cách sáng tạo rộng hơn trong nhiều bài đối đầu trực tiếp).
FLUX 2 max so với Midjourney và Nano Banana
- So với Midjourney v7 / họ Midjourney: các bài đánh giá ghi nhận các biến thể FLUX.2 (Pro/Max) nhắm trực diện vào độ trung thực cấp sản xuất và tính nhất quán nhận diện đa tham chiếu, trong khi điểm mạnh của Midjourney vẫn là phong cách và khám phá thẩm mỹ. Trong các bài kiểm tra khó về nhận diện/tính nhất quán, một số đánh giá xếp FLUX.2 ở trên, trong khi Midjourney vẫn vượt trội ở một số phong cách sáng tạo nhất định. (so sánh: đánh giá ngành và các bài viết đối chiếu mô hình trực tiếp).
- So với Nano Banana Pro (và các mô hình studio-grade tương tự): Nano Banana Pro và một vài mô hình độc quyền khác được định vị là công cụ studio đa tham chiếu mạnh; FLUX.2 [max] cạnh tranh sát sao về tính nhất quán chỉnh sửa và ảnh thực, đồng thời cung cấp họ sản phẩm rộng hơn cho cân bằng tốc độ/kiểm soát.
Trường hợp sử dụng điển hình trong sản xuất
- Thương mại điện tử / nhiếp ảnh sản phẩm: tạo render sản phẩm nhất quán, phù hợp thương hiệu và nhiều biến thể để A/B testing mà không cần buổi chụp thực.
- Tài nguyên quảng cáo & tiếp thị: tạo hero image, poster và ảnh lifestyle sẵn sàng đưa ra thị trường ở độ phân giải lên tới 4MP cho nhu cầu chiến dịch.
- Liên tục về nhân vật & IP: các studio cần cùng một nhân vật/sản phẩm xuất hiện xuyên suốt nhiều cảnh và chỉnh sửa với nhận diện được bảo toàn.
- Minh họa biên tập & trực quan hóa có căn cứ: trực quan hóa sự kiện hiện tại/thế giới thực hoặc ý tưởng sản phẩm thịnh hành bằng cách dùng grounded generation để bổ sung ngữ cảnh mới. (Cẩn trọng rủi ro pháp lý/đạo đức với người thật.)
- Thiết kế & tạo mẫu: mockup UI, infographic và poster nơi cần văn bản dễ đọc và kiểm soát kiểu chữ.
Cách truy cập Flux 2 Max API
Bước 1: Đăng ký lấy API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy API key thông tin truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy token key: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu đến Flux 2 Max API
Chọn endpoint “flux-2-max” để gửi yêu cầu API và thiết lập request body. Phương thức yêu cầu và request body được lấy từ tài liệu API trên website của chúng tôi. Website của chúng tôi cũng cung cấp Apifox test để bạn tiện dùng thử. Thay thế <YOUR_API_KEY> bằng CometAPI key thực tế từ tài khoản của bạn. base url là flux generate image(https://api.cometapi.com/flux/v1/flux-2-max)
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mô hình sẽ phản hồi. Xử lý phản hồi API để lấy kết quả đã tạo.
Bước 3: Truy xuất và xác minh kết quả
Sau khi tạo xong, bạn có thể dùng endpoint /flux/v1/get_result để truy vấn ảnh đã tạo hoặc theo dõi trạng thái xử lý. Sau khi xử lý, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.
👇 Bắt đầu xây dựng ngay Flux image generation – Tài liệu API