FLUX.2 [max] là mô hình trí tuệ thị giác hàng đầu từ Black Forest Labs (BFL) được thiết kế cho các quy trình sản xuất: marketing, chụp ảnh sản phẩm, thương mại điện tử, các pipeline sáng tạo, và mọi ứng dụng cần tính nhất quán về danh tính nhân vật/sản phẩm, kết xuất chữ chính xác, và chi tiết chân thực ở độ phân giải đa megapixel. Kiến trúc được tối ưu để bám sát prompt, hợp nhất đa tham chiếu (tối đa mười ảnh đầu vào), và grounded generation (khả năng đưa ngữ cảnh web cập nhật vào khi tạo ảnh).
Thông số kỹ thuật (bảng)
| Trường | Giá trị / lưu ý |
|---|---|
| Tên mô hình / biến thể | FLUX.2 [max] (thường được viết là FLUX 2 Max). |
| Loại đầu vào | Nhắc văn bản + ảnh tham chiếu (chấp nhận ảnh đầu vào). |
| Loại đầu ra | Ảnh (chân thực & phong cách hóa), chỉnh sửa ảnh (inpainting/outpainting/retexturing) |
| Ảnh tham chiếu (tối đa) | Tối đa 8 ảnh tham chiếu qua API |
| Độ phân giải gốc tối đa | Tối đa 4 megapixels (ví dụ: ~2048×2048 hoặc cấu hình MP tương đương); kích thước khuyến nghị cho sản xuất thường ≤2MP để cân bằng tốc độ/chi phí. |
| Cửa sổ ngữ cảnh (văn bản) | 32K token văn bản (sức chứa token đầu vào được ghi nhận đối với họ FLUX.2). |
| Độ trễ / tốc độ | Tốc độ tạo “dưới 10 giây” được trích dẫn cho các cấu hình điển hình |
FLUX.2 [max] API là gì?
FLUX.2 [max] API là endpoint được BFL quản lý, cung cấp FLUX.2 [max] cho tạo ảnh từ văn bản theo lập trình, chỉnh sửa ảnh đa tham chiếu, và các quy trình grounded generation. API chấp nhận yêu cầu JSON với prompt văn bản và tùy chọn ảnh tham chiếu, hỗ trợ các tham số tạo ảnh chuẩn (kích thước, số bước, guidance scale, seed), và trả về URL ảnh tạo ra hoặc blob ảnh theo định dạng phản hồi của nhà cung cấp.
Các khả năng API điển hình được cung cấp:
- Điểm cuối tạo Văn bản→Ảnh.
- Điểm cuối chỉnh sửa ảnh / inpainting / outpainting chấp nhận ảnh tham chiếu.
- Đánh chỉ mục đa tham chiếu (gắn thẻ ảnh tham chiếu trong một yêu cầu).
- Tích hợp grounding / tìm kiếm web tùy chọn để đưa ngữ cảnh cập nhật vào hình ảnh được tạo (có ở cấp [max]).
Tính năng chính
- Tạo sinh có neo ngữ cảnh (web context): [max] có thể đưa ngữ cảnh web gần đây, lấy từ nguồn bên ngoài, vào quá trình tạo để hình ảnh phản ánh sản phẩm thịnh hành hoặc các sự kiện hiện tại khi được yêu cầu. Đây là điểm khác biệt nổi bật.
- Độ trung thực cao / đầu ra gốc 4MP: ánh sáng, kết cấu, và hình học ổn định, đạt độ phân giải cấp sản xuất.
- Chỉnh sửa đa tham chiếu & tính nhất quán danh tính mạnh: giữ khuôn mặt và danh tính sản phẩm nhất quán giữa các chỉnh sửa và giữa các cảnh; hỗ trợ nhiều tham chiếu để duy trì danh tính nhất quán giữa các đầu ra.
- Bám sát prompt & trung thành phong cách nâng cao: được tinh chỉnh để tái hiện trung thực các hướng dẫn phong cách phức tạp và duy trì độ chính xác kiểu chữ / văn bản nhỏ tốt hơn các mô hình ảnh thông thường (theo kiểm thử của nhà cung cấp).
- Điều khiển phục vụ sản xuất: các núm điều khiển JSON, dẫn hướng pose, công cụ tái tạo chất liệu, và kiểm soát cao về màu sắc (mã hex) và bố cục cho quy trình studio.
Hiệu năng benchmark
- Xếp hạng LM Arena / Image Arena: FLUX.2 [max] ở vị trí cao trên các bảng xếp hạng tạo ảnh công khai; xếp hạng ELO do cộng đồng đóng góp (LM Arena / Image Arena) cho thấy khoảng 1150–1170 ELO (ví dụ: 1168 ELO ở bảng Text-to-Image tại thời điểm báo cáo), nằm trong nhóm mô hình ảnh hàng đầu ngoài BigTech, dù vẫn sau một vài mục top từ các nhà cung cấp lớn nhất.
- Benchmark thực tiễn: Chất lượng thị giác mạnh so với các mô hình cùng hạng (cân bằng màu, chi tiết kết cấu và dải phong cách sáng tạo thường tốt hơn trong nhiều so sánh trực tiếp).
FLUX 2 max So với Midjourney và Nano Banana
- So với Midjourney v7 / họ Midjourney: các đánh giá cho rằng các biến thể FLUX.2 (Pro/Max) nhắm trực tiếp tới độ trung thực sản xuất và tính nhất quán danh tính đa tham chiếu, trong khi điểm mạnh của Midjourney vẫn là phong cách và khám phá thẩm mỹ. Trong các bài kiểm thử “danh tính/nhất quán” khắt khe, một số đánh giá xếp FLUX.2 nhỉnh hơn, còn Midjourney vẫn vượt trội ở một số phong cách sáng tạo nhất định. (tham chiếu: các bài đánh giá ngành và so sánh mô hình trực tiếp).
- So với Nano Banana Pro (và các mô hình cấp studio tương tự): Nano Banana Pro và một vài mô hình độc quyền khác được định vị là công cụ studio/đa tham chiếu mạnh; FLUX.2 [max] cạnh tranh sát sao về tính nhất quán chỉnh sửa và độ chân thực ảnh, đồng thời cung cấp họ sản phẩm rộng hơn để cân bằng tốc độ/kiểm soát.
Biến thể mô hình
| Biến thể | Mục đích | Thế mạnh chính |
|---|---|---|
| FLUX.2 [max] | Quy trình chuyên nghiệp | Độ trung thực & nhất quán chỉnh sửa cao nhất |
| FLUX.2 [pro] | Hiệu năng cân bằng | Cân bằng tốc độ–chất lượng tốt |
| FLUX.2 [flex] | Kiểm soát có thể điều chỉnh | Tham số tạo chi tiết mịn |
| FLUX.2 [dev] | Nghiên cứu với trọng số mở | Phát triển cục bộ & thử nghiệm |
Trường hợp sử dụng sản xuất điển hình
- Thương mại điện tử / chụp ảnh sản phẩm: tạo các render sản phẩm nhất quán, phù hợp thương hiệu và nhiều biến thể cho A/B testing mà không cần chụp hình thực tế.
- Tài sản quảng cáo & marketing: tạo ảnh hero, poster, và ảnh lifestyle sẵn sàng đưa ra marketplace ở độ phân giải lên đến 4MP cho nhu cầu chiến dịch.
- Tính liên tục nhân vật & IP: studio cần cùng một nhân vật/sản phẩm xuất hiện xuyên suốt nhiều cảnh và chỉnh sửa với danh tính được bảo toàn.
- Minh họa biên tập & trực quan hóa có neo ngữ cảnh: trực quan hóa các sự kiện thực tế hiện tại hoặc ý tưởng sản phẩm thịnh hành bằng grounded generation để thêm ngữ cảnh mới. (Cẩn trọng rủi ro pháp lý/đạo đức với người thật.)
- Thiết kế & tạo mẫu: mockup UI, infographic và poster nơi yêu cầu văn bản dễ đọc và kiểu chữ được kiểm soát.
Cách truy cập Flux 2 Max API
Bước 1: Đăng ký lấy API Key
Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy API key thông tin truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, nhận token key: sk-xxxxx và gửi.
Bước 2: Gửi yêu cầu tới Flux 2 Max API
Chọn endpoint “flux-2-max” để gửi yêu cầu API và thiết lập request body. Phương thức và request body được lấy từ tài liệu API trên website của chúng tôi. Website cũng cung cấp bài kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng CometAPI key thực tế từ tài khoản của bạn. base url là flux generate image(https://api.cometapi.com/flux/v1/flux-2-max)
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — mô hình sẽ phản hồi nội dung này. Xử lý phản hồi API để lấy kết quả được tạo.
Bước 3: Truy xuất và xác minh kết quả
Sau khi tạo, bạn có thể dùng endpoint /flux/v1/get_result để truy vấn ảnh đã tạo hoặc theo dõi trạng thái xử lý. Sau khi hoàn tất, API phản hồi trạng thái tác vụ và dữ liệu đầu ra.
👇 Bắt đầu xây dựng ngay Tạo ảnh Flux – Tài liệu API