FLUX.2 là dòng sản phẩm thế hệ thứ hai của Black Forest Labs về các mô hình tạo ảnh và chỉnh sửa ảnh (ra mắt ngày 25 tháng 11 năm 2025). Sản phẩm cung cấp tính chân thực cấp sản xuất, chỉnh sửa đa tham chiếu lên đến 4MP, hỗ trợ cấu trúc/JSON, cùng nhiều lựa chọn điểm cuối được quản lý (Pro, Flex) và tùy chọn mở (Dev).
Tin tốt là CometAPI đã tích hợp API Flux.2. Hướng dẫn này giải thích FLUX.2 là gì, cách gọi API và các quy trình làm việc nâng cao (văn bản→hình ảnh, điều khiển linh hoạt, chỉnh sửa đa tham chiếu), kèm theo các ví dụ mã và phương pháp hay nhất.
FLUX.2 là gì và tại sao nó lại quan trọng?
FLUX.2 là phiên bản tiếp theo của dòng mô hình hình ảnh FLUX — được thiết kế để tạo văn bản thành hình ảnh độ trung thực cao và chỉnh sửa hình ảnh đa tham chiếu ở độ phân giải sản xuất (lên đến ~4 megapixel). FLUX.2 được xây dựng cho các quy trình sáng tạo thực tế (tài sản an toàn cho thương hiệu, ký tự và phong cách nhất quán trên các tham chiếu, kiểu chữ đẹp hơn và các chi tiết nhỏ) thay vì bản demo, và nhằm mục đích thu hẹp khoảng cách giữa hình ảnh được tạo và hình ảnh thực tế.
Kết quả chính FLUX.2 được thiết kế để cung cấp
- Đầu ra chân thực phù hợp cho quảng cáo, hình ảnh sản phẩm và mô hình UI.
- Chỉnh sửa đa tham chiếu gốc: kết hợp, hoán đổi hoặc soạn thảo các thành phần từ nhiều hình ảnh đầu vào trong một lần chỉnh sửa.
- Các biến thể cho các trường hợp sử dụng khác nhau: mô hình nhà phát triển có sẵn công khai, điểm cuối Pro được tối ưu hóa cho sản xuất và điểm cuối Flex để kiểm soát cấp thấp.
Ở cấp độ cao, FLUX.2 kết hợp xương sống sinh tiềm ẩn (kiến trúc luồng/biến đổi) với mô hình ngôn ngữ thị giác để làm nền tảng ngữ nghĩa, và một VAE mới được đào tạo để cung cấp một không gian tiềm ẩn chung cho các biến thể. Thiết kế này cho phép mô hình thực hiện cả việc sinh và tái tạo (chỉnh sửa) với độ trung thực cao hơn, đồng thời vẫn giữ được tính dễ học của biểu diễn để đào tạo và tinh chỉnh. VAE mở đặc biệt đáng chú ý vì nó chuẩn hóa không gian tiềm ẩn cho các quy trình làm việc được lưu trữ và tự lưu trữ.
Điều này quan trọng: việc kết hợp ngôn ngữ và khớp dòng chảy tiềm ẩn mang lại khả năng theo dõi nhanh hơn (do đó, các hướng dẫn sáng tác nhiều phần hoạt động theo cách có thể dự đoán được), kiểu chữ đẹp hơn và một kiến trúc duy nhất hỗ trợ cả việc tạo và chỉnh sửa với nhiều tham chiếu. Đối với người sáng tạo, điều này đồng nghĩa với việc đầu ra đáng tin cậy hơn cho các hướng dẫn phức tạp và đầu vào hỗn hợp (văn bản + hình ảnh).
Làm thế nào để truy cập API FLUX.2?
Chuẩn bị môi trường
Đăng ký và đăng nhập vào CometAPI và lấy khóa API từ bảng thông tin cá nhân. Lý tưởng nhất là bạn nên có một số kiến thức về API với tư cách là nhà phát triển (chúng tôi sẽ hỗ trợ bạn về vấn đề này, vì vậy đừng lo lắng).
Bạn cũng cần phải chọn phương thức yêu cầu mong muốn và mô hình Flux.2 phù hợp.
Điểm cuối và xác thực nào là cần thiết?
API Dự đoán Replicate cung cấp quyền truy cập để tạo hình ảnh chất lượng cao bằng cách sử dụng nhiều mô hình FLUX từ Black Forest Labs thông qua định dạng Replicate tiêu chuẩn. API này hỗ trợ một loạt các biến thể mô hình FLUX toàn diện, mỗi biến thể được tối ưu hóa cho các trường hợp sử dụng khác nhau, từ tạo mẫu nhanh đến tạo hình ảnh chuyên nghiệp. Người dùng có thể dễ dàng chuyển đổi giữa các mô hình khác nhau bằng cách chỉ cần thay đổi tên mô hình trong đường dẫn URL (https://api.cometapi.com/replicate/v1/models/{models}/predictions), giúp API này linh hoạt cho nhiều ứng dụng sáng tạo và thương mại.
Sao chổiAPI hiển thị các điểm cuối được quản lý tại https://api.cometapi.com/flux/v1/{model} và đặt tên cho các điểm cuối như flux-2-pro, flux-2-flex và flux-2-flex để tạo và chỉnh sửa hình ảnh. Yêu cầu cần có khóa API trong x-key tiêu đề .
Gia đình mô hình & tính toán sự đánh đổi
- FLUX.2 (trọng số mở) — Sử dụng khi bạn cần kiểm soát cục bộ, nghiên cứu thử nghiệm hoặc chạy suy luận trên cơ sở hạ tầng của riêng bạn. Dev là phiên bản mở (32B) và tuyệt vời cho nghiên cứu khám phá và tinh chỉnh. Nó có thể cấu hình dễ dàng hơn, nhưng bạn phải chịu trách nhiệm về cơ sở hạ tầng và tối ưu hóa.
- FLUX.2 chuyên nghiệp — Cân bằng tốt nhất giữa tốc độ, chất lượng và chi phí sản xuất. Phiên bản Pro được tinh chỉnh để có độ trễ dự đoán được, tuân thủ nhắc nhở nhất quán, tốc độ xử lý nhanh và hỗ trợ tối đa 8 ảnh tham chiếu API (tổng cộng 9MP qua API). Sử dụng phiên bản này khi chỉnh sửa khối lượng lớn và khi bạn cần độ tin cậy và giá cả dự đoán được.
- FLUX.2 (được quản lý + khả năng kiểm soát) — Tiết lộ các điều khiển thế hệ cấp thấp (ví dụ,
steps,guidance) và hỗ trợ nhiều tham chiếu hơn (tối đa 10) cùng chất lượng/chi tiết cao hơn một chút khi bạn chấp nhận độ trễ và chi phí cao hơn. Sử dụng Flex khi bạn cần kiểm soát sáng tạo cuối cùng — độ trung thực của kiểu chữ, màu sắc chính xác hoặc điều chỉnh bố cục chi tiết cao.
Nguyên mẫu trên Dev hoặc giá rẻ pro lập kế hoạch, sau đó di chuyển đến pro cho quy mô hoặc uốn cong để có bản kết xuất cuối cùng được kiểm soát chặt chẽ.
Làm thế nào để sử dụng API FLUX.2?
Vòng đời yêu cầu (mô hình nhiệm vụ + thăm dò)
Phản hồi cho các yêu cầu chỉnh sửa/tạo là đối tượng nhiệm vụ bao gồm một polling_url và id; bạn tạo một yêu cầu và sau đó thăm dò (hoặc sử dụng webhooks) để lấy URL kết quả đã ký. URL đã ký có thời gian tồn tại ngắn (thường khoảng 10 phút) nên cần lấy kết quả đầu ra nhanh chóng.
API được lưu trữ tuân theo mô hình tác vụ không đồng bộ:
- POST một yêu cầu tạo → trả về một
task idvàpolling_urlcộng với ước tínhcost. - Thăm dò ý kiến
polling_urlcho đến khistatus == "Ready", sau đó lấy kết quả hình ảnh (thường là base64 hoặc URL được lưu trữ).
Ví dụ: Python (yêu cầu) — gửi & thăm dò
import time, requests, os
API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"
payload = {
"prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
"width": 1024, "height": 1024, "seed": 42
}
r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task
while True:
time.sleep(0.5)
status_r = requests.get(polling_url, headers={"x-key": API_KEY})
status_r.raise_for_status()
status = status_r.json()
if status == "Ready":
print("Result URL:", status)
break
elif status in ("Error", "Failed"):
print("Generation failed:", status)
break
Mẫu này (gửi → thăm dò hoặc webhook) là luồng đồng bộ/không đồng bộ chính cho các điểm cuối được quản lý.
Chỉnh sửa hình ảnh — ví dụ tối thiểu (curl với URL đầu vào)
curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
-H "accept: application/json" \
-H "x-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
"input_image": "https://example.com/my-photo.jpg",
"width": 2048,
"height": 1536
}'
Để chỉnh sửa nhiều tài liệu tham khảo, hãy sử dụng input_image, input_image_2, input_image_3, … (Pro hỗ trợ tối đa 8 tham chiếu qua API; Flex hỗ trợ tối đa 10; Dev khuyến nghị tối đa ~6 tùy thuộc vào bộ nhớ).
Tôi nên gửi những thông số cơ bản nào?
Các trường nội dung yêu cầu quan trọng (chỉnh sửa/tạo hình ảnh) bao gồm:
guidancevàsteps— cho phép kiểm soát chi tiết.prompt(chuỗi) — tối đa 32K mã thông báo; ngôn ngữ tự nhiên chi tiết hoặc JSON có cấu trúc.input_image(chuỗi) — bắt buộc để chỉnh sửa (URL hoặc base64).input_image_2...input_image_9— hình ảnh có nhiều tham chiếu.width/height— bội số của 16; đầu ra tối đa 4MP.seed— số nguyên để có thể tái tạo.safety_tolerance— mức độ vừa phải.
Làm thế nào tôi có thể tận dụng FLUX.2 Pro để tạo văn bản thành hình ảnh chuyên nghiệp?
FLUX.2 Pro được tinh chỉnh để mang lại đầu ra đáng tin cậy và chất lượng cao. Hãy sử dụng khi bạn cần kết quả nhất quán ở cấp độ thương hiệu, thời gian hoàn thành nhanh chóng và cam kết chất lượng dịch vụ (SLA) cho doanh nghiệp.
Công thức quy trình làm việc — hình ảnh sản xuất
- Lời nhắc tiền xử lý: giữ một dòng "ý định" ngắn gọn cùng với phần thuộc tính có cấu trúc (ánh sáng, ống kính, tâm trạng, mã màu hex cho màu thương hiệu). FLUX.2 hỗ trợ điều hướng màu hex để giúp bảo tồn bảng màu thương hiệu.
- Bắt đầu với các mặc định bảo thủ: các bước 30–50 và thang hướng dẫn 6–9.0; tăng các bước để biết chi tiết, tăng hướng dẫn để kết quả tuân thủ chặt chẽ hơn với lời nhắc.
- Sử dụng hạt giống + lấy mẫu xác định để có thể tái tạo trong thử nghiệm A/B.
- Sử dụng điểm cuối Pro để lấy mẫu nhiều lần: yêu cầu N biến thể song song và chọn biến thể tốt nhất — rẻ hơn và nhanh hơn so với điều chỉnh siêu tham số thủ công.
- Hậu xử lý: khử nhiễu, ánh xạ tông màu nhỏ hoặc chỉnh sửa theo kiểu vector trong một quy trình xác định. Hãy cân nhắc sử dụng GAN nhỏ hoặc siêu phân giải nếu bạn cần đầu ra cao hơn bản gốc.
Tại sao những bước này có ích: Phiên bản Pro cân bằng giữa tốc độ và độ trung thực, đồng thời thường áp dụng các bộ lọc nội dung/an toàn sau khi tạo, do đó đây là tùy chọn mặc định hợp lý cho các tài sản hướng đến khách hàng.
Mẹo hay nhất để tạo hình ảnh
1. Thúc đẩy có cấu trúc mang lại lợi ích cho sản xuất. Sắp xếp các gợi ý theo thứ tự ưu tiên: chủ đề → hành động → phong cách → ngữ cảnh. Sử dụng gợi ý JSON (cảnh, chủ đề, máy ảnh, ánh sáng, bảng màu) khi bạn cần bố cục xác định trên nhiều hình ảnh. Ví dụ về cách sử dụng lược đồ JSON (giả):
{
"scene": "product shot",
"subjects": [
{"type":"mug","pose":"center","style":"ceramic, matte"},
{"type":"background","style":"wooden desk, window light"}
],
"camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}
2. Tính tái lập: Qua seed để tái tạo sau này. Giữ lời nhắc ánh xạ danh mục + hạt giống → hình ảnh để truy xuất nguồn gốc.
3. Hàng loạt và phối hợp: Đối với các đợt sản xuất lớn, hãy gửi nhiều yêu cầu song song với Pro, nhưng giới hạn tốc độ để tránh bị nghẽn; ưu tiên điểm cuối Pro vì độ trễ có thể dự đoán được. Sử dụng hàng đợi công việc và nhóm công nhân để tải xuống nhanh chóng các kết quả đã ký khi sẵn sàng.
4. Điều độ và an toàn: Sử dụng safety_tolerance để kiểm soát mức độ nghiêm ngặt của việc kiểm duyệt. Các điểm cuối chuyên nghiệp bao gồm chính sách sử dụng và các móc kiểm duyệt nội dung; tích hợp các kiểm tra phía máy chủ trước khi xuất bản.
5. Hậu xử lý: Đầu ra chuyên nghiệp có chất lượng cao nhưng đôi khi cần chỉnh sửa nhỏ. Hãy xây dựng một bước hậu kỳ tự động (cắt, chỉnh màu, ghép ảnh) trong quy trình của bạn và duy trì việc kiểm duyệt thủ công đối với các tài sản nhạy cảm với thương hiệu.
Làm thế nào tôi có thể tùy chỉnh đầu ra bằng điểm cuối FLUX.2 Flex?
Flex là biến thể của “công cụ phẫu thuật”: điều chỉnh các bước, hướng dẫn, lời nhắc tiêu cực, kích thước ô và số lượng tham chiếu để định hình đầu ra một cách chính xác.
Khi nào nên chọn Flex
- Bạn cần kết xuất kiểu chữ chính xác (mô hình UI, nhãn).
- Bạn phải kết hợp nhiều tài liệu tham khảo với khả năng kiểm soát tư thế và ánh sáng.
- Bạn đang thử nghiệm các kỹ thuật nhắc nhở nâng cao (nhắc nhở có cấu trúc, chuỗi ràng buộc).
Ví dụ — Các phím điều khiển Flex và tác dụng của chúng
steps— nhiều bước hơn = chi tiết hơn (phải trả giá bằng độ trễ).guidance_scale— cao hơn = gần với lời nhắc trong văn bản hơn, thấp hơn = sáng tạo hơn.negative_prompt— xóa bỏ các thành phần một cách rõ ràng (ví dụ: “không có hình mờ, không có ngón tay thừa”).tile_size/tiled_inference— để tạo ra độ phân giải cực cao, hãy sắp xếp không gian suy luận để đổi bộ nhớ lấy tốc độ.reference_weights— một số điểm cuối cho phép bạn cân nhắc các tham chiếu đến sự thiên vị mà hình ảnh thúc đẩy tư thế so với phong cách.
Mẹo thực tế: Đối với các bố cục phức tạp, hãy chạy một bản xem trước ngắn, ít hướng dẫn để kiểm tra bố cục, sau đó nâng cấp với nhiều bước hơn và hướng dẫn cao hơn. Kỹ thuật hai lần này giúp giảm chi phí mà vẫn cho ra kết quả cuối cùng chính xác.
Ví dụ: Yêu cầu linh hoạt với các bước và hướng dẫn
curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
-H "Content-Type: application/json" \
-H "x-key: $BFL_API_KEY" \
-d '{
"prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
"width": 1536, "height": 2048,
"steps": 50,
"guidance": 7.5,
"seed": 99999
}'
Mẹo: Sử dụng Flex trong quá trình phê duyệt sáng tạo cuối cùng và Pro cho các quy trình quy mô lớn, nhanh hơn. Flex dễ kiểm soát hơn đáng kể đối với các tác vụ về kiểu chữ và chi tiết nhỏ.
Thực hành tốt nhất cho việc sử dụng sản xuất
Dưới đây là các mô hình đã được kiểm chứng thực tế và lời khuyên thực tế để tích hợp FLUX.2 ở quy mô lớn.
1) Kiểm soát chi phí bằng cách theo dõi megapixel và lưu trữ đệm
Thanh toán FLUX.2 dựa trên megapixel của đầu vào + đầu ra. Đối với việc tạo khối lượng lớn, hãy ưu tiên các bản render xem trước nhỏ hơn (các bước nhanh với độ phân giải thấp) và chỉ nâng cấp lên các bản render cuối cùng có MP cao hơn. Lưu trữ các tài sản đã render (hoặc lưu trữ các khác biệt) để bạn không render lại các tác vụ giống hệt nhau. Luôn luôn hiển thị cost trong phản hồi và ghi lại theo yêu cầu.
2) Sử dụng các tầng một cách thông minh: xem trước so với phân tách kết xuất cuối cùng
- Chạy bản render Pro nhanh, ít bước để tạo nguyên mẫu hoặc nhiều biến thể.
- Sử dụng Flex hoặc High-MP Pro cho các bản in đầu ra được phê duyệt cuối cùng, khi độ trung thực là yếu tố quan trọng. Phương pháp kết hợp này cân bằng giữa thông lượng và chất lượng hình ảnh cuối cùng.
3) Kỹ thuật nhắc nhở → nhắc nhở có cấu trúc & JSON
Tận dụng lợi thế của FLUX.2 nhắc nhở JSON có cấu trúc khi bạn cần bố cục xác định (đối tượng cảnh, máy ảnh, tư thế, mẫu màu hex). Điều này giúp giảm thiểu các chu kỳ nhắc nhở lặp đi lặp lại và tạo ra các lô có thể tái tạo được nhiều hơn. Ví dụ của Cloudflare hiển thị các nhắc nhở JSON được nhúng trong các biểu mẫu nhiều phần.
4) Seed + phiên bản để tái tạo
Khi bạn cần kết quả có thể tái tạo, hãy vượt qua seed và ghi lại phiên bản/dấu thời gian của mô hình trong siêu dữ liệu. Đối với các quy trình tài sản xác định, hãy giữ một manifest: prompt, seed, model variant, resolution, reference image hash. Điều này cải thiện khả năng truy xuất nguồn gốc và các tùy chọn khôi phục.
Kết luận
FLUX.2 hướng đến mục tiêu thu hẹp khoảng cách giữa "bản demo ấn tượng" và "công cụ sáng tạo sản xuất". Với khả năng chỉnh sửa đa tham chiếu, đầu ra có độ phân giải cao và một bộ điểm cuối được lưu trữ (cùng với mã suy luận mở và bản dựng người dùng lượng tử), FLUX.2 mang đến cho các nhóm nhiều lựa chọn thiết thực: chạy cục bộ để nghiên cứu và tùy chỉnh hoặc sử dụng điểm cuối Pro/Flex được lưu trữ cho các quy trình sản xuất ổn định.
Các nhà phát triển có thể truy cập API phát triển Flux.2, API linh hoạt Flux.2 và API Flux.2 Pro thông qua CometAPI. Để bắt đầu, hãy khám phá khả năng mô hình của CometAPI trong Sân chơi và tham khảo ý kiến Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. VớietAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.
Sẵn sàng chưa?→ Đăng ký CometAPI ngay hôm nay !
Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, X và Discord!
