Cách sử dụng API Flux.2? Tất cả những gì bạn cần biết

CometAPI
AnnaNov 27, 2025
Cách sử dụng API Flux.2? Tất cả những gì bạn cần biết

FLUX.2 là dòng mô hình tạo và chỉnh sửa hình ảnh thế hệ thứ hai của Black Forest Labs (phát hành Nov 25, 2025). Nó cung cấp mức chân thực đạt chuẩn sản xuất, chỉnh sửa đa tham chiếu tới 4MP, nhắc có cấu trúc/JSON, cùng lựa chọn endpoint được quản lý (Pro, Flex) và tùy chọn trọng số mở (Dev).

Tin vui là CometAPI đã tích hợp Flux.2 API. Hướng dẫn này giải thích FLUX.2 là gì, cách gọi API, và các quy trình nâng cao (văn bản→hình ảnh, điều khiển linh hoạt, chỉnh sửa đa tham chiếu), kèm ví dụ mã và thực tiễn tốt nhất.

FLUX.2 là gì và tại sao quan trọng?

FLUX.2 là phiên bản tiếp nối của họ mô hình FLUX — được thiết kế cho tạo hình ảnh từ văn bản độ trung thực cao và chỉnh sửa hình ảnh đa tham chiếu ở độ phân giải sản xuất (tới ~4 megapixels). FLUX.2 được xây dựng cho quy trình sáng tạo thực tế (tài sản an toàn thương hiệu, nhân vật và phong cách nhất quán giữa các tham chiếu, chữ nghĩa và chi tiết nhỏ tốt hơn) thay vì chỉ trình diễn, và hướng tới thu hẹp khoảng cách giữa hình ảnh sinh và ảnh thực.

Kết quả chính mà FLUX.2 hướng tới

  • Đầu ra chân thực phù hợp cho quảng cáo, ảnh sản phẩm và mockup UI.
  • Chỉnh sửa đa tham chiếu nguyên gốc: kết hợp, hoán đổi, hoặc bố cục các thành tố từ nhiều ảnh đầu vào trong một lần chỉnh sửa.
  • Biến thể cho các trường hợp dùng khác nhau: mô hình dành cho nhà phát triển có sẵn công khai, endpoint Pro tối ưu cho sản xuất, và endpoint Flex cho điều khiển cấp thấp.

Ở mức tổng quan, FLUX.2 kết hợp một backbone sinh tiềm ẩn (kiến trúc flow/transformer) với mô hình thị giác–ngôn ngữ để cố định ngữ nghĩa, và một VAE được huấn luyện mới để cung cấp không gian tiềm ẩn chung giữa các biến thể. Thiết kế này cho phép mô hình vừa sinh vừa tái tạo (chỉnh sửa) với độ trung thực cao hơn, đồng thời giữ cho biểu diễn có thể học được để huấn luyện và tinh chỉnh. VAE mở đặc biệt đáng chú ý vì nó chuẩn hóa không gian tiềm ẩn cho cả quy trình lưu trữ và tự lưu trữ.

Tại sao điều đó quan trọng: việc ghép nối ngôn ngữ và khớp dòng tiềm ẩn mang lại khả năng bám sát prompt mạnh hơn (để các hướng dẫn đa phần, mang tính kết hợp hoạt động có thể dự đoán), chữ nghĩa tốt hơn, và một kiến trúc duy nhất hỗ trợ cả sinh lẫn chỉnh sửa với nhiều tham chiếu. Với người sáng tạo, điều đó nghĩa là đầu ra đáng tin cậy hơn cho hướng dẫn phức tạp và đầu vào hỗn hợp (văn bản + hình ảnh).

Tôi truy cập FLUX.2 API như thế nào?

Chuẩn bị môi trường

Đăng ký và đăng nhập CometAPI, lấy khóa API từ bảng điều khiển hồ sơ của bạn. Lý tưởng nhất là bạn có một số kiến thức về API với tư cách lập trình viên (chúng tôi sẽ hỗ trợ phần này, nên đừng lo).

Bạn cũng sẽ cần chọn phương thức yêu cầu mong muốn và mô hình Flux.2 phù hợp.

Cần những endpoint, xác thực nào?

Replicate Predictions API cung cấp khả năng tạo ảnh chất lượng cao bằng nhiều mô hình FLUX từ Black Forest Labs thông qua định dạng Replicate tiêu chuẩn. API này hỗ trợ dải biến thể mô hình FLUX toàn diện, mỗi biến thể tối ưu cho các mục đích khác nhau từ thử nghiệm nhanh tới tạo ảnh cấp chuyên nghiệp. Người dùng có thể chuyển đổi linh hoạt giữa các mô hình chỉ bằng cách thay đổi tên mô hình trong đường dẫn URL (https://api.cometapi.com/replicate/v1/models/{models}/predictions), giúp phù hợp nhiều ứng dụng sáng tạo và thương mại.

CometAPI cung cấp các endpoint được quản lý tại https://api.cometapi.com/flux/v1/{model} và đặt tên endpoint như flux-2-pro, flux-2-flex và flux-2-flex cho tạo và chỉnh sửa ảnh. Yêu cầu cần khóa API trong header x-key.

Dòng mô hình & đánh đổi tài nguyên tính toán

  • FLUX.2 (open weights) — Dùng khi bạn cần kiểm soát cục bộ, thử nghiệm nghiên cứu, hoặc chạy suy luận trên hạ tầng của riêng bạn. Dev là trọng số mở (32B) và rất tốt cho nghiên cứu thăm dò và tinh chỉnh. Cấu hình linh hoạt hơn, nhưng bạn chịu trách nhiệm về hạ tầng và tối ưu.
  • FLUX.2 pro — Cân bằng tốt nhất giữa tốc độ, chất lượng và chi phí cho sản xuất. Pro được tinh chỉnh cho độ trễ có thể dự đoán, bám prompt nhất quán, thông lượng nhanh, và hỗ trợ tới 8 ảnh tham chiếu qua API (tổng 9MP). Dùng cho chỉnh sửa khối lượng lớn khi bạn cần độ tin cậy và giá cả có thể dự đoán.
  • FLUX.2 (managed + controllability) — Mở các điều khiển sinh cấp thấp (ví dụ, steps, guidance) và hỗ trợ nhiều tham chiếu hơn (tới 10) cùng chất lượng/chi tiết cao hơn đôi chút khi chấp nhận độ trễ và chi phí lớn hơn. Dùng Flex khi bạn cần kiểm soát sáng tạo cuối cùng — độ trung thực kiểu chữ, màu sắc chính xác, hoặc điều chỉnh bố cục chi tiết cao.

Hãy dựng mẫu trên Dev hoặc gói Pro chi phí thấp, sau đó chuyển sang Pro cho quy mô hoặc Flex cho kết xuất cuối cùng kiểm soát cao.

Tôi sử dụng FLUX.2 API như thế nào?

Vòng đời yêu cầu (mô hình tác vụ + thăm dò)

Phản hồi cho các yêu cầu chỉnh sửa/tạo là các đối tượng tác vụ có polling_urlid; bạn tạo yêu cầu rồi thăm dò (hoặc dùng webhook) để lấy URL kết quả đã ký. URL đã ký có thời hạn ngắn (thường ~10 phút) nên hãy tải kết quả kịp thời.

API lưu trữ tuân theo mô hình tác vụ bất đồng bộ:

  1. Gửi yêu cầu tạo (POST) → trả về task idpolling_url cùng cost ước tính.
  2. Thăm dò polling_url tới khi status == "Ready", sau đó lấy ảnh kết quả (thường là base64 hoặc URL được lưu trữ).

Ví dụ: Python (requests) — gửi & thăm dò

import time, requests, os

API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"

payload = {
    "prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
    "width": 1024, "height": 1024, "seed": 42
}

r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task

while True:
    time.sleep(0.5)
    status_r = requests.get(polling_url, headers={"x-key": API_KEY})
    status_r.raise_for_status()
    status = status_r.json()
    if status == "Ready":
        print("Result URL:", status)
        break
    elif status in ("Error", "Failed"):
        print("Generation failed:", status)
        break

Mẫu này (gửi → thăm dò hoặc webhook) là luồng đồng bộ/bất đồng bộ chính cho các endpoint được quản lý.

Chỉnh sửa ảnh — ví dụ tối giản (curl với URL đầu vào)

curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
  -H "accept: application/json" \
  -H "x-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
    "input_image": "![image](https://example.com/my-photo.jpg)",
    "width": 2048,
    "height": 1536
  }'

Với chỉnh sửa đa tham chiếu, dùng input_image, input_image_2, input_image_3, … (Pro hỗ trợ tới 8 tham chiếu qua API; Flex tới 10; Dev khuyến nghị tối đa ~6 tùy theo bộ nhớ).

Tôi nên gửi những tham số cơ bản nào?

Các trường body quan trọng (chỉnh sửa/tạo ảnh) gồm:

  • guidancesteps — cho phép điều khiển chi tiết.
  • prompt (string) — tối đa 32K tokens; ngôn ngữ tự nhiên chi tiết hoặc JSON có cấu trúc.
  • input_image (string) — bắt buộc cho chỉnh sửa (URL hoặc base64).
  • input_image_2input_image_9 — ảnh đa tham chiếu.
  • width / height — bội số của 16; đầu ra tối đa 4MP.
  • seed — số nguyên để tái lập.
  • safety_tolerance — mức kiểm duyệt.

Tôi có thể tận dụng FLUX.2 Pro cho tạo ảnh từ văn bản chuyên nghiệp như thế nào?

FLUX.2 Pro được tinh chỉnh cho đầu ra đáng tin cậy, chất lượng cao. Dùng khi bạn cần kết quả cấp thương hiệu nhất quán, thời gian xử lý nhanh và SLA doanh nghiệp.

Công thức quy trình — hình ảnh sản xuất

  1. Tiền xử lý prompt: giữ một dòng “ý định” ngắn cộng phần thuộc tính có cấu trúc (ánh sáng, ống kính, tâm trạng, mã màu hex cho màu thương hiệu). FLUX.2 hỗ trợ điều hướng màu bằng mã hex để giữ bảng màu thương hiệu.
  2. Bắt đầu với mặc định thận trọng: steps 30–50 và guidance scale 6–9.0; tăng steps để có chi tiết, tăng guidance để kết quả bám chặt prompt hơn.
  3. Dùng seed + lấy mẫu xác định để tái lập trong thử nghiệm A/B.
  4. Dùng endpoint Pro cho lấy mẫu nhiều lần: yêu cầu N biến thể song song và chọn tốt nhất — rẻ và nhanh hơn tinh chỉnh tham số thủ công.
  5. Hậu xử lý: khử nhiễu, ánh xạ tông nhỏ, hoặc chạm khắc kiểu vector trong pipeline xác định. Cân nhắc một GAN nhỏ hoặc siêu phân giải nếu cần cao hơn đầu ra gốc.

Vì sao các bước này hữu ích: Pro cân bằng tốt giữa tốc độ và độ trung thực và thường áp dụng bộ lọc an toàn/nội dung sau sinh, nên là lựa chọn mặc định hợp lý cho tài sản hướng khách hàng.

Mẹo hay nhất để tạo ảnh

  1. Nhắc có cấu trúc thắng thế cho sản xuất. Tổ chức prompt theo ưu tiên: chủ thể → hành động → phong cách → ngữ cảnh. Dùng nhắc JSON (scene, subjects, camera, lighting, color_palette) khi bạn cần bố cục quyết định giữa nhiều ảnh. Ví dụ dùng schema JSON (giả lập):
{
  "scene": "product shot",
  "subjects": [
    {"type":"mug","pose":"center","style":"ceramic, matte"},
    {"type":"background","style":"wooden desk, window light"}
  ],
  "camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}
  1. Khả năng tái lập: Truyền seed để tái tạo sau này. Giữ một danh mục ánh xạ prompt + seed → ảnh để truy xuất nguồn gốc.
  2. Lô & điều phối: Với sản xuất lớn, gửi nhiều yêu cầu song song tới Pro, nhưng giới hạn tốc độ để tránh nghẽn; ưu tiên endpoint Pro cho độ trễ có thể dự đoán. Dùng hàng đợi công việc và nhóm worker để tải kết quả đã ký nhanh khi sẵn sàng.
  3. Kiểm duyệt & an toàn: Dùng safety_tolerance để điều khiển độ nghiêm của kiểm duyệt. Endpoint Pro bao gồm chính sách sử dụng và hook kiểm duyệt nội dung; tích hợp kiểm tra phía server trước khi xuất bản.
  4. Hậu xử lý: Đầu ra Pro chất lượng cao nhưng đôi khi cần chỉnh nhẹ. Xây dựng bước hậu xử lý tự động (cắt, cân màu, ghép) trong pipeline và giữ phần review thủ công cho tài sản nhạy cảm thương hiệu.

Tôi có thể tùy biến đầu ra với endpoint FLUX.2 Flex như thế nào?

Flex là biến thể “phẫu thuật”: tinh chỉnh steps, guidance, negative prompts, kích thước ô, và số tham chiếu để định hình đầu ra chính xác.

Khi nào nên chọn Flex

  • Bạn cần render kiểu chữ chính xác (mockup UI, nhãn).
  • Bạn phải dàn dựng nhiều tham chiếu với kiểm soát tư thế và ánh sáng.
  • Bạn đang thử kỹ thuật prompt nâng cao (prompt có cấu trúc, chuỗi ràng buộc).

Ví dụ — khóa điều khiển của Flex và tác dụng

  • steps — nhiều bước hơn = chi tiết mịn hơn (đổi lại độ trễ).
  • guidance_scale — cao hơn = bám sát prompt văn bản hơn, thấp hơn = sáng tạo hơn.
  • negative_prompt — loại bỏ tường minh các thành tố (ví dụ, “no watermark, no extra fingers”).
  • tile_size / tiled_inference — cho tạo ảnh độ phân giải rất cao, chia ô không gian suy luận để đánh đổi bộ nhớ lấy tốc độ.
  • reference_weights — một số endpoint cho phép đặt trọng số tham chiếu để thiên lệch ảnh nào dẫn tư thế vs. phong cách.

Mẹo thực tiễn: Với bố cục phức tạp, chạy bản xem trước ngắn, guidance thấp để xác nhận bố cục, sau đó upscale với nhiều bước và guidance cao hơn. Hai pha này giảm chi phí nhưng cho đầu ra cuối cùng chính xác.

Ví dụ: yêu cầu Flex với steps & guidance

curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
  -H "Content-Type: application/json" \
  -H "x-key: $BFL_API_KEY" \
  -d '{
    "prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
    "width": 1536, "height": 2048,
    "steps": 50,
    "guidance": 7.5,
    "seed": 99999
  }'

Mẹo: Dùng Flex trong các vòng duyệt sáng tạo cuối cùng và Pro cho pipeline quy mô lớn, nhanh. Flex kiểm soát đáng kể tốt hơn cho kiểu chữ và chi tiết vi mô.

Thực tiễn tốt nhất cho sử dụng sản xuất

Dưới đây là các mẫu đã kiểm chứng và lời khuyên thực dụng để tích hợp FLUX.2 ở quy mô.

1) Kiểm soát chi phí bằng cách theo dõi megapixels & caching

Tính phí FLUX.2 dựa trên megapixels của đầu vào + đầu ra. Với tạo ảnh khối lượng lớn, ưu tiên render xem trước nhỏ (bước nhanh độ phân giải thấp) và chỉ nâng lên render MP cao cho bản cuối. Tạm lưu (cache) tài sản đã render (hoặc lưu phần chênh lệch) để không render lại công việc y hệt. Luôn hiển thị cost trong phản hồi và ghi log theo yêu cầu.

2) Dùng tầng một cách thông minh: tách bản xem trước và kết xuất cuối

  • Chạy render Pro nhanh, ít bước cho dựng mẫu hoặc nhiều biến thể.
  • Dùng Flex hoặc chạy Pro MP cao cho đầu ra đã duyệt nơi độ trung thực quan trọng. Cách kết hợp này cân bằng thông lượng và chất lượng ảnh cuối.

3) Kỹ thuật prompt → nhắc có cấu trúc & JSON

Tận dụng nhắc JSON có cấu trúc của FLUX.2 khi bạn cần bố cục quyết định (đối tượng cảnh, camera, tư thế, bảng màu hex). Điều này giảm các vòng lặp prompt và dẫn tới lô tái lập hơn. Ví dụ Cloudflare cho thấy prompt JSON được nhúng trong form multipart.

4) Seed + versioning để tái lập

Khi cần kết quả có thể tái lập, truyền seed và ghi lại phiên bản mô hình/dấu thời gian trong metadata. Cho pipeline tài sản quyết định, giữ một manifest: prompt, seed, biến thể mô hình, độ phân giải, băm ảnh tham chiếu. Điều này cải thiện truy vết và khả năng rollback.

Kết luận

FLUX.2 nhắm trực diện vào việc thu hẹp khoảng cách giữa “demo ấn tượng” và “công cụ sáng tạo sản xuất”. Với chỉnh sửa đa tham chiếu, đầu ra độ phân giải cao, và bộ endpoint lưu trữ (cùng mã suy luận mở và bản lượng tử cho người dùng), nó mang tới nhiều lựa chọn thực tế: chạy cục bộ cho nghiên cứu và tùy biến, hoặc dùng endpoint Pro/Flex lưu trữ cho pipeline sản xuất ổn định.

Nhà phát triển có thể truy cập Flux.2 Dev API, Flux.2 Flex APIFlux.2 Pro API qua CometAPI. Để bắt đầu, hãy khám phá khả năng mô hình của CometAPI trong Playground và tham khảo Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, hãy đảm bảo bạn đã đăng nhập CometAPI và lấy khóa API. CometAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.

Sẵn sàng bắt đầu?→ Đăng ký CometAPI ngay hôm nay!

Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, XDiscord!

Sẵn sàng giảm 20% chi phí phát triển AI?

Bắt đầu miễn phí trong vài phút. Bao gồm tín dụng dùng thử miễn phí. Không cần thẻ tín dụng.

Đọc thêm