Kluczowe funkcje (co oferuje FLUX.2-Pro)
- Jakość ukierunkowana na produkcję: Przeznaczony do komercyjnych pipeline’ów z przewidywalnym opóźnieniem i wysoką jakością wizualną (fotorealistyczne wyniki do ~4 megapikseli).
- Warunkowanie wieloma referencjami: Obsługa w API do 8 referencji oraz utrzymywanie spójności postaci/stylu między wynikami — przydatne dla ciągłości marki lub postaci.
- Ulepszona typografia i układ: Lepsze, bardziej czytelne renderowanie tekstu dla UI, infografik i logo w porównaniu z wieloma wcześniejszymi modelami.
- Deterministyczne wyniki o niskiej wariancji: Wersja Pro zoptymalizowana pod kątem ograniczenia iteracyjnego promptowania i skrócenia czasu cyklu w produkcji.
- Narzędzia bezpieczeństwa i pochodzenia treści: API stosuje kryptograficznie podpisane metadane C2PA do wyników; hostowane endpointy obejmują filtry i moderację w czasie inferencji.
- Niskie opóźnienie i przewidywalna inferencja („poniżej 10 sekund” czasu generowania oraz SLA dla Pro).
Szczegóły techniczne FLUX.2 Pro
- Główna architektura: FLUX.2 wykorzystuje podejście latent flow-matching z rectified-flow transformerem działającym w wyuczonej przestrzeni latentnej. Konstrukcja łączy ten backbone transformera z modelem vision-language Mistral-3 24B, aby zapewnić ugruntowanie semantyczne i wiedzę o świecie podczas syntezy.
- VAE i przeprojektowanie przestrzeni latentnej: BFL udostępniło zaktualizowany FLUX.2 VAE (Apache-2.0), który równoważy kompresję, wierność rekonstrukcji i łatwość uczenia — umożliwiając wyższej jakości edycję przy rozdzielczościach wielomegapikselowych. Współdzielony VAE stanowi podstawę wszystkich wariantów FLUX.2, zapewniając interoperacyjność i bardziej spójne wyniki edycji.
- Zachowanie inferencji / techniki treningowe: Checkpoint Dev był trenowany z użyciem technik takich jak guidance distillation, aby zwiększyć efektywność samplingu i umożliwić wysokiej jakości sampling przy mniejszej liczbie kroków; hostowany Pro może wykorzystywać dodatkowe rozwiązania inżynieryjne i pipeline’y samplingu w celu zmniejszenia opóźnień.
Nazwa modelu: black-forest-labs/flux-2-pro
Wydajność benchmarkowa
Własne ewaluacje Black Forest Labs oraz niezależne publikacje opublikowane przy premierze wskazują, że FLUX.2 wykazuje mierzalne zyski względem kilku współczesnych systemów obrazowych w odsetku zwycięstw w ocenach ludzkich dla zadań text→image i edycji:
- Text→image: raportowany odsetek zwycięstw ~66.6% w bezpośrednich porównaniach przeprowadzanych przez ludzi względem wybranych modeli (próbkowane porównania cytowane w prasie).
- Edycja z jedną referencją: ~59.8% odsetka zwycięstw względem Qwen-Image w raportowanych porównaniach; edycja z wieloma referencjami: ~63.6% odsetka zwycięstw. Te wskaźniki zwycięstw były podkreślane przez media przy premierze jako dowód spójnej jakości i dokładności edycji.
FLUX.2 vs Nano Banana Pro vs Qwen-Image
- Nano Banana Pro / poziomy obrazowe Google Gemini: BFL pozycjonuje FLUX.2 jako dorównujący zamkniętoźródłowym liderom pod względem zgodności z promptem i jakości wizualnej, przy jednocześnie niższym koszcie na obraz (BFL opublikowało porównania cen za MP). Własnościowi konkurenci mogą nadal deklarować absolutnie najwyższe ELO w niektórych kuratorowanych testach, ale przy wyższych kosztach na obraz.
- Hunyuan Image / Qwen-Image / inne otwarte modele: FLUX.2 ma przewyższać wiele współczesnych otwartych checkpointów w testach head-to-head pod względem odsetka zwycięstw w zadaniach T2I i edycji (według opublikowanych porównań BFL). Różnice są zwykle najbardziej widoczne w spójności przy wielu referencjach i w typografii.
- Linia FLUX.1: FLUX.2 to pełne przeprojektowanie architektury (a nie zamiennik typu drop-in), które ulepsza bloki DiT, autoenkoder i sprzężenie z VLM. Można oczekiwać zauważalnych zysków w wierności edycji i spójności przy wielu referencjach względem FLUX.1.
Jak uzyskać dostęp do API Flux.2 Pro
Krok 1: Zarejestruj się, aby uzyskać klucz API
Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojej konsoli CometAPI. Pobierz klucz API będący poświadczeniem dostępu do interfejsu. Kliknij „Add Token” w sekcji tokenów API w centrum osobistym, uzyskaj klucz tokenu: sk-xxxxx i zatwierdź.
Krok 2: Wysyłaj żądania do API Flux.2 Pro
Wybierz endpoint „black-forest-labs/flux-2-pro”, aby wysłać żądanie API, i ustaw treść żądania. Metoda żądania i treść żądania są dostępne w dokumentacji API na naszej stronie. Nasza strona udostępnia również testy Apifox dla Twojej wygody. Zastąp <YOUR_API_KEY> swoim rzeczywistym kluczem CometAPI z konta.
Wstaw swoje pytanie lub żądanie do pola content — to na nie model odpowie. Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.
Krok 3: Pobierz i zweryfikuj wyniki
Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź. Po przetworzeniu API zwraca status zadania i dane wyjściowe.
Zobacz także Gemini 3 Pro Image( Nano Banana Pro) API
CometAPI teraz obsługuje modele w formacie Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Promocja ograniczona czasowo: ceny niższe niż oficjalne ceny Replicate!
👇 Zacznij tworzyć już teraz Create Predictions – API Doc
⚡ Elastyczny wybór:
- Pro: Zaprojektowany z myślą o wysokowydajnej produkcji i szybkim dostarczaniu.
- Flex: Maksymalizuje jakość obrazu dzięki regulowanym parametrom.
- Dev: Optymalizacja przyjazna dla deweloperów.