Kluczowe funkcje (co robi Flux.2 Dev)
- Generowanie tekst→obraz z wysoką zgodnością z promptem oraz ulepszoną typografią / renderowaniem drobnych detali.
- Edycja z wieloma referencjami — łącz wiele obrazów referencyjnych w jeden wynik, zachowując spójność tożsamości/stylu
- Pojedynczy checkpoint do generowania + edycji (nie jest wymagany osobny model do edycji).
- Duży checkpoint z otwartymi wagami (32B) umożliwiający lokalne badania, kwantyzację i adaptację przez społeczność.)
- Zoptymalizowane VAE dla lepszego kompromisu uczalność–jakość–kompresja (umożliwia edycję/wyniki 4MP).
Szczegóły techniczne (architektura i inżynieria)
- Liczba parametrów: 32 miliardy parametrów dla checkpointu FLUX.2.
- Projekt rdzenia: dopasowywanie przepływu w przestrzeni latentnej / rektyfikowany transformator przepływu połączony z modelem wizyjno-językowym (BFL podaje, że łączą Mistral-3 24B VLM z trzonem transformera dla osadzenia semantycznego). VLM wnosi wiedzę o świecie i zakotwiczenie tekstowe, podczas gdy transformer modeluje strukturę przestrzenną/kompozycyjną.
- VAE: nowe FLUX.2 VAE (wydane na licencji Apache-2.0) ponownie wytrenowane, aby poprawić wierność rekonstrukcji i łatwość uczenia reprezentacji latentnych, umożliwiając edycję w wysokiej rozdzielczości.
- Próbkowanie i destylacja: trenowany z wykorzystaniem technik destylacji z prowadzeniem w celu poprawy efektywności wnioskowania i wierności.
Wyniki w benchmarkach
Black Forest Labs opublikowało porównawcze oceny i wykresy pokazujące wydajność FLUX.2 na tle współczesnych modeli obrazowych z otwartymi wagami i hostowanych. Kluczowe opublikowane liczby (BFL / podsumowania prasowe):
- Odsetek wygranych w zadaniu tekst→obraz: FLUX.2 ~66.6% (vs. Qwen-Image 51.3%, Hunyuan ~48.1% w zbiorze porównań bezpośrednich BFL).
- Odsetek wygranych przy edycji z pojedynczą referencją: FLUX.2 ~59.8% (vs. Qwen-Image 49.3%, FLUX.1 Kontext ~41.2%).
- Odsetek wygranych przy edycji z wieloma referencjami: FLUX.2 ~63.6% (vs. Qwen-Image 36.4%). BFL podaje też możliwość wieloreferencyjną do 10 referencji w ich zestawie ewaluacyjnym.
Typowe / zalecane przypadki użycia
- Warianty obrazów do reklam i marketingu gdzie ten sam model/aktor/produkt musi pozostać spójny w wielu scenach lub tłach (spójność wieloreferencyjna).
- Fotografia produktowa i wirtualne przymierzanie (zachowanie detali produktu na różnych tłach).
- Materiały redakcyjne/modowe wymagające tej samej tożsamości na wielu ujęciach.
- Szybkie prototypowanie i badania (checkpoint dev pozwala na eksperymenty, fine-tuning oraz przepływy pracy z LoRA/adapterami).
Jak uzyskać dostęp do Flux.2 dev API
Krok 1: Zarejestruj się po klucz API
Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojej konsoli CometAPI. Uzyskaj poświadczenie dostępu — klucz API interfejsu. Kliknij „Add Token” przy tokenie API w centrum osobistym, pobierz klucz tokena: sk-xxxxx i zatwierdź.

Krok 2: Wyślij żądania do Flux.2 dev API
Wybierz “black-forest-labs/flux-2-dev ”endpoint, aby wysłać żądanie API i ustaw treść żądania. Metodę żądania i treść żądania znajdziesz w naszej dokumentacji API na stronie. Nasza strona zapewnia też test w Apifox dla Twojej wygody. Zastąp <YOUR_API_KEY> rzeczywistym kluczem CometAPI ze swojego konta.
Wstaw swoje pytanie lub prośbę do pola content — na to odpowie model. Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.
Krok 3: Pobierz i zweryfikuj wyniki
Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź. Po przetworzeniu API zwraca status zadania i dane wyjściowe.
CometAPI Teraz obsługuje modele w formacie Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Promocja ograniczona czasowo: ceny niższe niż oficjalne ceny Replicate!
👇 Zacznij budować już teraz Utwórz predykcje – dokumentacja API
⚡ Elastyczny wybór:
- Pro: Zaprojektowany do wysokowydajnej produkcji i szybkiej realizacji.
- Flex: Maksymalizuje jakość obrazu dzięki regulowanym parametrom.
- Dev: Optymalizacja przyjazna deweloperom.