Czym jest FLUX.2 Flex
FLUX.2 to „elastyczny” członek rodziny produktów FLUX.2 od Black Forest Labs, oferowany jako zarządzane API. Został zaprojektowany dla deweloperów i zespołów kreatywnych, którzy potrzebują:
- bezpośredniej kontroli nad parametrami generowania (kroki inferencji steps, guidance scale itp.), aby móc wymieniać szybkość na wierność podczas iteracyjnych przepływów pracy;
- solidnej typografii / renderowania tekstu oraz bardzo precyzyjnej obsługi detali (infografiki, makiety UI, etykiety produktów); oraz
- niezawodnej edycji z wieloma referencjami (łączenie elementów z kilku zdjęć przy zachowaniu tożsamości/spójności).
FLUX.2 jest oferowany w kilku wariantach produktowych (Pro, Flex, Dev, Klein), które są przeznaczone do różnych scenariuszy użycia — Flex plasuje się pomiędzy Pro (najwyższa jakość + stałe opóźnienie) a Dev (checkpoint o otwartych wagach do badań/użytku lokalnego).
Kluczowe funkcje (co FLUX.2 Flex wnosi do oferty)
- Kontrolowane generowanie: jawne parametry (steps, guidance scale) do równoważenia szybkości i zgodności z promptem.
- Wyjście w wysokiej rozdzielczości: zdolność do tworzenia produkcyjnych wyników do 4 megapikseli (4MP) przy zachowaniu detali.
- Wejścia wieloreferencyjne: akceptuje wiele obrazów referencyjnych (Flex obsługuje do 10 obrazów referencyjnych; liczby dla Dev/Pro różnią się w zależności od poziomu). Umożliwia to spójne renderowanie postaci/produktów między różnymi wynikami.
- Ulepszona typografia i renderowanie tekstu: BFL podkreśla znacząco ulepszone renderowanie glifów, kerningu i układów wielowierszowych — co czyni FLUX.2 atrakcyjnym dla UI, opakowań i infografik.
- Zarządzane API z ceną za megapiksel (przewidywalny model kosztów): ceny dla Flex wykorzystują model rozliczania za megapiksel (zobacz sekcję Cennik).
Szczegóły techniczne FLUX.2 Flex
Podstawowa architektura: FLUX.2 wykorzystuje szkielet latent flow-matching (transformer przepływu) połączony z modelem vision-language (BFL podaje, że łączy VLM Mistral-3 24B z rectified flow transformer). VAE używany przez FLUX.2 został ponownie wytrenowany, aby poprawić kompromis między łatwością uczenia/jakością/kompresją. Te decyzje pomagają w zakresie wiedzy o świecie, logiki kompozycyjnej i ściślejszego trzymania się promptu.
FLUX.2: typowe zgłaszane czasy generowania to ~22 s (sam tekst) oraz ~40 s (z obrazem wejściowym), akceptuje do 10 wejść i jest wyceniany na około $0.048 za megapiksel (łącznie wejście + wyjście) w CometAPI.
Nazwa modelu: black-forest-labs/flux-2-flex
Ograniczenia wejścia: Flex akceptuje wiele wejść (do 10 wejść w ofercie zarządzanej) i obowiązuje całkowity limit megapikseli wejściowych (podawane jest maksymalnie 14 MP łącznego wejścia). Rozdzielczość wyjściowa powyżej 4MP jest zazwyczaj zmniejszana lub ograniczana przez usługę.
Wydajność benchmarkowa FLUX.2 Flex
Ocena współczynnika wygranych w stylu ludzkim (benchmark dostawcy): W opublikowanych przez BFL testach head-to-head warianty FLUX.2 (w szczególności ) wykazały wysokie współczynniki wygranych względem współczesnych modeli open-source: ~66.6% współczynnika wygranych w text-to-image, 59.8% w edycji z pojedynczą referencją oraz 63.6% w edycji z wieloma referencjami względem innych cytowanych modeli open-source. BFL przedstawiło również wykres ELO względem kosztu na obraz, umieszczający warianty FLUX.2 w przedziale ~1030–1050 ELO przy kosztach na obraz w zakresie 2–6 centów.
Ograniczenia FLUX.2 Flex
- Skalowanie kosztów wraz z liczbą referencji / rozdzielczością: Flex wykorzystuje rozliczanie za megapiksel. Dodanie wielu obrazów referencyjnych lub zwiększenie rozdzielczości wyjściowej podnosi koszt liniowo w reklamowanym modelu megapikselowym. W przepływach pracy z wieloma iteracjami i licznymi referencjami koszty mogą szybko narastać.
- Tryby awarii promptów/spójności: Chociaż FLUX.2 poprawia spójność postaci, złożone prompty z wieloma atrybutami nadal mogą prowadzić do błędów (artefakty, nieoczekiwane mieszanie lub dryf pozy/tożsamości) w zależności od konstrukcji promptu i liczby referencji.
- Treść i bezpieczeństwo: Chociaż BFL raportuje wysoką odporność w testach moderacji/naruszających dane wejściowe, modele obrazowe nie są doskonałe; nadal istnieją ryzyka związane z generowaniem materiałów objętych prawami autorskimi, podszywaniem się lub niebezpiecznymi treściami.
Typowe / zalecane przypadki użycia
- Warianty obrazów reklamowych i marketingowych, gdzie ten sam model/aktor/produkt musi pozostać spójny w wielu scenach lub tłach (spójność wieloreferencyjna).
- Fotografia produktowa i wirtualne przymierzanie (zachowanie detali produktu na różnych tłach).
- Sesje editorial/fashion wymagające tej samej tożsamości na wielu ujęciach.
- Szybkie prototypowanie i badania (checkpoint dev umożliwia eksperymentowanie, fine-tuning oraz przepływy pracy LoRA/adapterów).
Jak uzyskać dostęp do API Flux.2 Flex
Krok 1: Zarejestruj się, aby uzyskać klucz API
Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojej konsoli CometAPI. Uzyskaj poświadczenie dostępu — klucz API interfejsu. Kliknij „Add Token” w sekcji tokenów API w centrum osobistym, pobierz klucz tokena: sk-xxxxx i zatwierdź.
Krok 2: Wysyłaj żądania do API Flux.2 Flex
Wybierz endpoint „black-forest-labs/flux-2-flex”, aby wysłać żądanie API i ustawić treść żądania. Metoda żądania i treść żądania są dostępne w dokumentacji API na naszej stronie. Dla Twojej wygody nasza strona internetowa udostępnia również test Apifox. Zastąp <YOUR_API_KEY> swoim rzeczywistym kluczem CometAPI z konta.
Wstaw swoje pytanie lub żądanie do pola content — to na nie model odpowie. Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.
Krok 3: Pobierz i zweryfikuj wyniki
Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź. Po przetworzeniu API zwraca status zadania i dane wyjściowe.
CometAPI obsługuje teraz modele w formacie Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Promocja ograniczona czasowo: ceny niższe niż oficjalne ceny Replicate!
👇 Zacznij budować już teraz Create Predictions – API Doc
⚡ Elastyczny wybór:
- Pro: Zaprojektowany z myślą o wysokowydajnej produkcji i szybkim dostarczaniu.
- Flex: Maksymalizuje jakość obrazu dzięki regulowanym parametrom.
- Dev: Optymalizacja przyjazna dla deweloperów.