Jak korzystać z API Flux.2? Wszystko, co musisz wiedzieć

FLUX.2 to druga generacja rodziny modeli do generowania i edycji obrazu firmy Black Forest Labs (wydana 25 listopada 2025 r.). Oferuje fotorealizm klasy produkcyjnej, edycję wieloreferencyjną do 4 MP, obsługę podpowiedzi strukturalnych/JSON oraz wybór zarządzanych punktów końcowych (Pro, Flex) i opcji open-weight (Dev).

Dobra wiadomość jest taka, że CometAPI zintegrowało API Flux.2. Ten przewodnik wyjaśnia, czym jest FLUX.2, jak wywoływać API oraz zaawansowane przepływy pracy (tekst→obraz, elastyczne sterowanie, edycja wieloodniesieniowa), wraz z przykładami kodu i najlepszymi praktykami.

Czym jest FLUX.2 i dlaczego jest to ważne?

FLUX.2 to kontynuacja rodziny modeli graficznych FLUX – zaprojektowana z myślą o generowaniu tekstu na obraz o wysokiej wierności i edycji obrazów wieloreferencyjnych w rozdzielczościach produkcyjnych (do ~4 megapikseli). FLUX.2 został stworzony z myślą o rzeczywistych procesach kreatywnych (zasoby bezpieczne dla marki, spójne znaki i style w różnych referencjach, lepsza typografia i drobne detale), a nie o demonstracjach, i ma na celu zniwelowanie różnicy między wygenerowanymi a rzeczywistymi obrazami.

Kluczowe rezultaty, które FLUX.2 ma dostarczyć

Fotorealistyczne rezultaty nadające się do reklam, obrazów produktów i makiet interfejsów użytkownika.
Natywna edycja wieloodniesieniowa: łącz, zamieniaj lub komponuj elementy z wielu obrazów wejściowych w jednej edycji.
Warianty dla różnych przypadków użycia: ogólnodostępne modele dla deweloperów, punkt końcowy Pro zoptymalizowany pod kątem produkcji oraz punkt końcowy Flex do kontroli niskiego poziomu.

Ogólnie rzecz biorąc, FLUX.2 łączy utajony szkielet generatywny (architekturę przepływu/transformatora) z modelem wizji i języka dla semantycznego uziemienia oraz nowo wytrenowanym VAE, aby zapewnić wspólną przestrzeń utajoną dla wariantów. Taka konstrukcja pozwala modelowi na generowanie i rekonstrukcję (edycję) z większą dokładnością, jednocześnie zachowując możliwość uczenia się reprezentacji w celu trenowania i dostrajania. Otwarty VAE jest szczególnie godny uwagi, ponieważ standaryzuje przestrzeń utajoną dla hostowanych i samodzielnie hostowanych przepływów pracy.

Dlaczego to ma znaczenie: połączenie języka i dopasowania ukrytego przepływu zapewnia lepsze podążanie za instrukcjami (dzięki czemu wieloczęściowe instrukcje kompozycyjne zachowują się przewidywalnie), lepszą typografię i pojedynczą architekturę, która obsługuje zarówno generowanie, jak i edycję z wieloma odniesieniami. Dla twórców oznacza to bardziej niezawodne wyniki dla złożonych instrukcji i mieszanych danych wejściowych (tekst + obrazy).

Jak uzyskać dostęp do API FLUX.2?

Przygotuj środowisko

Zarejestruj się i zaloguj do CometAPI, a następnie pobierz klucz API z panelu profilu. Idealnie byłoby, gdybyś jako programista miał pewną wiedzę na temat API (zapewnimy Ci pomoc w tym zakresie, więc nie martw się).

Będziesz musiał również wybrać żądaną metodę żądania i odpowiedni model Flux.2.

Jakie punkty końcowe i uwierzytelnianie są wymagane?

Interfejs API Replicate Predictions umożliwia generowanie wysokiej jakości obrazów przy użyciu różnych modeli FLUX firmy Black Forest Labs w standardowym formacie Replicate. Interfejs API obsługuje szeroką gamę wariantów modeli FLUX, zoptymalizowanych pod kątem różnych zastosowań, od szybkiego prototypowania po generowanie obrazów klasy profesjonalnej. Użytkownicy mogą płynnie przełączać się między różnymi modelami, po prostu zmieniając ich nazwę w ścieżce URL (https://api.cometapi.com/replicate/v1/models/{models}/predictions), co zapewnia elastyczność w różnych zastosowaniach kreatywnych i komercyjnych.

Interfejs API Comet Udostępnia zarządzane punkty końcowe pod adresem https://api.cometapi.com/flux/v1/{model} i nadaje nazwy punktom końcowym, takim jak flux-2-pro, flux-2-flex i flux-2-flex, do tworzenia i edycji obrazów. Żądania wymagają klucza API w x-key nagłówek .

Rodzina modeli i kompromisy obliczeniowe

FLUX.2 (otwarte wagi) — Używaj, gdy potrzebujesz kontroli lokalnej, eksperymentów badawczych lub do uruchamiania wnioskowania na własnej infrastrukturze. Wersja Dev jest otwarta (32B) i doskonale nadaje się do badań eksploracyjnych i precyzyjnego dostrajania. Jest bardziej konfigurowalna, ale to Ty odpowiadasz za infrastrukturę i optymalizację.
FLUX.2 pro — Najlepszy balans między szybkością, jakością i kosztami produkcji. Wersja Pro jest zoptymalizowana pod kątem przewidywalnych opóźnień, stałego, szybkiego dotrzymywania terminów, wysokiej przepustowości i obsługuje do 8 obrazów referencyjnych API (łącznie 9 MP przez API). Używaj jej do edycji dużych ilości danych oraz gdy potrzebujesz niezawodności i przewidywalnych cen.
FLUX.2 (zarządzanie + sterowalność) — Udostępnia sterowanie generacją niskiego poziomu (np. steps, guidance) i obsługuje więcej odniesień (do 10) oraz nieco wyższą jakość/szczegółowość, jeśli akceptujesz wyższe opóźnienia i koszty. Użyj Flex, gdy potrzebujesz ostatecznej kontroli nad projektem — wierności typografii, dokładnych kolorów lub szczegółowych korekt kompozycji.

Prototyp włączony dev lub tani Pro zaplanuj, a następnie przenieś się do Pro dla skali lub Zgiąć do precyzyjnej kontroli końcowego renderowania.

Jak korzystać z API FLUX.2?

Cykl życia żądania (model zadania + sondowania)

Odpowiedzi na prośby o edycję/generację są następujące: obiekty zadań które zawierają polling_url oraz id; tworzysz żądanie, a następnie odpytujesz (lub używasz webhooków), aby pobrać podpisany adres URL wyniku. Podpisane adresy URL są krótkotrwałe (zwykle około 10 minut), więc pobieraj dane wyjściowe szybko.

Hostowany interfejs API wykorzystuje asynchroniczny model zadań:

POST żądanie generacji → zwraca task id oraz polling_url plus szacunkowo cost.
Ankieta polling_url aż do status == "Ready", a następnie pobierz wynikowy obraz (często w formacie base64 lub z hostowanego adresu URL).

Przykład: Python (żądania) — przesyłanie i ankieta

import time, requests, os

API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"

payload = {
    "prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
    "width": 1024, "height": 1024, "seed": 42
}

r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task

while True:
    time.sleep(0.5)
    status_r = requests.get(polling_url, headers={"x-key": API_KEY})
    status_r.raise_for_status()
    status = status_r.json()
    if status == "Ready":
        print("Result URL:", status)
        break
    elif status in ("Error", "Failed"):
        print("Generation failed:", status)
        break

Ten wzorzec (prześlij → ankieta lub webhook) stanowi podstawowy przepływ synchroniczny/asynchroniczny dla zarządzanych punktów końcowych.

Edycja obrazu — minimalny przykład (curl z adresem URL wejściowym)

curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
  -H "accept: application/json" \
  -H "x-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
    "input_image": "https://example.com/my-photo.jpg",
    "width": 2048,
    "height": 1536
  }'

Do edycji wieloodniesieniowej użyj input_image, input_image_2, input_image_3, … (wersja Pro obsługuje do 8 odniesień za pośrednictwem API; Flex do 10; deweloperzy zalecają maks. ~6 w zależności od pamięci).

Jakie podstawowe parametry powinienem przesłać?

Ważne pola treści żądania (edycja/generowanie obrazu) obejmują:

guidance oraz steps — umożliwiają precyzyjną kontrolę.
prompt (string) — do 32 tys. tokenów; szczegółowy język naturalny lub ustrukturyzowany JSON.
input_image (string) — wymagane do edycji (URL lub base64).
input_image_2 ... input_image_9 — obrazy wieloreferencyjne.
width / height — wielokrotności 16; wyjście maks. 4MP.
seed — liczba całkowita dla powtarzalności.
safety_tolerance — poziom moderacji.

W jaki sposób mogę wykorzystać FLUX.2 Pro do profesjonalnego generowania tekstu na obrazy?

FLUX.2 Pro został stworzony z myślą o niezawodnych i wysokiej jakości wynikach. Używaj go, gdy potrzebujesz spójnych rezultatów na poziomie marki, szybkiej realizacji i korporacyjnych umów SLA.

Przepis na przepływ pracy — obrazy produkcyjne

Monity wstępnego przetwarzania: Zachowaj krótką linię „intencja” oraz ustrukturyzowaną sekcję atrybutów (oświetlenie, obiektyw, nastrój, kody szesnastkowe kolorów marki). FLUX.2 obsługuje sterowanie kolorami szesnastkowymi, aby zachować paletę barw marki.
Zacznij od konserwatywnych ustawień domyślnych: kroki 30–50 i skala wskazówek 6–9.0; zwiększ liczbę kroków, aby uzyskać szczegóły, zwiększ liczbę wskazówek, aby wyniki były bardziej zgodne z poleceniem.
Użyj nasion + próbkowania deterministycznego w celu zapewnienia powtarzalności wyników w testach A/B.
Użyj punktu końcowego Pro do wielokrotnego pobierania próbek: zażądaj N wariantów równolegle i wybierz najlepszy — taniej i szybciej niż ręczne dostrajanie hiperparametrów.
Postprodukcja: Odszumianie, mapowanie tonów drobnych lub poprawki wektorowe w deterministycznym potoku. Rozważ zastosowanie małej sieci GAN lub przejścia o superrozdzielczości, jeśli potrzebujesz sygnału wyjściowego wyższego niż natywny.

Dlaczego te kroki są pomocne: Wersja Pro zapewnia równowagę między szybkością i wiernością oraz zazwyczaj wymusza stosowanie filtrów bezpieczeństwa/treści po generacji, dlatego jest to rozsądny wybór domyślny w przypadku zasobów widocznych dla klientów.

Najlepsze wskazówki dotyczące generowania obrazów

1. Ustrukturyzowane zachęty przynoszą korzyści produkcyjne. Uporządkuj podpowiedzi według priorytetu: temat → działanie → styl → kontekst. Użyj podpowiedzi JSON (scena, obiekty, aparat, oświetlenie, paleta kolorów), gdy potrzebujesz deterministycznej kompozycji na wielu obrazach. Przykładowe użycie schematu JSON (pseudo):

{
  "scene": "product shot",
  "subjects": [
    {"type":"mug","pose":"center","style":"ceramic, matte"},
    {"type":"background","style":"wooden desk, window light"}
  ],
  "camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}

2. Powtarzalność: Przechodzić seed do późniejszego odtworzenia. Zachowaj polecenie mapowania katalogu + ziarno → obraz dla zapewnienia możliwości śledzenia.

3. Partie i orkiestracja: W przypadku dużych serii produkcyjnych przesyłaj wiele żądań równolegle do Pro, ale ogranicz przepustowość, aby uniknąć dławienia; preferuj punkt końcowy Pro, aby zapewnić przewidywalne opóźnienie. Korzystaj z kolejek zadań i pul roboczych, aby szybko pobierać podpisane wyniki, gdy będą gotowe.

4. Moderacja i bezpieczeństwo: Zastosowanie safety_tolerance Aby kontrolować rygorystyczność moderacji. Punkty końcowe Pro obejmują zasady użytkowania i haki moderacji treści; zintegruj sprawdzanie po stronie serwera przed publikacją.

5. Postprodukcja: Wyjścia w wersji profesjonalnej są wysokiej jakości, ale czasami wymagają drobnych poprawek. Zbuduj zautomatyzowany etap postprodukcji (kadrowanie, korekcja kolorów, kompozycja) w swoim procesie i zlecaj ręczną kontrolę zasobów wrażliwych dla marki.

Jak mogę dostosować dane wyjściowe za pomocą punktu końcowego FLUX.2 Flex?

Flex to odmiana „narzędzia chirurgicznego”: dostosuj kroki, wskazówki, negatywne monity, rozmiary kafelków i liczbę odniesień, aby precyzyjnie kształtować wynik.

Kiedy wybrać Flex

Potrzebujesz precyzyjnego renderowania typograficznego (makiety interfejsu użytkownika, etykiety).
Musisz połączyć wiele punktów odniesienia, mając kontrolę nad pozą i oświetleniem.
Eksperymentujesz z zaawansowanymi technikami podpowiedzi (podpowiedzi strukturalne, łańcuchy ograniczeń).

Przykład — klawisze sterujące Flex i ich efekty

steps — więcej kroków = więcej szczegółów (kosztem opóźnienia).
guidance_scale — wyżej = bliżej podpowiedzi tekstowej, niżej = więcej kreatywności.
negative_prompt — wyraźnie usuń elementy (np. „brak znaku wodnego, brak dodatkowych palców”).
tile_size / tiled_inference — w przypadku generowania bardzo wysokiej rozdzielczości, kafelkowa przestrzeń wnioskowania pozwala na zamianę pamięci na szybkość.
reference_weights — niektóre punkty końcowe pozwalają na odniesienie się do stronniczości, która określa, która postać jest ważona: poza, a która styl.

Praktyczna wskazówka: W przypadku złożonych kompozycji uruchom krótki podgląd z niskim poziomem podpowiedzi, aby zweryfikować kompozycję, a następnie przeskaluj ją, dodając więcej kroków i zapewniając wyższy poziom podpowiedzi. Ta technika dwuprzebiegowa zmniejsza koszty, zapewniając jednocześnie precyzyjne rezultaty końcowe.

Przykład: prośba o elastyczność z krokami i wskazówkami

curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
  -H "Content-Type: application/json" \
  -H "x-key: $BFL_API_KEY" \
  -d '{
    "prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
    "width": 1536, "height": 2048,
    "steps": 50,
    "guidance": 7.5,
    "seed": 99999
  }'

Wskazówka: Używaj Flexa podczas końcowych zatwierdzeń kreatywnych, a Pro do szybszej pracy na dużą skalę. Flex jest zauważalnie bardziej kontrolowany w przypadku zadań typograficznych i wymagających mikroszczegółów.

Najlepsze praktyki dotyczące wykorzystania produkcyjnego

Poniżej znajdziesz sprawdzone w boju wzorce i pragmatyczne porady dotyczące integracji FLUX.2 na dużą skalę.

1) Kontroluj koszty poprzez śledzenie megapikseli i buforowanie

Rozliczanie FLUX.2 opiera się na megapikselach wejście + wyjścieW przypadku generowania dużych ilości danych, preferuj mniejsze rendery podglądu (szybkie kroki w niskiej rozdzielczości) i przechodź tylko do renderów końcowych o wyższej rozdzielczości. Buforuj renderowane zasoby (lub przechowuj różnice), aby uniknąć ponownego renderowania identycznych zadań. Zawsze wyświetlaj na powierzchni. cost w odpowiedziach i loguj je na żądanie.

2) Używaj poziomów mądrze: podział na podgląd i renderowanie końcowe

Uruchamiaj szybkie, niskokrokowe renderowanie w formacie Pro na potrzeby prototypów lub wielu wariantów.
Użyj przebiegów Flex lub High-MP Pro do finalnie zatwierdzonych wydruków, gdzie wierność ma znaczenie. To hybrydowe podejście równoważy przepustowość i ostateczną jakość obrazu.

3) Szybka inżynieria → ustrukturyzowane monity i JSON

Skorzystaj z FLUX.2 ustrukturyzowane monity JSON Gdy potrzebujesz deterministycznej kompozycji (obiekty sceny, kamera, pozy, szesnastkowe próbki kolorów). Zmniejsza to iteracyjne cykle podpowiedzi i prowadzi do bardziej powtarzalnych partii. Przykłady Cloudflare pokazują podpowiedzi JSON osadzone w formularzach wieloczęściowych.

4) Nasiona + wersjonowanie w celu powtarzalności

Jeśli potrzebujesz powtarzalnych wyników, przekaż seed i zapisz wersję/znacznik czasu modelu w metadanych. W przypadku deterministycznych potoków zasobów przechowuj manifest: monit, ziarno, wariant modelu, rozdzielczość, skróty obrazu referencyjnego. To poprawia identyfikowalność i opcje wycofywania.

Podsumowanie

FLUX.2 ma na celu zniwelowanie luki między „imponującą demonstracją” a „twórczym narzędziem produkcyjnym”. Dzięki edycji wieloreferencyjnej, wynikom o wysokiej rozdzielczości i zestawowi hostowanych punktów końcowych (oraz otwartemu kodowi inferencyjnemu i skwantyzowanym kompilacjom konsumenckim) oferuje zespołom wiele praktycznych opcji: uruchamianie lokalne w celach badawczych i personalizacji lub wykorzystanie hostowanych punktów końcowych Pro/Flex do stabilnych procesów produkcyjnych.

Deweloperzy mogą uzyskać dostęp Flux.2 Dev API, Interfejs API Flux.2 Flex oraz Interfejs API Flux.2 Pro poprzez CometAPI. Na początek zapoznaj się z możliwościami modelowania CometAPI w Plac zabaw i zapoznaj się z Przewodnik po API aby uzyskać szczegółowe instrukcje. Przed uzyskaniem dostępu upewnij się, że zalogowałeś się do CometAPI i uzyskałeś klucz API. Z e tAPI zaoferuj cenę znacznie niższą niż oficjalna, aby ułatwić Ci integrację.

Gotowy do drogi?→ Zarejestruj się w CometAPI już dziś !

Jeśli chcesz poznać więcej wskazówek, poradników i nowości na temat sztucznej inteligencji, obserwuj nas na VK, X oraz Discord!