FLUX.2 er en nyannonceret familie af billedgenererings- og redigeringsmodeller fra Black Forest Labs, der tilbyder produktionskvalitets‑fidelitet, multireference‑redigering (op til 10 referencer) og driftsklare varianter fra open‑weight Dev til produktionsklare Pro samt et kontrollerbart Flex‑niveau.
What is FLUX.2?
FLUX.2 er Black Forest Labs’ produktionsklare familie til billedgenerering + redigering, der samler multireference‑betingning, et gennemarbejdet latentrum (VAE) og avancerede kontrolprimitiver (hex‑farvestyring, JSON‑prompting, posevejledning) for at levere konsistente resultater i høj kvalitet til kreative og kommercielle workflows. Den understøtter både tekst→billede‑generering og multireference‑billedredigering i én modelfamilie, og BFL leverer hostede API‑endpoints samt open‑weight‑artefakter til forskning og lokal inferens. Udbuddet findes på flere distributionskanaler: åbne vægte til forskere/udviklere (FLUX.2), hostede produktionsmodeller såsom Flux.2 Pro og tilpasningsbare hostede endpoints som Flux.2 Flex.
Key capabilities
- Multireference‑redigering: kombinér op til 8–10 referencebilleder til et enkelt output og bevar identitets‑ og stilkonsistens. Dette er især nyttigt til reklame, produktmockups eller karakterkontinuitet på tværs af kreative varianter.
- Høj opløsning (op til 4 MP): output op til 4 megapixel (for eksempel 2048×2048 og større, afhængigt af billedforhold).
- Fotorealisme + fine detaljer: forbedringer i hænder, ansigter, teksturer og rumlig ræsonnering ift. tidligere åbne modeller.
- Struktureret prompting & JSON‑prompter: FLUX.2 understøtter strukturerede/JSON‑prompter, der naturligt kan maps til UI‑kontroller (scene, subjects[], stil, lys, kamera), hvilket muliggør programmérbar og reproducerbar generering.
- Typografi og farvefidelitet: usædvanligt god tekstrendering og nøjagtig farvestyring (hex) til brand‑følsomme workflows.
- Indholdsoprindelse og sikkerhed: Pro‑API’en tilføjer kryptografisk underskrevne C2PA‑metadata til genererede billeder og anvender lagdelt filtrering for ikke‑tilladte indholdskategorier.
Pro vs Flex vs Dev: Which Model to Choose?
| Variant | Latens og omkostning | Kvalitet | Kontrol og funktioner | Flere referencer |
|---|---|---|---|---|
| FLUX.2 | optimeret til lav latens (<10s i typiske API‑opsætninger), inkluderer indholdsfiltre og kryptografisk underskrevne C2PA‑metadata til proveniens. | Højeste (4 MP, bedste fidelitet) | Fuld funktionalitet, produktions‑SLA'er | Op til 8 (API, 9 MP grænse) |
| FLUX.2 | højere latens end pro, men eksponerer justerbare inferens‑hyperparametre (steps, guidance scale, osv.) | Høj | Afvejning mellem fidelitet og diversitet; justerbare inferens‑steps, guidance scale og andre sampling‑kontroller for kvalitet/hastighed. | Op til 10 |
| FLUX.2 | Afhænger af hardware | Stærk (open weights) | Fuld redigering + multireference; åbent checkpoint | Anbefalet maks. 6 |
| FLUX.2 | Edge / lav‑ressource | Moderat (destilleret) | Hurtig, lille VRAM‑fodaftryk |
When to pick which
- Vælg dev, hvis du skal køre lokalt, har behov for algoritmisk forskning, eller kræver open‑weight‑tilpasninger (og accepterer store hardwarekrav).
- Vælg pro, når du har brug for forudsigelige produktionsbilleder med lav latens og indbyggede sikkerheds‑ og proveniensfunktioner.
- Vælg flex, hvis du itererer på genererings‑hyperparametre (tuning af steps, guidance scale, osv.) og ønsker et managed endpoint, der eksponerer denne kontrol.
How does FLUX.2 work?
FLUX.2 samler tre vigtigste arkitekturkomponenter:
1. Rectified‑flow transformer‑rygrad
Kernen i FLUX.2 er en flow‑matching/rectified‑flow transformerarkitektur, der opererer i et lært latentrum (et moderne alternativ til diffusion for nogle produktionspipelines). Denne rygrad muliggør høj‑fidelitets renderinger og rumlig ræsonnering, der forbedrer konsistensen på tværs af flere referencer. “Flow‑matching”‑tilgangen giver andre afvejninger i samplinghastighed og fidelitet sammenlignet med klassisk diffusion.
2. Ny variational autoencoder (VAE)
En formålsbygget autoencoder komprimerer billeder til en latent repræsentation, optimeret til FLUX.2’s genererings‑ og redigeringsopgaver. BFL angiver, at den nye VAE forbedrer komprimerbarhed og fidelitet (bedre læredynamik og højere kvalitet i rekonstruktioner end tidligere generationer). VAE’en er en nøglebidragyder til ren opskalering til 4 MP og forbedret detaljegrad.
3. Langkontekst syn‑sprog‑model (VLM)
En VLM (ifølge offentliggjorte noter beslægtet med visuel‑sprog‑enkodere i Mistral‑klassen) leverer sprog‑betingning og virkeligdomsviden, som gør prompts mere trofaste og modellen bedre til at følge komplekse instruktioner (posevejledning, kontekstuelle redigeringer osv.). Ved at kombinere en VLM med en flow‑rygrad kan FLUX.2 ræsonnere over komposition og semantik ved større kontekstvinduer.
How these pieces interact (runtime flow)
- Encode input(s): referencebilleder encodes via VAE’en til latente tokens; tekstprompter encodes af VLM’en.
- Cross‑modal fusion: transformer‑rygraden indtager billedlatenter + teksttokens og modellerer rumlige relationer, identitetsfunktioner og redigeringsinstruktioner.
- Flow‑baseret generering: de rectified‑flow‑baserede samplere genererer eller redigerer latente billeder betinget af den fusionerede repræsentation.
- Decode: VAE’en dekoder latenter tilbage til pixelrummet og anvender valgfrit endelige farvebegrænsninger og watermark/C2PA‑metadata.
Why this architecture matters
Denne kombination giver tre praktiske fordele: (1) multireference‑koherens, fordi identitet og stil modelleres eksplicit i latentrummet; (2) bedre tekst og typografi takket være tættere integration mellem VLM og billedlatentrummet; (3) skalerbare udrulningsmuligheder — den samme grundlæggende modelfamilie kan leveres som åbne vægte til lokal brug (dev), som en managed tjeneste med lav latens (pro) eller som en tuningsbar tjeneste for udviklere (flex).
How does FLUX.2 Good ?
Perform in benchmarks
Black Forest Labs offentliggjorde sammenlignende evalueringer og diagrammer, der viser, at FLUX.2 overgår flere åbne samtidige modeller i direkte menneskelig præference/sejrsrate‑tests og i ELO vs. omkostning‑analyser. Rapporterede højdepunkter fra leverandørens/presseopsummeringen inkluderer:
- Tekst→Billede sejrsrate: FLUX.2 rapporterede ≈66,6% sejrsrate (vs. ~51,3% Qwen‑Image, 48,1% Hunyuan Image 3.0).
- Enkelt‑reference redigering: ≈59,8% sejrsrate (vs. ~49,3% Qwen‑Image, 41,2% FLUX.1 Kontext).
- Multireference‑redigering: ≈63,6% sejrsrate (vs. ~36,4% for Qwen‑Image).
- ELO vs. omkostning: FLUX.2‑familien (Pro, Flex, Dev) klumper sig i et bånd med høj kvalitet og relativt lav omkostning (ELO ≈1030–1050 ved ~2–6 cent pr. billede i leverandørens prissætningsdiagram).
Multi-Reference Generation
En af FLUX.2’s største funktioner er dens evne til at generere flere konsistente outputs ved hjælp af flere referencebilleder.
For eksempel kan du ved produktfotografering uploade flere fotos taget fra forskellige vinkler, under forskellig belysning og mod forskellige baggrunde, og generere flere variationer af det samme billede på én gang.
Denne funktion gør det muligt hurtigt at batchgenerere produktkatalogfotos til e‑handelswebsites, reklamebannere, sæt af billeder til sociale medier og meget mere.
I modsætning til traditionel generering fra ét enkelt billede er denne multireference‑mekanisme ideel til virkelige workflows, der lægger vægt på konsistens og integritet.
High Resolution, Business Quality (Up to 4MP)
FLUX.2 understøtter output op til 4 megapixel (omtrent 2000–3000 pixels) og leverer billedkvalitet, der egner sig til praktiske anvendelser som reklame, print, skiltning og plakater.
Den håndterer tekst, logoer, UI‑mockups, infografikker og meget mere upåklageligt, hvilket gør den egnet ikke kun til kunstnerisk skabelse, men også til design og kommerciel brug.
Samtidig er gengivelseskvaliteten af skrifter og tekst forbedret, hvilket gør den velegnet til at skabe reklamebannere og produktetiketter.
Supports Local GPU Execution: Low Cost, Low Barrier to Entry
Hidtil har mange højtydende billedgenereringsmodeller kun været praktisk anvendelige i datacentre med massiv regnekraft. FLUX.2 er imidlertid optimeret til at køre på standard‑GPU’er (såsom NVIDIA RTX) med lavere VRAM‑forbrug.
Modellerne behøver ikke længere tilgås via skyen; de kan redigeres og genereres lokalt, hvilket reducerer omkostningerne betydeligt og øger den operationelle fleksibilitet.
Dette er en stor fordel ikke kun for virksomheder, men også for individuelle skabere og små teams.
Unified Creation and Editing Workflow
FLUX.2 understøtter ikke kun tekst‑til‑billede (tekst → billedgenerering), men også billede‑til‑billede (redigering og styling af eksisterende billeder).
Det gør det muligt konsekvent at bruge en enkelt model til opgaver som “at tegne et nyt billede fra bunden”, “at redigere og retouchere eksisterende fotos” og “at genbruge flere billeder for at skabe ensartede variationer”.
For eksempel er det let at ændre baggrunden på et produktfoto til en anden stemning eller ændre størrelsen til sociale medier.
How to Access Flux.2 API
Vi er glade for at kunne meddele, at CometAPI har integreret Flux.2‑API’en. Nu med understøttelse af Replicate Format Model (lavere end Replicates officielle prissætning), FLUX.2‑endpoints:
- black-forest-labs/flux-2-pro
- black-forest-labs/flux-2-dev
- black-forest-labs/flux-2-flex
Start Building Now Opret forudsigelser – API‑dokumentation,
Vil du prøve først? Test FLUX.2 i vores playground, efter at du har registreret dig og logget ind på CometAPI. Hvis du vil komme i gang med API med det samme: Opret forudsigelser – API‑dokumentation.
FLUX.2 er ikke blot endnu et model‑drop; det er en produktstrategi på familieniveau, der adresserer produktionsrealiteter: fidelitet, redigerbarhed, multireference‑koherens og praktiske udrulningsveje (managed API’er og åbne checkpoints). For organisationer, der producerer visuelt indhold i skala, lover FLUX.2 meningsfulde produktivitetsgevinster — forudsat at teams kombinerer teknisk adoption med robust licensstyring og kvalitetskontrol.
Main Uses and Intended Use Cases of FLUX.2
Produktvisualer/Oprettelse af e‑handelskatalog
E‑handelsvirksomheder og brands har et stort behov for at tage talrige produktfotos fra flere vinkler, med forskellige lysforhold, baggrunde og farvetilstande.
- Med FLUX.2 kan du hurtigt generere flere visuelt konsistente effekter uden faktisk at skyde noget indhold.
- Dette gør det muligt hurtigt at udvide dit produktkatalog og samtidig reducere foto‑, tids‑ og administrationsomkostninger.
Oprettelse af reklame- og marketingmateriale
Behovet for designmaterialer er bredt og omfatter reklamebannere, billeder til opslag på sociale medier, visuelle materialer til kampagner og PR‑plakater.
- Angiv blot en tekstbeskrivelse for at få billeder med den ønskede stil, komposition og atmosfære, hvilket reducerer belastningen for designere og annoncører markant.
- Da varianter kan genereres med flere referencebilleder, er det desuden velegnet til A/B‑test af kreative idéer og til at skabe materialer kompatible med flere sprog og regioner.
Brugergrænseflade-/Brugeroplevelsesdesign, prototyping
FLUX.2 understøtter også redigering af logoer, skrifter, layouts og baggrunde, hvilket gør den egnet ikke kun til fotogenerering, men også til det visuelle design af digitale produkter.
- Du kan hurtigt skabe foreløbige designs, wireframes, event‑websites, mockups af app‑skærme og mere.
- Dette er en omkostningseffektiv produktionsløsning, især egnet til startups og små designteams.
Kunst/kreative værker og privat brug
Den kan naturligvis også bruges rent til “kunstværker”, “illustrationer” eller “grafisk design”.
- Udvid dine kreative horisonter ved at skabe værker i forskellige stemninger og stilarter med tekstprompter og referencebilleder.
- Du kan også bruge billedredigeringsfunktioner til frit at genbruge eksisterende fotos i kunstneriske stilarter eller eksperimentere med fantastiske landskaber eller karakterdesign.
Differentiated from Existing Models and Competitors—Why Choose FLUX.2?
Comparison with Other AI Image Generation Models
I øjeblikket findes der mange modeller (open‑source og kommercielle) inden for AI‑billedgenerering, såsom traditionelle diffusionsmodeller og de nyeste konkurrerende modeller. Så hvorfor er FLUX.2 så overbevisende? Årsagerne er som følger:
- Integreret generering og redigering: Mange modeller fokuserer enten på “generering (tekst til billede)” eller “redigering (billede til billede)”. FLUX.2 understøtter begge funktioner samtidig og opnår et meget konsistent workflow.
- Flere referenceinput: Udnyt flere referencebilleder for nem produktfotografering og ensartet visuel konsistens.
- Kommerciel kvalitet og høj opløsning: Understøtter 4 MP til reklame, produktfotografering og print.
- Let lokal kørsel: Den er uafhængig af skyen og kan køre på standard‑GPU’er, hvilket giver fordele i både omkostning og fleksibilitet.
- Fleksibelt modelvalg: Tilbyder en række modeller, der dækker alt fra standard til kommercielle og forskningsmæssige anvendelser, så du kan vælge den, der passer bedst til dine behov og dit budget.
Dette gør FLUX.2 til et stærkt valg for professionelle workflows, kommerciel brug, produktion i stor skala og projekter, hvor omkostning og hastighed er afgørende.
Final thoughts:
FLUX.2 befinder sig på et pragmatisk skæringspunkt: den tilbyder open‑weight forskningsmuligheder for teams, der har brug for kontrol og reproducerbarhed, og managed, produktions‑API’er for teams, der prioriterer lav latens, forudsigelige outputs og proveniens. Ved at levere både åbne og managed varianter (dev/pro/flex) anerkender BFL, at forskellige workflows — eksperimentering, iterativt design og produktion — kræver forskellige afvejninger mellem fidelitet, hastighed, tilpasning og styring.
Udviklere kan få adgang til Flux.2 Dev API, Flux.2 Flex API og Flux.2 Pro API via CometAPI. For at komme i gang kan du udforske CometAPI’s modelmuligheder i Playground. Før adgang skal du sikre, at du er logget ind på CometAPI og har fået en API‑nøgle. CometAPI tilbyder en pris langt lavere end den officielle for at hjælpe dig med at integrere.
Klar til at gå i gang?→ Tilmeld dig CometAPI i dag !
Hvis du vil have flere tips, guider og nyheder om AI, så følg os på VK, X og Discord!
