FLUX.2 er en nyligt annonceret familie af billedgenererings- og redigeringsmodeller fra Black Forest Labs, der tilbyder produktionskvalitetsgengivelse, multireferenceredigering (op til 10 referencer) og implementeringsvarianter lige fra åben udvikling til produktions-Pro og et kontrollerbart Flex-niveau.
Hvad er FLUX.2?
FLUX.2 er Black Forest Labs' produktionsklasse billedgenererings- og redigeringsfamilie, der kombinerer multireferencekonditionering, et omarbejdet latent rum (VAE) og avancerede kontrolprimitiver (hex-farvestyring, JSON-prompting, pose-vejledning) for at levere ensartede resultater af høj kvalitet til kreative og kommercielle arbejdsgange. Den understøtter både tekst→billedgenerering og multireference-billedredigering i en enkelt modelfamilie, og BFL leverer hostede API-slutpunkter samt åbne vægtartefakter til forskning og lokal inferens. Tilbuddet findes på tværs af flere distributionskanaler: åbne vægte for forskere/udviklere (FLUX.2 ), hostede produktionsmodeller såsom **Flux.2 Pro**og brugerdefinerede hostede slutpunkter som f.eks. Flux.2 Flex.
Nøglefunktioner
- Redigering af flere referencer: Kombinér op til 8-10 referencebilleder til et enkelt output, samtidig med at identitet og stilkonsistens bevares. Dette er især nyttigt til reklamer, produktmockups eller karakterkontinuitet på tværs af kreative varianter.
- Høj opløsning (op til 4 MP): udsender op til 4 megapixels (for eksempel 2048×2048 og større, afhængigt af billedformatet).
- Fotorealisme + fine detaljer: forbedringer i hænder, ansigter, teksturer og rumlig ræsonnement sammenlignet med tidligere åbne modeller.
- Strukturerede prompter og JSON-prompter: FLUX.2 understøtter strukturerede/JSON-prompts, der naturligt knyttes til UI-kontroller (scene, subjects[], stil, belysning, kamera), hvilket muliggør programmatisk og reproducerbar generering.
- Typografi og farvegengivelse: Usædvanlig god tekstgengivelse og præcis farvestyring (hex) til brandfølsomme arbejdsgange.
- Indholdsoprindelse og sikkerhed: Pro API'en anvender kryptografisk signerede C2PA-metadata på producerede billeder og driver lagdelt filtrering for ikke-tilladte indholdskategorier.
Pro vs Flex vs Dev: Hvilken model skal man vælge?
| Variant | Latens og omkostninger | Kvalitet | Kontrol og funktioner | Multireference |
|---|---|---|---|---|
| FLUX.2 | optimeret til lav latenstid (<10s i typiske API-opsætninger), inkluderer indholdsfiltre og kryptografisk signerede C2PA-metadata til proveniens. | Højeste (4MP, bedste kvalitet) | Fuld funktionalitet, produktions-SLA'er | Op til 8 (API, 9MP grænse) |
| FLUX.2 | højere latenstid end pro men eksponerer justerbare inferenshyperparametre (trin, vejledningsskala osv.) | Høj | Justerbar kvalitet vs. diversitet; justerbare inferenstrin, vejledningsskala og andre samplingskontroller til afvejning af kvalitet/hastighed. | Op til 10 |
| FLUX.2 | Afhænger af hardware | Stærk (åbne vægte) | Fuld redigering + multireference; åbent kontrolpunkt | Anbefalet maks. 6 |
| FLUX.2 | Edge / lavressourceforbrug | Moderat (destilleret) | Hurtig, lille VRAM-fodaftryk |
Hvornår skal man vælge hvilken
- Vælg dev hvis du skal køre lokalt, har brug for algoritmisk research eller kræver tilpasninger med åben vægt (og accepterer store hardwarebehov).
- Vælg for når du har brug for forudsigelige produktionsbilleder med lav latenstid og indbyggede sikkerheds- og proveniensfunktioner.
- Vælg flex hvis du itererer på generationshyperparametre (justeringstrin, vejledningsskala osv.) og ønsker et administreret slutpunkt, der eksponerer denne kontrol.
Hvordan fungerer FLUX.2?
FLUX.2 samler tre arkitektoniske hovedelementer:
1. Ensrettet transformer-rygrad
I sin kerne bruger FLUX.2 en flow-matching / ensrettet flow Transformerarkitektur, der opererer i et lært latent rum (et moderne alternativ til diffusion for nogle produktionsrørledninger). Denne rygrad muliggør high-fidelity-gengivelse og rumlig ræsonnement, der forbedrer konsistensen på tværs af flere referencer. "Flowmatching"-tilgangen tilbyder forskellige afvejninger i samplingshastighed og -natur sammenlignet med klassisk diffusion.
2. Ny variationsautoencoder (VAE)
En specialbygget autoencoder komprimerer billeder til en latent repræsentation, der er optimeret til FLUX.2's genererings- og redigeringsopgaver. BFL angiver, at den nye VAE forbedrer komprimerbarhed og kvalitet (bedre læringsdynamik og rekonstruktioner af højere kvalitet end tidligere generationer). VAE bidrager væsentligt til ren opskalering til 4MP og forbedrede detaljer.
3. Langkontekst-vision-sprogmodel (VLM)
En VLM (rapporteret at være relateret til visuelle sprogkodere i Mistral-klassen i publicerede noter) leverer den sprogkonditionering og viden fra den virkelige verden, der gør prompter mere troværdige og modellen bedre til at følge komplekse instruktioner (positurvejledning, kontekstuelle redigeringer osv.). Kombinationen af en VLM med en flow-backbone gør det muligt for FLUX.2 at ræsonnere om komposition og semantik i større kontekstvinduer.
Hvordan disse dele interagerer (runtime flow)
- Kod input(ter): Referencebilleder kodes via VAE til latente tokens; tekstprompter kodes af VLM.
- Krydsmodal fusion: Transformer-rygraden indtager billedlatenter + teksttokens og modellerer rumlige relationer, identitetsfunktioner og redigeringsinstruktioner.
- Flowbaseret generering: De ensrettede flow-samplere genererer eller redigerer latente billeder betinget af den fusionerede repræsentation.
- Afkode: VAE afkoder latente elementer tilbage til pixelrum og anvender eventuelt endelige farvebegrænsninger og vandmærke/C2PA-metadata.
Hvorfor denne arkitektur er vigtig
Denne kombination giver tre praktiske fordele: (1) multireferencekohærens fordi identitet og stil er modelleret eksplicit i det latente; (2) bedre tekst og typografi på grund af tættere integration mellem VLM og billedlatent rum; (3) skalerbare implementeringsmuligheder — den samme grundlæggende modelfamilie kan leveres som åbne vægte til lokal brug (dev), som en administreret tjeneste med lav latenstid (pro) eller som en justerbar tjeneste til udviklere (flex).
Hvordan fungerer FLUX.2?
Præster i benchmarks
Black Forest Labs har offentliggjort sammenlignende evalueringer og diagrammer, der viser, at FLUX.2 klarer sig bedre end adskillige samtidige open-weight-tests i direkte sammenlignende tests af menneskelige præferencer/win-rate samt i ELO vs. omkostningsanalyser. Rapporterede højdepunkter fra det offentliggjorte leverandør-/presseoversigt inkluderer:
- Tekst→Billede-sejrsrate: FLUX.2 rapporterede 66.6% sejrsrate (vs. ~51.3% Qwen-Image, 48.1% Hunyuan Image 3.0).
- Redigering af enkeltreferencer: 59.8% sejrsrate (vs. ~49.3% Qwen-Image, 41.2% FLUX.1 Kontext).
- Redigering af flere referencer: 63.6% sejrsrate (vs. ~36.4% for Qwen-Image).
- ELO vs. omkostninger: FLUX.2-familien (Pro, Flex, Dev) ligger i et bånd af højere kvalitet og relativt lave omkostninger (ELO ≈1030-1050, mens de opererer på ~2-6 cent pr. billede i leverandørens prisoversigt).
Generering af flere referencer
En af FLUX.2's største funktioner er dens evne til at generere flere ensartede output ved hjælp af flere referencebilleder.
Når du for eksempel fotograferer et produkt, kan du uploade flere fotos taget fra forskellige vinkler, under forskellige lysforhold og mod forskellige baggrunde og generere flere variationer af det samme billede på én gang.
Denne funktion giver dig mulighed for hurtigt at generere batch-generering af produktkatalogbilleder til e-handelswebsteder, reklamebannere, billedsæt til sociale medier og meget mere.
I modsætning til traditionel generering af enkeltbilleder er denne mekanisme med flere referencer ideel til virkelige arbejdsgange, der lægger vægt på konsistens og integritet.
Høj opløsning, erhvervskvalitet (op til 4 MP)
FLUX.2 understøtter output på op til 4 megapixel (ca. 2000-3000 pixels), hvilket giver en billedkvalitet, der er egnet til praktiske anvendelser såsom reklame, tryk, skiltning og plakater.
Den håndterer tekst, logoer, UI-mockups, infografik og mere perfekt, hvilket gør den ikke kun velegnet til kunstnerisk skabelse, men også til design og kommerciel brug.
Samtidig er gengivelseskvaliteten af skrifttyper og tekst også blevet forbedret, hvilket gør den velegnet til at oprette reklamebannere og produktetiketter.
Understøtter lokal GPU-udførelse: Lave omkostninger, lav adgangsbarriere
Til dato er mange højtydende billedgenereringsmodeller kun praktiske i datacentre med massive computerressourcer. FLUX.2 er dog optimeret til at køre på standard GPU'er (såsom NVIDIA RTX) med mindre VRAM-forbrug.
Modeller behøver ikke længere at blive tilgået via skyen; de kan redigeres og genereres lokalt, hvilket reducerer omkostningerne betydeligt og øger den operationelle fleksibilitet.
Dette er en stor fordel ikke kun for virksomheder, men også for individuelle skabere og små teams.
Samlet arbejdsgang til oprettelse og redigering
FLUX.2 understøtter ikke kun tekst-til-billede (tekst → billedgenerering), men også billede-til-billede (redigering og styling af eksisterende billeder).
Dette giver dig mulighed for konsekvent at bruge en enkelt model til opgaver som "at tegne et nyt billede fra bunden", "redigere og retouchere eksisterende fotos" og "genbruge flere billeder for at skabe ensartede variationer".
For eksempel er det nemt at ændre baggrunden på et produktfoto til en anden atmosfære eller tilpasse størrelsen til sociale medier.
Sådan får du adgang til Flux.2 API'en
Vi er glade for at kunne meddele, at CometAPI har integreret Flux.2 API'en. Understøtter nu Replicate Format Model (lavere end den officielle Replicate-pris), FLUX.2-slutpunkter:
- black-forest-labs/flux-2-pro
- black-forest-labs/flux-2-dev
- black-forest-labs/flux-2-flex
Begynd at bygge nu Opret forudsigelser – API-dokument,
Vil du prøve først? Test FLUX.2 og i vores legeplads efter registrering og login på CometAPI, hvis du vil begynd at bygge med API nu: Opret forudsigelser – API-dokument.
FLUX.2 er ikke blot endnu et modeldrop; det er en produktstrategi på familieniveau, der adresserer produktionsrealiteter: kvalitetskontrol, redigerbarhed, sammenhæng i flere referencer og praktiske implementeringsveje (administrerede API'er og åbne kontrolpunkter). For organisationer, der producerer visuelt indhold i stor skala, lover FLUX.2 meningsfulde produktivitetsgevinster - forudsat at teams kombinerer teknisk implementering med robust licensstyring og kvalitetskontrol.
Primære anvendelser og tilsigtede anvendelsesscenarier for FLUX.2
Produktvisualiseringer/Oprettelse af e-handelskatalog
E-handelsvirksomheder og brands har stor efterspørgsel efter at tage adskillige produktbilleder fra flere vinkler ved hjælp af forskellige belysningsmønstre, baggrunde og farveindstillinger.
- Med FLUX.2 kan du hurtigt generere flere visuelt ensartede effekter uden rent faktisk at optage noget indhold.
- Dette giver dig mulighed for hurtigt at udvide dit produktkatalog, samtidig med at du reducerer omkostninger til fotografering, tid og administration.
Udarbejdelse af reklame- og marketingmateriale
Efterspørgslen efter designmaterialer er bred, herunder reklamebannere, billeder til sociale medier, visuelle elementer fra salgsfremmende kampagner og PR-plakater.
- Angiv blot en tekstbeskrivelse for at få billeder med den ønskede stil, komposition og atmosfære, hvilket i høj grad reducerer byrden for designere og annoncører.
- Da variationer kan genereres ved hjælp af flere referencebilleder, er det desuden også velegnet til A/B-testning af kreative ideer og til at skabe materialer, der er kompatible med flere sprog og regioner.
Brugergrænseflade/brugeroplevelsesdesign, prototyping
FLUX.2 understøtter også redigering af logoer, skrifttyper, layouts og baggrunde, hvilket gør det velegnet ikke kun til fotogenerering, men også til visuelt design af digitale produkter.
- Du kan hurtigt oprette foreløbige designs, wireframes, eventwebsteder, mockups til applikationsskærme og meget mere.
- Dette er en omkostningseffektiv produktionsløsning, især velegnet til startups og små designteams.
Kunst/kreative værker og personlig brug
Selvfølgelig kan det også bruges udelukkende til "kunstværker", "illustrationer" eller "grafisk design".
- Udvid din kreative horisont ved at skabe værker i forskellige stemninger og stilarter ved hjælp af tekstprompter og referencebilleder.
- Du kan også bruge billedredigeringsfunktioner til frit at genbruge eksisterende fotos til kunstneriske stilarter eller eksperimentere med fantastiske landskaber eller karakterdesigns.
Adskiller sig fra eksisterende modeller og konkurrenter – hvorfor vælge FLUX.2?
Sammenligning med andre AI-billedgenereringsmodeller
Der findes i øjeblikket mange modeller (open source og kommercielle) inden for AI-billedgenerering, såsom traditionelle diffusionsmodeller og de nyeste konkurrerende modeller. Så hvorfor er FLUX.2 så overbevisende? Årsagerne er som følger:
- Integreret generering og redigering: Mange modeller fokuserer enten på "generering (tekst til billede)" eller "redigering (billede til billede)". FLUX.2 understøtter begge funktioner samtidigt og opnår en meget ensartet arbejdsgang.
- Flere referenceinput: Brug flere referencebilleder til nem produktfotografering og ensartet visuel konsistens.
- Kommerciel kvalitet og høj opløsning: Understøtter 4MP til reklamer, produktfotografering og tryk.
- Nem lokal udførelse: Den er cloud-uafhængig og kan køre på standard GPU'er, hvilket giver fordele både i forhold til omkostninger og fleksibilitet.
- Fleksibelt modeludvalg: Tilbyder en række modeller, der dækker alt fra standard til kommercielle og forskningsmæssige applikationer, så du kan vælge den, der bedst passer til dine behov og dit budget.
Dette gør FLUX.2 til et effektivt valg til professionelle arbejdsgange, kommerciel brug, produktion i store mængder og projekter, hvor omkostninger og hastighed er afgørende.
Endelige tanker:
FLUX.2 befinder sig i et pragmatisk krydsfelt: det tilbyder åbne forskningsmuligheder for teams, der har brug for kontrol og reproducerbarhed, og administrerede produktions-API'er for teams, der prioriterer lav latenstid, forudsigelige output og proveniens. Ved at levere både åbne og administrerede varianter (udvikling/pro/flex) anerkender BFL, at forskellige arbejdsgange - eksperimentering, iterativt design og produktion - kræver forskellige afvejninger mellem kvalitet, hastighed, tilpasning og styring.
Udviklere kan få adgang Flux.2 Dev API, Flux.2 Flex API og Flux.2 Pro API gennem CometAPI. For at begynde, udforsk CometAPI's modelfunktioner i LegepladsFør du tilgår, skal du sørge for at være logget ind på CometAPI og have fået API-nøglen. CometAPI tilbyde en pris, der er langt lavere end den officielle pris, for at hjælpe dig med at integrere.
Klar til at gå? → Tilmeld dig CometAPI i dag !
Hvis du vil vide flere tips, guider og nyheder om AI, følg os på VK, X og Discord!
