Hva er Flux.2, og Flux 2 er nå tilgjengelig på CometAPI

FLUX.2 er en nylig annonsert familie av bildegenererings- og redigeringsmodeller fra Black Forest Labs som tilbyr produksjonskvalitet, multireferanse-redigering (opptil 10 referanser) og distribuerbare varianter fra open-weight Dev til produksjonsklare Pro og et kontrollerbart Flex-nivå.

Hva er FLUX.2?

FLUX.2 er Black Forest Labs’ produksjonsklare bildegenererings- og redigeringsfamilie som kombinerer multireferanse-kondisjonering, et omarbeidet latentrom (VAE) og avanserte kontrollprimitiver (hex-fargestyring, JSON-prompting, poseveiledning) for å levere konsistente resultater med høy trofasthet for kreative og kommersielle arbeidsflyter. Den støtter både tekst→bilde-generering og multireferanse-bilderedigering i én modellsuite, og BFL leverer både hostede API-endepunkter og open-weight-artefakter for forskning og lokal inferens. Tilbudet finnes i flere distribusjonskanaler: åpne vekter for forskere/utviklere (FLUX.2 ), hostede produksjonsmodeller som Flux.2 Pro, og tilpassbare hostede endepunkter som Flux.2 Flex.

Nøkkelfunksjoner

Multireferanse-redigering: kombiner opptil 8–10 referansebilder for ett enkelt utfall, samtidig som identitet og stilkonsistens opprettholdes. Dette er spesielt nyttig for reklame, produktmockups eller karakterkontinuitet på tvers av kreative varianter.
Høy oppløsning (opptil 4MP): utdata opptil 4 megapiksler (for eksempel 2048×2048 og større, avhengig av sideforhold).
Fotorealisme + fine detaljer: forbedringer i hender, ansikter, teksturer og romlig resonnering sammenlignet med tidligere åpne modeller.
Strukturert prompting og JSON-prompter: FLUX.2 støtter strukturerte/JSON-prompt som naturlig kartlegges til UI-kontroller (scene, subjects[], style, lighting, camera), noe som muliggjør programmatisk og reproduserbar generering.
Typografi og fargenøyaktighet: uvanlig god tekstrendring og nøyaktig fargestyring (hex) for merkevaresensitive arbeidsflyter.
Innholdsopprinnelse og sikkerhet: Pro-API-en legger til kryptografisk signert C2PA-metadata i produserte bilder og opererer med lagdelt filtrering for ikke-tillatte innholdskategorier.

Pro vs Flex vs Dev: Hvilken modell skal du velge?

Variant	Latens og kostnad	Kvalitet	Kontroll og funksjoner	Multi-referanse
FLUX.2	optimalisert for lav latens (<10s i typiske API-oppsett), inkluderer innholdsfiltre og kryptografisk signert C2PA-metadata for proveniens.	Høyest (4MP, best fidelity)	Alle funksjoner, produksjons-SLA-er	Opptil 8 (API, 9MP-grense)
FLUX.2	høyere latens enn `pro` men eksponerer justerbare inferens-hyperparametere (steg, veiledningsskala osv.)	Høy	Justerbar trofasthet vs. variasjon; justerbare inferenssteg, veiledningsskala og andre samplingskontroller for avveiinger mellom kvalitet/hastighet.	Opptil 10
FLUX.2	Avhenger av maskinvare	Sterk (åpne vekter)	Full redigering + multireferanse; åpent checkpoint	Anbefalt maks 6
FLUX.2	Edge / lavressurs	Moderat (destillert)	Rask, lite VRAM-avtrykk

Når velge hva

Velg dev hvis du må kjøre lokalt, trenger algoritmisk forskning eller krever open-weight-tilpasninger (og aksepterer høye maskinvarebehov).
Velg pro når du trenger forutsigbare, lav-latens produksjonsbilder med innebygde sikkerhets- og proveniensfunksjoner.
Velg flex hvis du itererer på genereringshyperparametere (tuning av steg, veiledningsskala osv.) og ønsker et administrert endepunkt som eksponerer denne kontrollen.

Hvordan fungerer FLUX.2?

FLUX.2 samler tre sentrale arkitektoniske elementer:

1. Rektifisert-flyt transformer-ryggrad

Kjernen i FLUX.2 er en flow-matching / rectified-flow transformerarkitektur som opererer i et lært latentrom (et moderne alternativ til diffusjon for enkelte produksjonslinjer). Denne ryggraden muliggjør rendring med høy trofasthet og romlig resonnering som forbedrer konsistens på tvers av flere referanser. “Flow matching”-tilnærmingen tilbyr andre avveiinger i samplingshastighet og trofasthet sammenlignet med klassisk diffusjon.

2. Ny varians-autokoder (VAE)

En spesialbygget autokoder komprimerer bilder til en latent representasjon optimalisert for FLUX.2s genererings- og redigeringsoppgaver. BFL oppgir at den nye VAE-en forbedrer komprimerbarhet og trofasthet (bedre læringsdynamikk og høyere kvalitetsrekonstruksjoner enn tidligere generasjoner). VAE-en er en nøkkelbidragsyter til ren oppskalering til 4MP og forbedret detalj.

3. VLM med lang kontekst (vision–language model)

En VLM (rapportert å være relatert til Mistral-klasse visuell–språk-enkodere i publiserte notater) gir språk-kondisjoneringen og den virkelighetsforankrede kunnskapen som gjør prompt mer trofaste og modellen bedre til å følge komplekse instruksjoner (poseveiledning, kontekstuelle endringer osv.). Å kombinere en VLM med en flytryggrad gjør at FLUX.2 kan resonnerer om komposisjon og semantikk med større kontekstvinduer.

Hvordan disse delene samhandler (kjøretidsflyt)

Koder inn input: referansebilder kodes via VAE til latente token; tekstprompt kodes av VLM-en.
Tverrmodal fusjon: transformer-ryggraden tar inn bildelatenter + teksttoken og modellerer romlige relasjoner, identitetsfunksjoner og redigeringsinstruksjoner.
Flytbasert generering: de rektifiserte flyt-samplerne genererer eller redigerer latente bilder betinget på den fusjonerte representasjonen.
Dekoding: VAE-en dekoder latenter tilbake til pikselrom, og anvender eventuelt endelige fargebegrensninger og vannmerke/C2PA-metadata.

Hvorfor denne arkitekturen er viktig

Denne kombinasjonen gir tre praktiske fordeler: (1) multireferanse-koherens fordi identitet og stil modelleres eksplisitt i latentrommet; (2) bedre tekst og typografi grunnet tettere integrasjon mellom VLM og bildeadlatentrom; (3) skalerbare utrullingsvalg — den samme grunnleggende modellsuiten kan leveres som åpne vekter for lokal bruk (dev), som en administrert lav-latens-tjeneste (pro), eller som en justerbar tjeneste for utviklere (flex).

Hvor god er FLUX.2?

Ytelse i benchmarker

Black Forest Labs publiserte komparative evalueringer og diagrammer som viser at FLUX.2 overgår flere open-weight-samtidige i direkte menneskelige preferanse-/seiersratetester og i ELO vs. kost-analyser. Rapporterte høydepunkter fra den publiserte leverandør-/presseoppsummeringen inkluderer:

Tekst→bilde seiersrate: FLUX.2 rapporterte ≈66.6% seiersrate (vs ~51.3% Qwen-Image, 48.1% Hunyuan Image 3.0).
Én-referanse-redigering: ≈59.8% seiersrate (vs ~49.3% Qwen-Image, 41.2% FLUX.1 Kontext).
Multireferanse-redigering: ≈63.6% seiersrate (vs ~36.4% for Qwen-Image).
ELO vs kost: FLUX.2-familien (Pro, Flex, Dev) klustrer i et bånd med høy kvalitet og relativt lav kost (ELO ≈1030–1050 samtidig som de opererer på ~2–6 cent per bilde i leverandørens prisingstabell).

Multireferanse-generering

En av FLUX.2s største funksjoner er evnen til å generere flere konsistente utdata ved å bruke flere referansebilder.

For eksempel, når du fotograferer et produkt, kan du laste opp flere bilder tatt fra ulike vinkler, under forskjellige lysforhold og mot ulike bakgrunner, og generere flere varianter av det samme bildet samtidig.

Denne funksjonen lar deg raskt batch-generere produktkatalogbilder for e-handelsnettsteder, reklamebannere, bildesett for sosiale medier og mer.

I motsetning til tradisjonell enkeltbilde-generering er denne multireferanse-mekanismen ideell for virkelige arbeidsflyter som vektlegger konsistens og integritet.

Høy oppløsning, forretningskvalitet (opptil 4MP)

FLUX.2 støtter utdata opptil 4 megapiksler (omtrent 2000-3000 piksler) og leverer bildekvalitet som er egnet for praktiske bruksområder som reklame, trykk, skilt og plakater.

Den håndterer tekst, logoer, UI-mockups, infografikk og mer på en utmerket måte, noe som gjør den egnet ikke bare for kunstnerisk skapelse, men også for design og kommersiell bruk.

Samtidig er gjengivelsen av fonter og tekst forbedret, noe som gjør den egnet til å lage reklamebannere og produktetiketter.

Støtter lokal GPU-kjøring: lav kostnad, lav terskel

Til dags dato er mange høyytelses bildegenereringsmodeller kun praktiske i datasentre med enorme datakraftressurser. FLUX.2 er imidlertid optimalisert for å kjøre på standard GPU-er (som NVIDIA RTX) med lavere VRAM-forbruk.

Modeller trenger ikke lenger å nås via skyen; de kan redigeres og genereres lokalt, noe som reduserer kostnader betydelig og øker operasjonell fleksibilitet.

Dette er en stor fordel ikke bare for bedrifter, men også for individuelle skapere og små team.

Enhetlig arbeidsflyt for opprettelse og redigering

FLUX.2 støtter ikke bare tekst-til-bilde (tekst → bildegenerering) men også bilde-til-bilde (redigering og styling av eksisterende bilder).

Dette lar deg konsekvent bruke én enkelt modell for oppgaver som “å tegne et nytt bilde fra bunnen av”, “redigere og retusjere eksisterende bilder” og “gjenbruke flere bilder for å skape uniforme varianter”.

For eksempel er det enkelt å endre bakgrunnen i et produktfoto til en annen atmosfære eller tilpasse størrelsen for sosiale medier.

Hvordan få tilgang til Flux.2 API

Vi er glade for å kunngjøre at CometAPI har integrert Flux.2 API. Støtter nå Replicate Format Model(Lower than Replicate Official Pricing), FLUX.2-endepunkter:

black-forest-labs/flux-2-pro
black-forest-labs/flux-2-dev
black-forest-labs/flux-2-flex

Start byggingen nå Opprett prediksjoner – API-dokumentasjon,

Vil du prøve først? Test FLUX.2 og i vår playground etter at du har registrert deg og logget inn på CometAPI, hvis du vil starte bygging med API nå: Opprett prediksjoner – API-dokumentasjon.

FLUX.2 er ikke bare enda et modellslipp; det er en produktstrategi på familienivå som adresserer produksjonsrealiteter: trofasthet, redigerbarhet, multireferanse-koherens og praktiske distribusjonsveier (administrerte API-er og åpne sjekkpunkter). For organisasjoner som produserer visuelt innhold i skala, lover FLUX.2 meningsfulle produktivitetsgevinster — forutsatt at teamene kombinerer teknisk adopsjon med robust lisensforvaltning og kvalitetskontroll.

Hovedbruksområder og tiltenkte brukstilfeller for FLUX.2

Produktvisualer/skapelse av e-handelskatalog

E-handelsbedrifter og merkevarer har et høyt behov for å ta en mengde produktbilder fra flere vinkler, med forskjellige lys, bakgrunner og fargemodi.

Med FLUX.2 kan du raskt generere flere visuelt konsistente effekter uten faktisk å fotografere noe.
Dette lar deg raskt utvide produktkatalogen samtidig som du reduserer kostnader til fotografering, tid og administrasjon.

Produksjon av reklame- og markedsføringsmateriell

Behovet for designmateriell er bredt, inkludert reklamebannere, bilder til sosiale medier, kampanjegrafikk og PR-plakater.

Bare oppgi en tekstbeskrivelse for å få bilder med ønsket stil, komposisjon og stemning, noe som reduserer byrden på designere og markedsførere kraftig.
Videre, fordi varianter kan genereres med flere referansebilder, er det også egnet for A/B-testing av kreative ideer og for å lage materiell kompatibelt med flere språk og regioner.

Brukergrensesnitt-/brukeropplevelsesdesign, prototyping

FLUX.2 støtter også redigering av logoer, fonter, layouter og bakgrunner, noe som gjør den egnet ikke bare for fotogenerering, men også for visuell design av digitale produkter.

Du kan raskt lage innledende design, wireframes, arrangementsnettsteder, applikasjonsskjerm-mockups og mer.
Dette er en kostnadseffektiv produksjonsløsning, spesielt for oppstartsselskaper og små designteam.

Kunst/kreative verk og personlig bruk

Selvfølgelig kan den også brukes utelukkende til “kunstverk”, “illustrasjoner” eller “grafisk design”.

Utvid de kreative horisontene ved å lage verk i ulike stemninger og stiler ved å bruke tekstprompt og referansebilder.
Du kan også bruke bilderedigeringsfunksjonene til fritt å omarbeide eksisterende bilder til kunstneriske stiler, eller eksperimentere med fantasifulle landskap eller karakterdesign.

Skiller seg fra eksisterende modeller og konkurrenter—hvorfor velge FLUX.2?

Sammenligning med andre AI-bildegenereringsmodeller

For tiden er det mange modeller (åpen kildekode og kommersielle) innen AI-bildegenerering, som tradisjonelle diffusjonsmodeller og de nyeste konkurrerende modellene. Så, hvorfor er FLUX.2 så overbevisende? Årsakene er som følger:

Integrert generering og redigering: Mange modeller fokuserer enten på “generering (tekst til bilde)” eller “redigering (bilde til bilde)”. FLUX.2 støtter begge funksjoner samtidig og oppnår en svært konsistent arbeidsflyt.
Flere referanseinnganger: Bruk flere referansebilder for enkel produktfotografering og konsekvent visuell konsistens.
Kommersiell kvalitet og høy oppløsning: Støtter 4MP for reklame, produktfotografering og trykk.
Enkel lokal kjøring: Den er uavhengig av skyen og kan kjøre på standard GPU-er, med fordeler både i kostnad og fleksibilitet.
Fleksibelt modellvalg: Tilbyr en rekke modeller som dekker alt fra standard til kommersielle og forskningsapplikasjoner, slik at du kan velge det som best passer dine behov og budsjett.

Dette gjør FLUX.2 til et kraftig valg for profesjonelle arbeidsflyter, kommersiell bruk, storskala produksjon og prosjekter der kostnad og hastighet er kritiske.

Avsluttende tanker:

FLUX.2 befinner seg i et pragmatisk krysningspunkt: det tilbyr open-weight-forskningsalternativer for team som trenger kontroll og reproduserbarhet, og administrerte, produksjonsklare API-er for team som prioriterer lav latens, forutsigbare utdata og proveniens. Ved å levere både åpne og administrerte varianter (dev/pro/flex) erkjenner BFL at ulike arbeidsflyter — eksperimentering, iterativ design og produksjon — krever ulike avveiinger mellom trofasthet, hastighet, tilpasning og styring.

Utviklere kan få tilgang til Flux.2 Dev API, Flux.2 Flex API og Flux.2 Pro API via CometAPI. For å komme i gang, utforsk modellkapabilitetene til CometAPI i Playground. Før du får tilgang, må du forsikre deg om at du har logget inn på CometAPI og hentet API-nøkkelen. CometAPI tilbyr en pris langt lavere enn den offisielle prisen for å hjelpe deg å integrere.

Klar til å starte?→ Registrer deg for CometAPI i dag !

Hvis du vil ha flere tips, guider og nyheter om AI, følg oss på VK, X og Discord!