Caratteristiche principali (cosa fa Flux.2 Dev)
- Generazione Text→Image con elevata aderenza al prompt e rendering migliorato della tipografia / dei piccoli dettagli.
- Editing con più riferimenti — combina più immagini di riferimento in un unico output, preservando la coerenza di identità/stile.
- Checkpoint unico per generazione + editing (non è richiesto alcun modello di editing separato).
- Ampio checkpoint open-weight (32B) che consente ricerca locale, quantizzazione e adattamento da parte della community.)
- VAE ottimizzato per un miglior compromesso tra apprendibilità–qualità–compressione (consente editing/output a 4MP).
Dettagli tecnici (architettura e ingegneria)
- Numero di parametri: 32 miliardi di parametri per il checkpoint FLUX.2.
- Design principale: latent flow-matching / rectified flow transformer combinato con un vision-language model (BFL afferma di accoppiare un Mistral-3 24B VLM con la backbone transformer per il grounding semantico). Il VLM contribuisce con conoscenza del mondo e grounding testuale, mentre il transformer modella la struttura spaziale/compositiva.
- VAE: nuovo VAE FLUX.2 (rilasciato sotto Apache-2.0) riaddestrato per migliorare la fedeltà di ricostruzione e l’apprendibilità nello spazio latente, consentendo editing ad alta risoluzione.
- Sampling e distillazione: addestrato utilizzando tecniche di guidance-distillation per migliorare l’efficienza dell’inferenza e la fedeltà.
Prestazioni nei benchmark
Black Forest Labs ha pubblicato valutazioni comparative e grafici che mostrano le prestazioni di FLUX.2 rispetto a modelli di immagini contemporanei open-weight e hosted. Dati principali pubblicati (BFL / sintesi della stampa):
- Win rate text-to-image: FLUX.2 ~66.6% (vs. Qwen-Image 51.3%, Hunyuan ~48.1% nel dataset head-to-head di BFL).
- Win rate nell’editing a riferimento singolo: FLUX.2 ~59.8% (vs. Qwen-Image 49.3%, FLUX.1 Kontext ~41.2%).
- Win rate nell’editing multi-reference: FLUX.2 ~63.6% (vs. Qwen-Image 36.4%). BFL riporta anche una capacità multi-reference fino a 10 riferimenti nella propria suite di valutazione.
Casi d’uso tipici / consigliati
- Varianti di immagini per pubblicità e marketing in cui lo stesso modello/attore/prodotto deve rimanere coerente in molte scene o sfondi diversi (coerenza multi-reference).
- Fotografia di prodotto e virtual try-on (preservare i dettagli del prodotto attraverso diversi sfondi).
- Servizi editoriali / fashion che richiedono la stessa identità in molti scatti.
- Prototipazione rapida e ricerca (il checkpoint dev consente sperimentazione, fine-tuning e workflow con LoRA/adapter).
Come accedere all’API Flux.2 dev
Passaggio 1: Registrarsi per ottenere una chiave API
Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla tua console CometAPI. Ottieni la credenziale di accesso, ossia la chiave API dell’interfaccia. Fai clic su “Add Token” nella sezione API token del centro personale, ottieni la chiave token: sk-xxxxx e inviala.

Passaggio 2: Inviare richieste all’API Flux.2 dev
Seleziona l’endpoint “black-forest-labs/flux-2-dev” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo di richiesta e il corpo della richiesta sono disponibili nella documentazione API del nostro sito web. Il nostro sito fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua effettiva chiave CometAPI del tuo account.
Inserisci la tua domanda o richiesta nel campo content: questo è ciò a cui il modello risponderà. Elabora la risposta API per ottenere l’output generato.
Passaggio 3: Recuperare e verificare i risultati
Elabora la risposta API per ottenere l’output generato. Dopo l’elaborazione, l’API restituisce lo stato del task e i dati di output.
CometAPI ora supporta i modelli in formato Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Promozione a tempo limitato: prezzi inferiori a quelli ufficiali di Replicate!
👇 Inizia subito a sviluppare Create Predictions – API Doc
⚡ Selezione flessibile:
- Pro: progettato per produzione ad alta efficienza e consegna rapida.
- Flex: massimizza la qualità dell’immagine con parametri regolabili.
- Dev: ottimizzazione pensata per gli sviluppatori.