Funzionalità principali (cosa offre FLUX.2-Pro)
- Qualità orientata alla produzione: Mirata a pipeline commerciali con latenza prevedibile e alta fedeltà visiva (output fotorealistici fino a ~4 megapixel).
- Condizionamento multi-riferimento: Supporto via API per fino a 8 riferimenti e mantenimento della coerenza di personaggio/stile tra gli output — utile per la continuità del brand o del personaggio.
- Tipografia e layout migliorati: Rendering del testo più solido e leggibile per UI, infografiche e loghi rispetto a molti modelli precedenti.
- Output deterministici a bassa varianza: Il livello Pro è ottimizzato per ridurre il prompting iterativo e i cicli in produzione.
- Provenienza dei contenuti e strumenti di sicurezza: L’API applica metadati C2PA firmati crittograficamente agli output; gli endpoint ospitati includono filtri e moderazione in fase di inferenza.
- Inferenza a bassa latenza e prevedibile (“tempi di generazione sotto i 10 secondi” e SLA per Pro).
Dettagli tecnici di FLUX.2 Pro
- Architettura principale: FLUX.2 utilizza un approccio di latent flow-matching con un rectified-flow transformer che opera in uno spazio latente appreso. Il design abbina quel backbone transformer a un modello vision-language Mistral-3 24B per fornire ancoraggio semantico e conoscenza del mondo durante la sintesi.
- VAE e riprogettazione del latente: BFL ha rilasciato un FLUX.2 VAE aggiornato (Apache-2.0) che riequilibra compressione, fedeltà di ricostruzione e apprendibilità — consentendo editing di qualità superiore a risoluzioni multi-megapixel. Il VAE condiviso sostiene tutte le varianti di FLUX.2 per interoperabilità e risultati di editing più coerenti.
- Comportamento d’inferenza / tecniche di training: Il checkpoint Dev è stato addestrato con tecniche come la guidance distillation per rendere il campionamento più efficiente e consentire campionamento di alta qualità con meno step; la versione Pro ospitata può utilizzare ulteriori ingegnerizzazioni e pipeline di campionamento per ridurre la latenza.
Nome del modello: black-forest-labs/flux-2-pro
Prestazioni nei benchmark
Le valutazioni interne di Black Forest Labs e le analisi indipendenti pubblicate al lancio riportano che FLUX.2 mostra incrementi misurabili rispetto a diversi sistemi d’immagine contemporanei nei tassi di vittoria in valutazioni umane per compiti text→image ed editing:
- Text→image: tasso di vittoria riportato ~66.6% in confronti diretti valutati da esseri umani vs modelli selezionati (confronti campionati citati sulla stampa).
- Editing con singolo riferimento: ~59.8% di vittorie vs Qwen-Image nei confronti riportati; editing multi-riferimento: ~63.6% di vittorie. Queste percentuali di vittoria sono state enfatizzate dai media al lancio come prova di qualità costante e accuratezza nell’editing.
FLUX.2 vs Nano Banana Pro vs Qwen-Image
- Nano Banana Pro / Google Gemini image tiers: BFL posiziona FLUX.2 come allineato ai leader closed-source per fedeltà al prompt e qualità visiva, con costi per immagine inferiori (BFL ha pubblicato confronti di prezzo per MP). I concorrenti proprietari possono ancora rivendicare ELO assoluti al top in alcuni test curati, ma a costi per immagine più elevati.
- Hunyuan Image / Qwen-Image / altri modelli open: FLUX.2 risulta superare molti checkpoint open contemporanei nei test head-to-head sui tassi di vittoria in compiti T2I ed editing (secondo i confronti pubblicati da BFL). Le differenze tendono a essere più marcate nella coerenza multi-riferimento e nella tipografia.
- Linea evolutiva di FLUX.1: FLUX.2 è una riprogettazione architetturale completa (non un drop-in replacement) che migliora i blocchi DiT, l’autoencoder e l’accoppiamento con il VLM. Si prevedono miglioramenti tangibili nella fedeltà dell’editing e nella coerenza multi-riferimento rispetto a FLUX.1.
Come accedere all’API Flux.2 Pro
Passo 1: Registrati per ottenere la chiave API
Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla tua console CometAPI. Ottieni la chiave API delle credenziali di accesso dell’interfaccia. Fai clic su “Add Token” nella sezione dei token API del centro personale, ottieni la chiave del token: sk-xxxxx e invia.
Passo 2: Invia richieste all’API Flux.2 Pro
Seleziona l’endpoint “black-forest-labs/flux-2-pro” per inviare la richiesta API e imposta il body della richiesta. Il metodo e il body della richiesta sono reperibili nella documentazione API del nostro sito. Il nostro sito fornisce anche il test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua effettiva chiave CometAPI del tuo account.
Inserisci la tua domanda o richiesta nel campo content — è a questo che il modello risponderà. Elabora la risposta dell’API per ottenere l’output generato.
Passo 3: Recupera e verifica i risultati
Elabora la risposta dell’API per ottenere l’output generato. Dopo l’elaborazione, l’API risponde con lo stato dell’attività e i dati di output.
Vedi anche Gemini 3 Pro Image (Nano Banana Pro) API
CometAPI ora supporta i modelli in formato Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Promozione a tempo limitato: più conveniente dei prezzi ufficiali di Replicate!
👇 Inizia a costruire ora Crea predizioni – Documentazione API
⚡ Selezione flessibile:
- Pro: Progettato per produzione ad alta efficienza e consegna rapida.
- Flex: Massimizza la qualità dell’immagine con parametri regolabili.
- Dev: Ottimizzazione pensata per gli sviluppatori.