Che cos'è Flux.2 e Flux 2 è ora disponibile su CometAPI

CometAPI
AnnaNov 26, 2025
Che cos'è Flux.2 e Flux 2 è ora disponibile su CometAPI

FLUX.2 è una famiglia appena annunciata di modelli per la generazione e l’editing di immagini firmata Black Forest Labs, che offre fedeltà di livello produttivo, editing multiriferimento (fino a 10 riferimenti) e varianti distribuibili che vanno dal Dev a pesi aperti al Pro per la produzione e a un livello Flex controllabile.

Che cos'è FLUX.2?

FLUX.2 è la famiglia di generazione + editing di immagini di livello produttivo di Black Forest Labs che unisce condizionamento multiriferimento, uno spazio latente rielaborato (VAE) e primitive di controllo avanzate (pilotaggio del colore in esadecimale, prompt JSON, guida della posa) per offrire risultati coerenti e ad alta fedeltà per flussi creativi e commerciali. Supporta sia la generazione testo→immagine sia l’editing multiriferimento in un’unica famiglia di modelli, e BFL fornisce endpoint API ospitati oltre ad artefatti a pesi aperti per la ricerca e l’inferenza locale. L’offerta esiste su più canali di distribuzione: pesi aperti per ricercatori/sviluppatori (FLUX.2), modelli di produzione ospitati come Flux.2 Pro e endpoint ospitati personalizzabili come Flux.2 Flex.

Key capabilities

  • Editing multiriferimento: combina fino a 8–10 immagini di riferimento per un singolo output mantenendo coerenza di identità e stile. Particolarmente utile per pubblicità, mockup di prodotto o continuità del personaggio tra varianti creative.
  • Alta risoluzione (fino a 4MP): output fino a 4 megapixel (per esempio 2048×2048 e oltre, a seconda del rapporto d’aspetto).
  • Fotorealismo + dettagli fini: miglioramenti su mani, volti, texture e ragionamento spaziale rispetto ai modelli open precedenti.
  • Prompt strutturati e prompt JSON: FLUX.2 supporta prompt strutturati/JSON che si mappano naturalmente ai controlli UI (scene, subjects[], style, lighting, camera), abilitando una generazione programmabile e riproducibile.
  • Tipografia e fedeltà cromatica: resa del testo insolitamente buona e pilotaggio esatto del colore (hex) per flussi di lavoro sensibili al brand.
  • Provenienza dei contenuti e sicurezza: l’API Pro applica metadati C2PA firmati crittograficamente alle immagini prodotte e opera un filtraggio a più livelli per le categorie di contenuti non consentite.

Pro vs Flex vs Dev: quale modello scegliere?

VarianteLatenza e costiQualitàControllo e funzionalitàMultiriferimento
FLUX.2ottimizzato per bassa latenza (<10 s in configurazioni API tipiche), include filtri sui contenuti e metadati C2PA firmati crittograficamente per la provenienza.Massima (4MP, migliore fedeltà)Funzionalità complete, SLA di produzioneFino a 8 (API, limite 9MP)
FLUX.2latenza più alta rispetto a pro ma espone iperparametri di inferenza regolabili (steps, guidance scale, ecc.)AltaFedeltà vs diversità regolabile; passi di inferenza, scala di guidance e altri controlli di campionamento regolabili per bilanciare qualità/velocità.Fino a 10
FLUX.2Dipende dall'hardwareSolida (pesi aperti)Editing completo + multiriferimento; checkpoint apertoMassimo consigliato 6
FLUX.2Edge / risorse ridotteModerata (distillata)Veloce, ingombro VRAM ridotto

Quando scegliere quale

  • Scegli dev se devi eseguire in locale, ti serve ricerca algoritmica o richiedi personalizzazioni a pesi aperti (accettando elevate esigenze hardware).
  • Scegli pro quando ti servono immagini di produzione prevedibili e a bassa latenza con funzionalità di sicurezza e provenienza integrate.
  • Scegli flex se stai iterando sugli iperparametri di generazione (regolazione degli steps, guidance scale, ecc.) e desideri un endpoint gestito che esponga quel controllo.

Come funziona FLUX.2?

FLUX.2 riunisce tre elementi architetturali principali:

1. Backbone transformer a rectified-flow

Al suo core, FLUX.2 utilizza un’architettura transformer di flow-matching/rectified-flow che opera in uno spazio latente appreso (un’alternativa moderna alla diffusione per alcune pipeline produttive). Questo backbone abilita un rendering ad alta fedeltà e un ragionamento spaziale che migliorano la coerenza tra più riferimenti. L’approccio di “flow matching” offre compromessi diversi tra velocità di campionamento e fedeltà rispetto alla diffusione classica.

2. Nuovo variational autoencoder (VAE)

Un autoencoder progettato ad hoc comprime le immagini in una rappresentazione latente ottimizzata per i compiti di generazione ed editing di FLUX.2. BFL afferma che il nuovo VAE migliora comprimibilità e fedeltà (dinamiche di apprendimento migliori e ricostruzioni di qualità superiore rispetto alle generazioni precedenti). Il VAE è un elemento chiave per l’upscaling pulito fino a 4MP e il miglioramento dei dettagli.

3. Modello visivo–linguistico (VLM) a lungo contesto

Un VLM (secondo le note pubblicate, correlato a encoder visivo-linguistici di classe Mistral) fornisce il condizionamento linguistico e la conoscenza del mondo reale che rendono i prompt più fedeli e il modello migliore nel seguire istruzioni complesse (guida della posa, modifiche contestuali, ecc.). Combinare un VLM con un backbone a flow consente a FLUX.2 di ragionare su composizione e semantica con finestre di contesto più ampie.

Come interagiscono questi componenti (flusso a runtime)

  1. Codifica degli input: le immagini di riferimento vengono codificate tramite il VAE in token latenti; i prompt testuali vengono codificati dal VLM.
  2. Fusione cross-modale: il backbone transformer ingerisce i latenti immagine + i token testuali e modella relazioni spaziali, caratteristiche identitarie e istruzioni di editing.
  3. Generazione basata su flow: i campionatori rectified-flow generano o modificano immagini latenti condizionate dalla rappresentazione fusa.
  4. Decodifica: il VAE decodifica i latenti nello spazio dei pixel, applicando facoltativamente vincoli cromatici finali e watermark/metadati C2PA.

Perché questa architettura è importante

Questa combinazione offre tre vantaggi pratici: (1) coerenza multiriferimento perché identità e stile sono modellati esplicitamente nel latente; (2) testo e tipografia migliori grazie a un’integrazione più stretta tra VLM e spazio latente dell’immagine; (3) opzioni di distribuzione scalabili — la stessa famiglia di modelli può essere fornita come pesi aperti per l’uso locale (dev), come servizio gestito a bassa latenza (pro) o come servizio regolabile per sviluppatori (flex).

Quanto è valido FLUX.2?

Risultati nei benchmark

Black Forest Labs ha pubblicato valutazioni comparative e grafici che mostrano FLUX.2 superare diversi contemporanei a pesi aperti in test diretti di preferenza umana/tasso di vittoria e in analisi ELO vs costo. Evidenze riportate dal riepilogo vendor/stampa includono:

  • Tasso di vittoria testo→immagine: FLUX.2 ha riportato ≈66,6% di win rate (vs ~51,3% Qwen-Image, 48,1% Hunyuan Image 3.0).
  • Editing a singolo riferimento: ≈59,8% di win rate (vs ~49,3% Qwen-Image, 41,2% FLUX.1 Kontext).
  • Editing multiriferimento: ≈63,6% di win rate (vs ~36,4% per Qwen-Image).
  • ELO vs costo: la famiglia FLUX.2 (Pro, Flex, Dev) si colloca in una banda di alta qualità e costo relativamente basso (ELO ≈1030–1050 operando a ~2–6 centesimi per immagine nel grafico prezzi del vendor).

Generazione multiriferimento

Una delle funzionalità più importanti di FLUX.2 è la capacità di generare più output coerenti utilizzando più immagini di riferimento.

Per esempio, durante la fotografia di un prodotto, puoi caricare più foto scattate da angolazioni diverse, sotto diverse condizioni di illuminazione e su sfondi differenti, e generare più varianti della stessa immagine in una volta sola.

Questa funzione permette di generare rapidamente in batch foto per cataloghi e-commerce, banner pubblicitari, set di immagini per social media e altro ancora.

A differenza della generazione da singola immagine, questo meccanismo multiriferimento è ideale per flussi di lavoro reali che privilegiano coerenza e integrità.

Alta risoluzione, qualità professionale (fino a 4MP)

FLUX.2 supporta output fino a 4 megapixel (circa 2000–3000 pixel), garantendo una qualità adatta ad applicazioni pratiche come pubblicità, stampa, segnaletica e poster.

Gestisce perfettamente testo, loghi, mockup di UI, infografiche e altro, risultando adatto non solo alla creazione artistica ma anche al design e all’uso commerciale.

Nel frattempo, è stata migliorata anche la qualità di resa di font e testo, rendendolo adatto alla creazione di banner pubblicitari ed etichette di prodotto.

Supporta l’esecuzione su GPU locali: costi bassi, bassa barriera d’ingresso

Finora, molti modelli di generazione di immagini ad alte prestazioni sono praticabili solo in data center con risorse di calcolo enormi. Tuttavia, FLUX.2 è ottimizzato per l’esecuzione su GPU standard (come NVIDIA RTX) con minore consumo di VRAM.

I modelli non devono più essere accessibili tramite cloud; possono essere editati e generati in locale, riducendo significativamente i costi e aumentando la flessibilità operativa.

Questo è un vantaggio importante non solo per le aziende, ma anche per creatori individuali e piccoli team.

Flusso unificato di creazione ed editing

FLUX.2 supporta non solo testo→immagine (generazione da testo) ma anche immagine→immagine (editing e styling di immagini esistenti).

Questo ti consente di usare in modo coerente un unico modello per attività come “creare una nuova immagine da zero”, “modificare e ritoccare foto esistenti” e “riutilizzare più immagini per creare varianti uniformi”.

Per esempio, è facile cambiare lo sfondo di una foto di prodotto con un’atmosfera diversa o ridimensionarla per i social media.

Come accedere all'API Flux.2

Siamo lieti di annunciare che CometAPI ha integrato la Flux.2 API. Ora supporta il modello in formato Replicate (a un prezzo inferiore rispetto a quello ufficiale di Replicate), endpoint FLUX.2:

  • black-forest-labs/flux-2-pro
  • black-forest-labs/flux-2-dev
  • black-forest-labs/flux-2-flex

Inizia a creare ora Crea predizioni – Documentazione API,

Vuoi provare prima? Prova FLUX.2 nel nostro playground dopo la registrazione e l’accesso a CometAPI; se vuoi iniziare a creare con l’API subito: Crea predizioni – Documentazione API.

FLUX.2 non è semplicemente un’altra release di modello; è una strategia di prodotto a livello di famiglia che affronta le realtà della produzione: fedeltà, modificabilità, coerenza multiriferimento e percorsi di distribuzione pratici (API gestite e checkpoint aperti). Per le organizzazioni che producono contenuti visivi su larga scala, FLUX.2 promette guadagni di produttività significativi — a patto che i team affianchino l’adozione tecnica con una solida governance delle licenze e controllo qualità.

Principali utilizzi e casi d’uso previsti di FLUX.2

Visual per prodotti/creazione cataloghi e-commerce

Le aziende e-commerce e i brand hanno un’elevata domanda di scatti di prodotto da molteplici angolazioni, con illuminazioni, sfondi e modalità colore diversi.

  • Con FLUX.2 puoi generare rapidamente più effetti visivi coerenti senza dover effettuare alcuno scatto reale.
  • Questo consente di ampliare rapidamente il catalogo prodotti riducendo costi fotografici, tempi e costi di gestione.

Creazione di materiali pubblicitari e di marketing

La domanda di materiali di design è ampia, includendo banner pubblicitari, immagini per post social, visual per campagne promozionali e poster per PR.

  • È sufficiente fornire una descrizione testuale per ottenere immagini con lo stile, la composizione e l’atmosfera desiderati, riducendo notevolmente l’onere per designer e advertiser.
  • Inoltre, poiché è possibile generare variazioni utilizzando più immagini di riferimento, è adatto per A/B test di idee creative e per creare materiali compatibili con più lingue e regioni.

Design UI/UX e prototipazione

FLUX.2 supporta anche l’editing di loghi, font, layout e sfondi, risultando adatto non solo alla generazione fotografica ma anche al design visivo di prodotti digitali.

  • Puoi creare rapidamente design preliminari, wireframe, siti evento, mockup di schermate applicative e altro.
  • È una soluzione produttiva ed economica, particolarmente adatta a startup e piccoli team di design.

Arte/lavori creativi e uso personale

Ovviamente, può essere usato anche puramente per “opere d’arte”, “illustrazioni” o “graphic design”.

  • Amplia i tuoi orizzonti creativi realizzando opere in diversi mood e stili tramite prompt testuali e immagini di riferimento.
  • Puoi anche usare le funzioni di editing per riutilizzare liberamente foto esistenti in stili artistici o sperimentare paesaggi fantastici o design di personaggi.

Differenziazione rispetto ai modelli esistenti e ai concorrenti—Perché scegliere FLUX.2?

Confronto con altri modelli di generazione di immagini IA

Attualmente, nel campo della generazione di immagini IA esistono molti modelli (open-source e commerciali), dai modelli di diffusione tradizionali ai concorrenti più recenti. Dunque, perché FLUX.2 è così interessante? Ecco i motivi:

  • Generazione e editing integrati: molti modelli si concentrano o su “generazione (testo→immagine)” o su “editing (immagine→immagine)”. FLUX.2 supporta entrambe le funzioni contemporaneamente, ottenendo un flusso altamente coerente.
  • Input con più riferimenti: utilizza più immagini di riferimento per facilitare la fotografia di prodotto e mantenere coerenza visiva.
  • Qualità commerciale e alta risoluzione: supporta 4MP per pubblicità, fotografia di prodotto e stampa.
  • Esecuzione locale semplice: è indipendente dal cloud e può essere eseguito su GPU standard, con vantaggi sia in termini di costi sia di flessibilità.
  • Selezione flessibile del modello: offre una varietà di modelli che coprono da standard a commerciale e ricerca, permettendoti di scegliere quello più adatto alle tue esigenze e al tuo budget.

Questo rende FLUX.2 una scelta potente per flussi professionali, uso commerciale, produzione ad alto volume e progetti in cui costi e velocità sono critici.

Considerazioni finali:

FLUX.2 si colloca a un incrocio pragmatico: offre opzioni di ricerca a pesi aperti per i team che necessitano di controllo e riproducibilità, e API gestite di produzione per i team che danno priorità a bassa latenza, output prevedibili e provenienza. Fornendo sia varianti aperte sia gestite (dev/pro/flex), BFL riconosce che workflow diversi — sperimentazione, design iterativo e produzione — richiedono compromessi differenti tra fedeltà, velocità, personalizzazione e governance.

Gli sviluppatori possono accedere alla Flux.2 Dev API, Flux.2 Flex API e Flux.2 Pro API tramite CometAPI. Per iniziare, esplora le funzionalità del modello di CometAPI nel Playground. Prima di accedere, assicurati di aver effettuato l’accesso a CometAPI e di aver ottenuto la chiave API. CometAPI offre un prezzo ben inferiore a quello ufficiale per aiutarti nell’integrazione.

Pronto a iniziare?→ Registrati a CometAPI oggi stesso!

Se vuoi conoscere altri suggerimenti, guide e novità sull’IA, seguici su VK, X e Discord!

Pronto a ridurre i costi di sviluppo AI del 20%?

Inizia gratuitamente in pochi minuti. Crediti di prova gratuiti inclusi. Nessuna carta di credito richiesta.

Leggi di più