FLUX.2 è la seconda generazione di modelli per generazione e modifica di immagini di Black Forest Labs (rilasciata il 25 novembre 2025). Offre fotorealismo di livello produttivo, editing multi‑reference fino a 4 MP, prompting strutturato/JSON e una scelta tra endpoint gestiti (Pro, Flex) e opzioni a pesi aperti (Dev).
La buona notizia è che CometAPI ha integrato la FLUX.2 API. Questa guida spiega che cos’è FLUX.2, come chiamare l’API e i flussi di lavoro avanzati (testo→immagine, controllo flessibile, editing multi‑reference), con esempi di codice e best practice.
Che cos’è FLUX.2 e perché è importante?
FLUX.2 è l’evoluzione della famiglia FLUX di modelli di immagini — progettata per generazione testo‑immagine ad alta fedeltà e editing di immagini multi‑reference a risoluzioni di produzione (fino a ~4 megapixel). FLUX.2 è pensato per flussi creativi reali (asset brand‑safe, personaggi e stili coerenti tra riferimenti, tipografia e dettagli minuti migliori) più che per demo, con l’obiettivo di ridurre il divario tra immagini generate e immagini reali.
Risultati chiave che FLUX.2 è progettato per offrire
- Output fotorealistici adatti a pubblicità, immagini di prodotto e mockup UI.
- Editing multi‑reference nativo: combinare, scambiare o comporre elementi da più immagini di input in un’unica modifica.
- Varianti per casi d’uso diversi: modelli per sviluppatori disponibili apertamente, un endpoint Pro ottimizzato per la produzione e un endpoint Flex per il controllo a basso livello.
A livello generale, FLUX.2 combina uno stack generativo latente (architettura flow/transformer) con un modello visione–linguaggio per l’ancoraggio semantico, e un VAE di nuova formazione per fornire uno spazio latente condiviso tra le varianti. Questo design consente al modello di gestire sia generazione sia ricostruzione (editing) ad alta fedeltà, mantenendo al contempo una rappresentazione apprendibile per training e fine‑tuning. L’open VAE è particolarmente rilevante perché standardizza lo spazio latente per i flussi ospitati e self‑hosted.
Perché conta: l’accoppiamento tra linguaggio e latent flow matching produce un seguito al prompt più robusto (così istruzioni complesse e composte si comportano in modo prevedibile), una tipografia migliore e un’unica architettura che supporta sia generazione sia editing con riferimenti multipli. Per i creatori, significa risultati più affidabili per istruzioni complesse e input misti (testo + immagini).
Come accedo all’API di FLUX.2?
Preparare l’ambiente
Registrati ed effettua il login su CometAPI e ottieni la tua chiave API dal pannello del profilo. Idealmente, dovresti avere alcune conoscenze di API come sviluppatore (forniremo assistenza in merito, quindi non preoccuparti).
Dovrai anche scegliere il metodo di richiesta desiderato e il modello FLUX.2 appropriato.
Quali endpoint e quale autenticazione sono richiesti?
La Replicate Predictions API fornisce accesso per generare immagini di alta qualità usando vari modelli FLUX di Black Forest Labs tramite il formato standard Replicate. Questa API supporta un’ampia gamma di varianti FLUX, ciascuna ottimizzata per casi d’uso che vanno dal rapido prototyping alla generazione di immagini di livello professionale. Gli utenti possono passare senza soluzione di continuità tra modelli diversi semplicemente cambiando il nome del modello nel percorso URL (https://api.cometapi.com/replicate/v1/models/{models}/predictions), rendendolo flessibile per applicazioni creative e commerciali.
CometAPI espone endpoint gestiti sotto https://api.cometapi.com/flux/v1/{model} e nomina endpoint come flux-2-pro, flux-2-flex e flux-2-flex per la creazione e l’editing di immagini. Le richieste richiedono una chiave API nell’header x-key.
Famiglia di modelli e compromessi di calcolo
- FLUX.2 (open weights) — Usalo quando ti serve controllo locale, esperimenti di ricerca o per eseguire inferenza sulla tua infrastruttura. Dev è open‑weight (32B) ed eccellente per ricerca esplorativa e fine‑tuning. È più configurabile, ma l’infrastruttura e l’ottimizzazione sono a tuo carico.
- FLUX.2 pro — Miglior equilibrio tra velocità, qualità e costo per la produzione. Pro è ottimizzato per latenza prevedibile, aderenza coerente al prompt, throughput rapido e supporta fino a 8 immagini di riferimento API (totale 9 MP via API). Usalo per editing ad alto volume e quando servono affidabilità e prezzi prevedibili.
- FLUX.2 (gestito + controllabilità) — Espone controlli di generazione a basso livello (ad es.
steps,guidance) e supporta più riferimenti (fino a 10) e una qualità/dettaglio leggermente superiori accettando maggiore latenza e costo. Usa Flex quando hai bisogno del controllo creativo finale — fedeltà tipografica, colori esatti o regolazioni compositive altamente dettagliate.
Prototipa su Dev o su un piano Pro a basso costo, poi migra a Pro per la scala o a Flex per render finali altamente controllati.
Come uso l’API di FLUX.2?
Ciclo di vita della richiesta (modello task + polling)
Le risposte alle richieste di editing/generazione sono oggetti di tipo task che includono polling_url e id; crei una richiesta e poi effettui il polling (o usi webhook) per recuperare l’URL firmato del risultato. Gli URL firmati hanno vita breve (tipicamente ~10 minuti), quindi recupera gli output prontamente.
L’API hosted segue un modello di task asincrono:
- Fai POST di una richiesta di generazione → ritorna un
task idepolling_urlpiù ilcoststimato. - Esegui il polling su
polling_urlfinchéstatus == "Ready", quindi recupera il risultato dell’immagine (spesso base64 o un URL ospitato).
Esempio: Python (requests) — invio e polling
import time, requests, os
API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"
payload = {
"prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
"width": 1024, "height": 1024, "seed": 42
}
r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task
while True:
time.sleep(0.5)
status_r = requests.get(polling_url, headers={"x-key": API_KEY})
status_r.raise_for_status()
status = status_r.json()
if status == "Ready":
print("Result URL:", status)
break
elif status in ("Error", "Failed"):
print("Generation failed:", status)
break
Questo schema (invio → polling o webhook) è il flusso sincrono/asincrono principale per gli endpoint gestiti.
Image Editing — esempio minimale (curl con URL di input)
curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
-H "accept: application/json" \
-H "x-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
"input_image": "",
"width": 2048,
"height": 1536
}'
Per l’editing multi‑reference, usa input_image, input_image_2, input_image_3, … (Pro supporta fino a 8 riferimenti via API; Flex fino a 10; Dev raccomandato massimo ~6 a seconda della memoria).
Quali parametri di base devo inviare?
Campi importanti del body di richiesta (editing/generazione immagini) includono:
guidanceesteps— consentono un controllo granulare.prompt(string) — fino a 32K token; linguaggio naturale dettagliato o JSON strutturato.input_image(string) — richiesto per gli edit (URL o base64).input_image_2…input_image_9— immagini multi‑reference.width/height— multipli di 16; output massimo 4 MP.seed— intero per riproducibilità.safety_tolerance— livello di moderazione.
Come posso sfruttare FLUX.2 Pro per la generazione testo‑immagine professionale?
FLUX.2 Pro è ottimizzato per output affidabili e di alta qualità. Usalo quando servono risultati a livello brand, tempi rapidi e SLA enterprise.
Ricetta di workflow — immagini di produzione
- Pre‑processa i prompt: mantieni una breve riga di “intent” più una sezione di attributi strutturata (illuminazione, lente, mood, codici colore hex per i colori del brand). FLUX.2 supporta la guida tramite colori hex per preservare le palette del brand.
- Parti da valori prudenti: steps 30–50 e guidance scale 6–9.0; aumenta gli steps per i dettagli, aumenta la guidance per far aderire più strettamente al prompt.
- Usa seed + campionamento deterministico per la riproducibilità nei test A/B.
- Usa l’endpoint Pro per campionare più tentativi: richiedi N varianti in parallelo e scegli le migliori — più economico e veloce del tuning manuale degli iperparametri.
- Post‑processa: denoise, piccolo tone mapping o ritocchi in stile vettoriale in una pipeline deterministica. Valuta un piccolo pass di GAN o super‑risoluzione se serve oltre l’output nativo.
Perché questi passaggi aiutano: Pro bilancia velocità e fedeltà e di solito applica filtri di sicurezza/contenuto post‑generazione, quindi è l’impostazione predefinita sensata per asset rivolti ai clienti.
I migliori consigli per generare immagini
- Il prompting strutturato vince in produzione. Organizza i prompt per priorità: soggetto → azione → stile → contesto. Usa prompting JSON (scene, subjects, camera, lighting, color_palette) quando serve una composizione deterministica su molte immagini. Esempio di uso schema JSON (pseudo):
{
"scene": "product shot",
"subjects": [
{"type":"mug","pose":"center","style":"ceramic, matte"},
{"type":"background","style":"wooden desk, window light"}
],
"camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}
-
Riproducibilità: passa
seedper riprodurre in seguito. Tieni un catalogo che mappi prompt + seed → immagine per la tracciabilità. -
Batch & orchestrazione: per grandi volumi, invia molte richieste in parallelo a Pro, ma applica rate‑limit per evitare throttling; preferisci l’endpoint Pro per latenza prevedibile. Usa job queue e pool di worker per scaricare rapidamente i risultati firmati appena pronti.
-
Moderazione & sicurezza: usa
safety_toleranceper controllare la severità della moderazione. Gli endpoint Pro includono policy d’uso e hook di moderazione dei contenuti; integra controlli lato server prima della pubblicazione. -
Post‑processing: gli output Pro sono di alta qualità ma talvolta richiedono piccoli ritocchi. Costruisci uno step di post‑process (crop, color grading, compositing) automatizzato nella pipeline e mantieni una revisione umana per asset sensibili al brand.
Come posso personalizzare gli output con l’endpoint FLUX.2 Flex?
Flex è la variante “chirurgica”: regola steps, guidance, negative prompt, dimensioni delle tile e numero di riferimenti per plasmare l’output con precisione.
Quando scegliere Flex
- Ti serve una resa tipografica precisa (mockup UI, etichette).
- Devi comporre più riferimenti con controllo su posa e illuminazione.
- Stai sperimentando tecniche di prompt avanzate (prompt strutturati, catene di vincoli).
Esempio — chiavi di controllo di Flex ed effetti
steps— più steps = dettaglio più fine (a costo di maggiore latenza).guidance_scale— più alto = più vicino al prompt testuale, più basso = più creatività.negative_prompt— rimuovi esplicitamente elementi (es., “no watermark, no extra fingers”).tile_size/tiled_inference— per generazioni ad altissima risoluzione, suddividi l’inferenza in tile per scambiare memoria con velocità.reference_weights— alcuni endpoint consentono di pesare i riferimenti per dare priorità a chi guida posa vs. stile.
Suggerimento pratico: per composizioni complesse, esegui un’anteprima breve a bassa guidance per verificare la composizione, poi esegui l’upscale con più steps e guidance più alta. Questa tecnica in due pass riduce i costi offrendo output finali precisi.
Esempio: richiesta Flex con steps & guidance
curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
-H "Content-Type: application/json" \
-H "x-key: $BFL_API_KEY" \
-d '{
"prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
"width": 1536, "height": 2048,
"steps": 50,
"guidance": 7.5,
"seed": 99999
}'
Suggerimento: usa Flex durante gli approvazioni creative finali e Pro per pipeline su larga scala e veloci. Flex è sensibilmente più controllabile per tipografia e micro‑dettagli.
Best practice per l’uso in produzione
Di seguito pattern collaudati e consigli pragmatici per integrare FLUX.2 su scala.
1) Controlla i costi monitorando megapixel & caching
La fatturazione di FLUX.2 si basa sui megapixel di input + output. Per generazione ad alto volume, preferisci render di anteprima più piccoli (bassa risoluzione, pochi steps) e passa a render finali ad alto MP solo quando necessario. Metti in cache gli asset renderizzati (o archivia i diff) così da non rigenerare job identici. Espone sempre cost nelle risposte e registralo per richiesta.
2) Usa i tier in modo intelligente: anteprima vs render finale
- Esegui render Pro rapidi e con pochi step per prototipazione o molte varianti.
- Usa Flex o run Pro ad alto MP per output finali approvati in cui la fedeltà conta. Questo approccio ibrido bilancia throughput e qualità finale dell’immagine.
3) Prompt engineering → prompt strutturati & JSON
Sfrutta il prompting JSON strutturato di FLUX.2 quando serve una composizione deterministica (oggetti di scena, camera, pose, campioni colore hex). Questo riduce i cicli iterativi di prompting e porta a batch più riproducibili. Esempi Cloudflare mostrano prompt JSON incorporati in form multipart.
4) Seed + versioning per la riproducibilità
Quando serve riproducibilità, passa un seed e registra versione del modello/timestamp nei metadati. Per pipeline di asset deterministici, mantieni un manifesto: prompt, seed, variante di modello, risoluzione, hash delle immagini di riferimento. Questo migliora tracciabilità e opzioni di rollback.
Conclusioni
FLUX.2 punta decisamente a colmare il divario tra “demo impressionante” e “strumento creativo di produzione”. Con editing multi‑reference, output ad alta risoluzione e un set di endpoint hosted (oltre a codice di inferenza open e build quantizzate consumer), offre ai team molte opzioni pratiche: esecuzione locale per ricerca e personalizzazione, oppure uso degli endpoint Pro/Flex hosted per pipeline di produzione stabili.
Gli sviluppatori possono accedere a Flux.2 Dev API, Flux.2 Flex API e Flux.2 Pro API tramite CometAPI. Per iniziare, esplora le funzionalità dei modelli di CometAPI nel Playground e consulta la guida API per istruzioni dettagliate. Prima di accedere, assicurati di aver effettuato l’accesso a CometAPI e di aver ottenuto la chiave API. CometAPI offre un prezzo molto inferiore a quello ufficiale per aiutarti nell’integrazione.
Pronti a iniziare?→ Registrati a CometAPI oggi stesso!
Se vuoi conoscere altri consigli, guide e novità sull’AI, seguici su VK, X e Discord!
