Come usare l'API Flux.2? Tutto quello che devi sapere

FLUX.2 è la seconda generazione di modelli di generazione ed editing di immagini di Black Forest Labs (rilasciata il 25 novembre 2025). Offre fotorealismo di livello produttivo, editing multi-riferimento fino a 4 MP, prompt strutturato/JSON e una scelta di endpoint gestiti (Pro, Flex) e opzioni open-weight (Dev).

La buona notizia è che CometAPI ha integrato l'API Flux.2. Questa guida spiega cos'è FLUX.2, come richiamare l'API e flussi di lavoro avanzati (testo→immagine, controllo flessibile, modifica multi-riferimento), con esempi di codice e best practice.

Che cos'è FLUX.2 e perché è importante?

FLUX.2 è il successore della famiglia di modelli di immagini FLUX, progettata per la generazione di testo in immagini ad alta fedeltà e l'editing di immagini multi-riferimento a risoluzioni di produzione (fino a circa 4 megapixel). FLUX.2 è progettato per flussi di lavoro creativi reali (risorse brand-safe, caratteri e stili coerenti tra i riferimenti, tipografia migliore e piccoli dettagli) piuttosto che per demo, e mira a colmare il divario tra immagini generate e reali.

Risultati chiave che FLUX.2 è progettato per fornire

Risultati fotorealistici adatti per pubblicità, immagini di prodotti e mockup di interfacce utente.
Modifica multi-riferimento nativa: combina, scambia o componi elementi da più immagini di input in un'unica modifica.
Varianti per diversi casi d'uso: modelli per sviluppatori disponibili apertamente, un endpoint Pro ottimizzato per la produzione e un endpoint Flex per il controllo di basso livello.

Ad alto livello, FLUX.2 combina un backbone generativo latente (architettura flusso/trasformatore) con un modello di visione-linguaggio per il fondamento semantico e un VAE appena addestrato per fornire uno spazio latente condiviso tra le varianti. Questa progettazione consente al modello di eseguire sia la generazione che la ricostruzione (editing) con maggiore fedeltà, mantenendo al contempo la rappresentazione apprendibile per l'addestramento e la messa a punto. Il VAE aperto è particolarmente degno di nota perché standardizza lo spazio latente per flussi di lavoro ospitati e auto-ospitati.

Perché è importante: l'abbinamento di linguaggio e corrispondenza del flusso latente produce un prompt following più efficace (quindi le istruzioni compositive multiparte si comportano in modo prevedibile), una tipografia migliore e un'unica architettura che supporta sia la generazione che la modifica con più riferimenti. Per i creatori, ciò significa output più affidabili per istruzioni complesse e input misti (testo + immagini).

Come posso accedere all'API FLUX.2?

Preparare l'ambiente

Registrati e accedi a CometAPI, quindi ottieni la tua chiave API dal pannello del tuo profilo. Idealmente, dovresti avere una certa conoscenza delle API come sviluppatore (ti forniremo assistenza in questo senso, quindi non preoccuparti).

Sarà inoltre necessario selezionare il metodo di richiesta desiderato e il modello Flux.2 appropriato.

Quali endpoint e autenticazioni sono richiesti?

L'API Replicate Predictions consente di generare immagini di alta qualità utilizzando vari modelli FLUX di Black Forest Labs tramite il formato standard Replicate. Questa API supporta una gamma completa di varianti di modelli FLUX, ciascuna ottimizzata per diversi casi d'uso, dalla prototipazione rapida alla generazione di immagini di livello professionale. Gli utenti possono passare facilmente da un modello all'altro semplicemente modificando il nome del modello nel percorso URL (https://api.cometapi.com/replicate/v1/models/{models}/predictions), rendendola flessibile per diverse applicazioni creative e commerciali.

CometaAPI espone endpoint gestiti su https://api.cometapi.com/flux/v1/{model} e assegna nomi a endpoint come flux-2-pro, flux-2-flex e flux-2-flex per la creazione e la modifica delle immagini. Le richieste richiedono una chiave API in x-key intestazione .

Compromessi tra famiglie di modelli e calcolo

FLUX.2 (pesi aperti) — Da utilizzare quando è necessario un controllo locale, esperimenti di ricerca o per eseguire inferenze sulla propria infrastruttura. Dev è open-weight (32B) ed è eccellente per la ricerca esplorativa e la messa a punto. È più configurabile, ma l'infrastruttura e l'ottimizzazione sono a carico dell'utente.
FLUX.2 pro — Il miglior equilibrio tra velocità, qualità e costi per la produzione. La versione Pro è ottimizzata per latenza prevedibile, aderenza costante alle richieste, produttività elevata e supporta fino a 8 immagini di riferimento API (9 MP totali tramite API). Utilizzatela per l'editing di grandi volumi e quando avete bisogno di affidabilità e prezzi prevedibili.
FLUX.2 (gestito + controllabilità) — Espone controlli di generazione di basso livello (ad esempio, steps, guidance) e supporta più riferimenti (fino a 10) e una qualità/dettaglio leggermente superiori, a patto di accettare latenza e costi più elevati. Utilizza Flex quando hai bisogno del controllo creativo finale: fedeltà tipografica, colori esatti o regolazioni di composizione estremamente dettagliate.

Prototipo acceso Dev o a basso costo Pro pianificare, quindi migrare verso Pro per scala o flettere per rendering finali altamente controllati.

Come si usa l'API FLUX.2?

Ciclo di vita della richiesta (modello di attività + polling)

Le risposte alle richieste di modifica/generazione sono oggetti di attività che includono a polling_url e al id; si crea una richiesta e poi si esegue un polling (o si utilizzano webhook) per recuperare l'URL del risultato firmato. Gli URL firmati hanno una durata breve (in genere circa 10 minuti), quindi è necessario recuperare gli output tempestivamente.

L'API ospitata segue un modello di attività asincrono:

POST una richiesta di generazione → restituisce un task id e al polling_url più stimato cost.
Sondaggio polling_url fino a quando status == "Ready", quindi recupera il risultato dell'immagine (spesso base64 o un URL ospitato).

Esempio: Python (richieste) — invia e sondaggi

import time, requests, os

API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"

payload = {
    "prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
    "width": 1024, "height": 1024, "seed": 42
}

r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task

while True:
    time.sleep(0.5)
    status_r = requests.get(polling_url, headers={"x-key": API_KEY})
    status_r.raise_for_status()
    status = status_r.json()
    if status == "Ready":
        print("Result URL:", status)
        break
    elif status in ("Error", "Failed"):
        print("Generation failed:", status)
        break

Questo schema (invia → sondaggio o webhook) è il flusso sincrono/asincrono primario per gli endpoint gestiti.

Modifica delle immagini: esempio minimo (curl con URL di input)

curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
  -H "accept: application/json" \
  -H "x-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
    "input_image": "https://example.com/my-photo.jpg",
    "width": 2048,
    "height": 1536
  }'

Per la modifica multi-riferimento, utilizzare input_image, input_image_2, input_image_3, … (Pro supporta fino a 8 riferimenti tramite API; Flex fino a 10; Dev consiglia un massimo di ~6 a seconda della memoria).

Quali parametri di base dovrei inviare?

I campi importanti del corpo della richiesta (modifica/generazione delle immagini) includono:

guidance e al steps — consentono un controllo dettagliato.
prompt (stringa) — fino a 32K token; linguaggio naturale dettagliato o JSON strutturato.
input_image (stringa) — obbligatorio per le modifiche (URL o base64).
input_image_2 ... input_image_9 — immagini multi-riferimento.
width / height — multipli di 16; output max 4MP.
seed — intero per la riproducibilità.
safety_tolerance — livello di moderazione.

Come posso sfruttare FLUX.2 Pro per la generazione professionale di testo in immagini?

FLUX.2 Pro è ottimizzato per risultati affidabili e di alta qualità. Utilizzalo quando hai bisogno di risultati coerenti a livello di brand, tempi di consegna rapidi e SLA aziendali.

Ricetta del flusso di lavoro: immagini di produzione

Richieste di pre-elaborazione: Mantieni una breve riga di "intento" più una sezione di attributi strutturata (illuminazione, lenti, atmosfera, codici esadecimali dei colori del marchio). FLUX.2 supporta la gestione dei colori esadecimali per aiutare a preservare le palette del marchio.
Iniziamo con impostazioni predefinite conservative: passaggi 30–50 e scala di guida 6–9.0; aumentare i passaggi per i dettagli, aumentare la guida per far sì che i risultati aderiscano più strettamente al prompt.
Utilizzare semi + campionamento deterministico per la riproducibilità nei test A/B.
Utilizzare l'endpoint Pro per il campionamento multi-tentativo: Richiedi N variazioni in parallelo e scegli la migliore: più economico e veloce rispetto alla regolazione manuale degli iperparametri.
Post-elaborazione: Denoise, tone mapping minori o ritocchi vettoriali in una pipeline deterministica. Considerate un piccolo GAN o un passaggio a super-risoluzione se avete bisogno di un output superiore a quello nativo.

Perché questi passaggi sono utili: Pro bilancia velocità e fedeltà e solitamente applica filtri di sicurezza/contenuti post-generazione, quindi è la scelta predefinita sensata per le risorse rivolte ai clienti.

I migliori consigli per generare immagini

1. I prompt strutturati sono vincenti per la produzione. Organizza i prompt per priorità: soggetto → azione → stile → contesto. Utilizza i prompt JSON (scena, soggetti, telecamera, illuminazione, tavolozza colori) quando hai bisogno di una composizione deterministica su più immagini. Esempio di utilizzo dello schema JSON (pseudo):

{
  "scene": "product shot",
  "subjects": [
    {"type":"mug","pose":"center","style":"ceramic, matte"},
    {"type":"background","style":"wooden desk, window light"}
  ],
  "camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}

2. Riproducibilità: Passare seed per riprodurli in seguito. Mantieni un prompt di mappatura del catalogo + seed → immagine per la tracciabilità.

3. Batch e orchestrazione: Per grandi volumi di produzione, invia molte richieste in parallelo a Pro, ma applica un limite di velocità per evitare limitazioni; preferisci l'endpoint Pro per una latenza prevedibile. Utilizza code di lavoro e pool di worker per scaricare rapidamente i risultati firmati una volta pronti.

4. Moderazione e sicurezza: Usa il safety_tolerance Per controllare il rigore della moderazione. Gli endpoint Pro includono policy di utilizzo e hook di moderazione dei contenuti; integrano controlli lato server prima della pubblicazione.

5. Post-elaborazione: Gli output professionali sono di alta qualità, ma occasionalmente necessitano di piccoli ritocchi. Integra una fase di post-elaborazione automatizzata (ritaglio, correzione colore, composizione) nella tua pipeline e affida la revisione umana alle risorse sensibili al brand.

Come posso personalizzare gli output con l'endpoint FLUX.2 Flex?

Flex è la variante dello “strumento chirurgico”: regola i passaggi, la guida, i prompt negativi, le dimensioni delle tessere e i conteggi dei riferimenti per modellare con precisione l’output.

Quando scegliere Flex

Hai bisogno di un rendering tipografico preciso (bozzetti dell'interfaccia utente, etichette).
È necessario comporre più riferimenti con il controllo sulla posa e sull'illuminazione.
Stai sperimentando tecniche di prompt avanzate (prompt strutturati, catene di vincoli).

Esempio: tasti di controllo flessibili e relativi effetti

steps — più passaggi = maggiori dettagli (a scapito della latenza).
guidance_scale — più alto = più vicino al testo suggerito, più basso = più creatività.
negative_prompt — rimuovere esplicitamente gli elementi (ad esempio, "nessuna filigrana, nessun dito in più").
tile_size / tiled_inference — per una generazione ad altissima risoluzione, suddividere lo spazio di inferenza in modo da scambiare la memoria con la velocità.
reference_weights — alcuni endpoint consentono di ponderare i riferimenti per determinare quale immagine determina la posa rispetto allo stile.

Consiglio pratico: Per composizioni complesse, esegui un'anteprima breve e con guida bassa per verificare la composizione, quindi esegui un upgrade con più passaggi e una guida più alta. Questa tecnica a due passaggi riduce i costi e fornisce risultati finali precisi.

Esempio: richiesta flessibile con passaggi e guida

curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
  -H "Content-Type: application/json" \
  -H "x-key: $BFL_API_KEY" \
  -d '{
    "prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
    "width": 1536, "height": 2048,
    "steps": 50,
    "guidance": 7.5,
    "seed": 99999
  }'

Suggerimento: Utilizza Flex per le approvazioni creative finali e Pro per pipeline più rapide e su larga scala. Flex è notevolmente più controllabile per le attività di tipografia e di micro-dettagli.

Buone pratiche per l'utilizzo in produzione

Di seguito sono riportati modelli collaudati e consigli pratici per integrare FLUX.2 su larga scala.

1) Controlla i costi monitorando i megapixel e memorizzandoli nella cache

La fatturazione FLUX.2 si basa sui megapixel di ingresso + uscitaPer la generazione di volumi elevati, preferire rendering di anteprima più piccoli (passaggi rapidi a bassa risoluzione) ed eseguire l'escalation solo verso rendering finali con MP più elevati. Memorizzare nella cache le risorse renderizzate (o memorizzare le differenze) in modo da non dover rieseguire il rendering di processi identici. Esegui sempre l'escalation cost nelle risposte e registrarle per ogni richiesta.

2) Utilizzare i livelli in modo intelligente: anteprima vs suddivisione del rendering finale

Esegui rendering Pro rapidi e a basso passo per la prototipazione o numerose varianti.
Utilizzate le esecuzioni Flex o High-MP Pro per risultati finali approvati, dove la fedeltà è fondamentale. Questo approccio ibrido bilancia produttività e qualità dell'immagine finale.

3) Ingegneria dei prompt → prompt strutturati e JSON

Approfitta dei vantaggi di FLUX.2 prompt JSON strutturato quando è necessaria una composizione deterministica (oggetti di scena, telecamera, pose, campioni di colore esadecimali). Questo riduce i cicli di prompt iterativi e porta a batch più riproducibili. Gli esempi di Cloudflare mostrano prompt JSON incorporati in moduli multiparte.

4) Seed + versioning per la riproducibilità

Quando hai bisogno di risultati riproducibili, passa un seed e registra la versione/timestamp del modello nei metadati. Per le pipeline di asset deterministiche, mantieni un manifest: prompt, seed, variante del modello, risoluzione, hash dell'immagine di riferimento. Questo migliora la tracciabilità e le opzioni di rollback.

Conclusione

FLUX.2 mira espressamente a colmare il divario tra "demo impressionante" e "strumento creativo di produzione". Grazie all'editing multi-riferimento, agli output ad alta risoluzione e a un set di endpoint ospitati (oltre a codice di inferenza aperto e build consumer quantizzate), offre ai team numerose opzioni pratiche: esecuzione locale per la ricerca e la personalizzazione, oppure utilizzo degli endpoint Pro/Flex ospitati per pipeline di produzione stabili.

Gli sviluppatori possono accedere API di sviluppo Flux.2, API flessibile Flux.2 e al API Flux.2 Pro tramite CometAPI. Per iniziare, esplora le capacità del modello di CometAPI in Parco giochi e consultare il Guida API per istruzioni dettagliate. Prima di accedere, assicurati di aver effettuato l'accesso a CometAPI e di aver ottenuto la chiave API. Con e API t offrire un prezzo molto più basso rispetto al prezzo ufficiale per aiutarti a integrarti.

Pronti a partire? → Iscriviti oggi a CometAPI !

Se vuoi conoscere altri suggerimenti, guide e novità sull'IA seguici su VK, X e al Discordia!