How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 offre fino a 4× miglioramenti in velocità rispetto a GPT Image 1, riducendo sensibilmente la latenza per i flussi di lavoro creativi iterativi.

Does GPT Image 1.5 support multi-turn conversational editing?

Sì, tramite la Responses API, GPT Image 1.5 supporta flussi di lavoro di modifica a più turni in cui è possibile affinare iterativamente le immagini fornendo istruzioni successive, preservando il contesto.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 supporta 1024×1024 (quadrato), 1536×1024 (orizzontale) e 1024×1536 (verticale). Le opzioni di qualità includono bassa, media, alta e automatica.

Can GPT Image 1.5 use multiple reference images for compositing?

Sì, GPT Image 1.5 accetta più immagini di input per il compositing e come riferimento di stile. Le prime 5 immagini vengono preservate con una fedeltà superiore quando si utilizza la modalità input_fidelity high.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 privilegia la fedeltà in fase di editing e la velocità di iterazione, mentre Nano Banana Pro è apprezzato per il realismo da studio. Entrambi sono molto competitivi—scegli in base alle esigenze del tuo flusso di lavoro.

Does GPT Image 1.5 support transparent backgrounds?

Sì, imposta il parametro background su 'transparent' con i formati di output PNG o WebP. La trasparenza funziona al meglio con impostazioni di qualità media o alta.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 accetta prompt fino a 32,000 caratteri, consentendo istruzioni estremamente dettagliate e vincolate per attività complesse di generazione di immagini.

API GPT Image 1.5 Conveniente | text-to-image

Che cos'è l'API GPT-Image-1.5?

GPT-Image-1.5 è il membro più recente della famiglia GPT Image di OpenAI e il modello alla base della rinnovata esperienza Immagini di ChatGPT. È progettato per portare la generazione di immagini dagli esperimenti di novità a strumenti creativi di livello produttivo: maggiore fotorealismo, controllo più fine per modifiche iterative e inferenza più rapida per supportare flussi di lavoro interattivi e aziendali.

L’API gpt-image-1.5 è un endpoint di modello immagine multimodale che accetta uno o più input immagine (identificativi di file o byte) insieme a un prompt testuale e restituisce immagini generate o modificate. Supporta:

Generazione da testo a immagine (creazione da prompt),
Modifica di immagini / in-painting / compositing (applicare istruzioni a immagini esistenti, consentiti più input immagine), e
Flussi di lavoro iterativi a più turni di modifica tramite la Responses API (abilita interfacce “ritocca e itera”).

L’API tratta i prompt immagine in modo diverso rispetto ai vecchi limiti di DALL·E: i modelli di immagini GPT accettano prompt testuali significativamente più lunghi (la linea guida è 32,000 caratteri), rendendo possibili istruzioni complesse e con vincoli stringenti.

Caratteristiche principali (pratiche)

Modificabilità migliorata / coerenza multi-turno: preserva l’aspetto dei personaggi, l’illuminazione e le caratteristiche visive chiave attraverso modifiche iterative. Questo rende più affidabile “lo stesso modello, modifiche ripetute” per flussi come cataloghi di prodotti o asset di brand.
Throughput più rapido — miglioramenti di velocità 4× rispetto a GPT Image 1, mirati a ridurre la latenza nei flussi creativi iterativi.
Ottimizzazioni dei costi — costi di input/output immagine ridotti di circa 20% rispetto a GPT Image 1, abbassando il costo per iterazione per gli utenti ad alto volume.
Compositing multi-immagine e riferimento di stile — accetta più immagini di riferimento per comporre scene o trasferire stile/illuminazione.
Regolazioni qualità/fedeltà — parametri API che bilanciano velocità vs. fedeltà (usa qualità più bassa per generazione in massa; più alta per asset di produzione).
Modifica multi-turno / integrazione con Responses API — abilita flussi a passi (chiedi cambiamenti, poi “fai ritocchi” preservando lo stato).

Capacità tecniche

Limite del prompt testuale (modelli immagine): fino a 32,000 caratteri (nota: OpenAI documenta questo come la lunghezza testuale consentita per i modelli immagine GPT). Usalo per prompt lunghi con molti vincoli.
Input immagine: accetta ID di file (preferiti per flussi multi-turno) o byte grezzi; è possibile fornire più immagini per compositing e riferimento.
Output: PNG/JPEG o artefatti immagine predefiniti dalla piattaforma restituiti dall’API (o come allegati in ChatGPT). Gli output possono includere più immagini candidate e supportano richieste iterative per affinare un risultato.
Modalità di generazione: da testo a immagine, modifica di immagini (inpaint/estensione con istruzioni) e varianti. La modifica multi-turno supporta istruzioni in stile “aggiungi/sottrai/combina”.
Modifica consapevole delle istruzioni: i modelli sono ottimizzati per la fedeltà alle istruzioni (preservando invarianti specificate come “non cambiare il logo”, “mantieni posa e illuminazione”). Gli schemi di prompt engineering (invarianti esplicite ripetute a ogni iterazione) riducono la deriva semantica.

Prestazioni nei benchmark

Posizionamento in classifica: un rapporto aggregato cita GPT Image 1.5 in testa alle classifiche text-to-image con ~1264 punti su una leaderboard di Artificial Analysis, davanti al modello successivo con un margine misurabile.
Metriche per attività (modifica & preservazione): un riepilogo di Microsoft Foundry mostra che GPT-Image-1.5 ottiene un successo quasi perfetto di modifica binaria (100% su un BinaryEval a singolo turno) e forti punteggi di preservazione del volto (circa 90% sulle misure AuraFace) nella loro tabella di confronto rispetto ai concorrenti e ai precedenti modelli OpenAI. Tali metriche comparative collocano GPT-Image-1.5 davanti ad alcuni rivali in termini di preservazione e fedeltà di modifica.

GPT Image 1.5

Come GPT-Image-1.5 si confronta con i pari

Vs. GPT Image 1 (precedente generazione OpenAI): più veloce (fino a 4×), più economico (~20% di costo IO immagine in meno) e con maggiore fedeltà di modifica — mirato a passare da “prototipo/demo” a flussi di lavoro di immagini “production-friendly”.
Vs. Google’s Nano Banana Pro / modelli immagine Gemini: GPT-Image-1.5 e le famiglie Google Nano Banana Pro / Gemini 3 come rivali vicini — ciascuno ha punti di forza in diverse classi di prompt. La comunicazione di OpenAI enfatizza la fedeltà di modifica e la velocità di iterazione; l’offerta di Google è stata elogiata per il realismo da studio in alcuni esempi.
Vs. Qwen Image e altri modelli open/closed: GPT-Image-1.5 supera Qwen Image su diverse metriche di modifica e preservazione nelle valutazioni a singolo turno, ma le differenze si riducono in scenari multi-turno o test specifici di dominio.

Dove GPT-Image-1.5 è forte

Immagini di prodotto per e-commerce: varianti in massa, sostituzione degli sfondi, cataloghi prodotto coerenti da una singola foto (preservazione del brand/logo).
Produzione di asset creativi e marketing: rapida iterazione di concept, mockup fotorealistici, trasferimenti di stile controllati.
Ritocco fotografico & flussi editoriali: prove realistiche di abbigliamento/acconciature, ritocchi selettivi che preservano identità e illuminazione.
Integrazione con strumenti di design: integrazione in piattaforme di design o CMS per varianti immagine on-demand (le regolazioni di fedeltà aiutano il controllo dei costi).
Pipeline di compositing multi-step: input multi-immagine consentono compositing e generazione basata su riferimento per scene complesse.

Come accedere alla GPT Image 1.5 API

Passaggio 1: Registrati per la chiave API

Accedi a cometapi.com. Se non sei ancora un nostro utente, registrati prima. Accedi alla tua console CometAPI. Ottieni la chiave API di accesso dell’interfaccia. Fai clic su “Add Token” nella sezione token API del centro personale, ottieni la chiave del token: sk-xxxxx e invia.

Passaggio 2: Invia richieste alla GPT Image 1.5 API

Seleziona l’endpoint “gpt-image-1.5” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo e il corpo della richiesta sono forniti nella documentazione API del nostro sito. Il nostro sito offre anche il test Apifox per comodità. Sostituisci <YOUR_API_KEY> con la tua chiave CometAPI effettiva dal tuo account. l’URL di base è Immagini (https://api.cometapi.com/v1/images/generations) e [Modifica immagine]

Inserisci la tua domanda o richiesta nel campo content — è a questo che il modello risponderà. Elabora la risposta dell’API per ottenere il risultato generato.

Passaggio 3: Recupera e verifica i risultati

Elabora la risposta dell’API per ottenere il risultato generato. Dopo l’elaborazione, l’API risponde con lo stato dell’attività e i dati di output.

Vedi anche Gemini 3 Pro Preview API

Prezzo Comet (USD / M Tokens)	Prezzo Ufficiale (USD / M Tokens)	Sconto
Ingresso:$6.4/M Uscita:$25.6/M	Ingresso:$8/M Uscita:$32/M	-20%

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

Che cos'è l'API GPT-Image-1.5?

Generazione da testo a immagine (creazione da prompt),
Modifica di immagini / in-painting / compositing (applicare istruzioni a immagini esistenti, consentiti più input immagine), e
Flussi di lavoro iterativi a più turni di modifica tramite la Responses API (abilita interfacce “ritocca e itera”).

Caratteristiche principali (pratiche)

Modificabilità migliorata / coerenza multi-turno: preserva l’aspetto dei personaggi, l’illuminazione e le caratteristiche visive chiave attraverso modifiche iterative. Questo rende più affidabile “lo stesso modello, modifiche ripetute” per flussi come cataloghi di prodotti o asset di brand.
Throughput più rapido — miglioramenti di velocità 4× rispetto a GPT Image 1, mirati a ridurre la latenza nei flussi creativi iterativi.
Ottimizzazioni dei costi — costi di input/output immagine ridotti di circa 20% rispetto a GPT Image 1, abbassando il costo per iterazione per gli utenti ad alto volume.
Compositing multi-immagine e riferimento di stile — accetta più immagini di riferimento per comporre scene o trasferire stile/illuminazione.
Regolazioni qualità/fedeltà — parametri API che bilanciano velocità vs. fedeltà (usa qualità più bassa per generazione in massa; più alta per asset di produzione).
Modifica multi-turno / integrazione con Responses API — abilita flussi a passi (chiedi cambiamenti, poi “fai ritocchi” preservando lo stato).

Capacità tecniche

Limite del prompt testuale (modelli immagine): fino a 32,000 caratteri (nota: OpenAI documenta questo come la lunghezza testuale consentita per i modelli immagine GPT). Usalo per prompt lunghi con molti vincoli.
Input immagine: accetta ID di file (preferiti per flussi multi-turno) o byte grezzi; è possibile fornire più immagini per compositing e riferimento.
Output: PNG/JPEG o artefatti immagine predefiniti dalla piattaforma restituiti dall’API (o come allegati in ChatGPT). Gli output possono includere più immagini candidate e supportano richieste iterative per affinare un risultato.
Modalità di generazione: da testo a immagine, modifica di immagini (inpaint/estensione con istruzioni) e varianti. La modifica multi-turno supporta istruzioni in stile “aggiungi/sottrai/combina”.
Modifica consapevole delle istruzioni: i modelli sono ottimizzati per la fedeltà alle istruzioni (preservando invarianti specificate come “non cambiare il logo”, “mantieni posa e illuminazione”). Gli schemi di prompt engineering (invarianti esplicite ripetute a ogni iterazione) riducono la deriva semantica.

Prestazioni nei benchmark

Posizionamento in classifica: un rapporto aggregato cita GPT Image 1.5 in testa alle classifiche text-to-image con ~1264 punti su una leaderboard di Artificial Analysis, davanti al modello successivo con un margine misurabile.
Metriche per attività (modifica & preservazione): un riepilogo di Microsoft Foundry mostra che GPT-Image-1.5 ottiene un successo quasi perfetto di modifica binaria (100% su un BinaryEval a singolo turno) e forti punteggi di preservazione del volto (circa 90% sulle misure AuraFace) nella loro tabella di confronto rispetto ai concorrenti e ai precedenti modelli OpenAI. Tali metriche comparative collocano GPT-Image-1.5 davanti ad alcuni rivali in termini di preservazione e fedeltà di modifica.

GPT Image 1.5

Come GPT-Image-1.5 si confronta con i pari

Vs. GPT Image 1 (precedente generazione OpenAI): più veloce (fino a 4×), più economico (~20% di costo IO immagine in meno) e con maggiore fedeltà di modifica — mirato a passare da “prototipo/demo” a flussi di lavoro di immagini “production-friendly”.
Vs. Google’s Nano Banana Pro / modelli immagine Gemini: GPT-Image-1.5 e le famiglie Google Nano Banana Pro / Gemini 3 come rivali vicini — ciascuno ha punti di forza in diverse classi di prompt. La comunicazione di OpenAI enfatizza la fedeltà di modifica e la velocità di iterazione; l’offerta di Google è stata elogiata per il realismo da studio in alcuni esempi.
Vs. Qwen Image e altri modelli open/closed: GPT-Image-1.5 supera Qwen Image su diverse metriche di modifica e preservazione nelle valutazioni a singolo turno, ma le differenze si riducono in scenari multi-turno o test specifici di dominio.

Dove GPT-Image-1.5 è forte

Immagini di prodotto per e-commerce: varianti in massa, sostituzione degli sfondi, cataloghi prodotto coerenti da una singola foto (preservazione del brand/logo).
Produzione di asset creativi e marketing: rapida iterazione di concept, mockup fotorealistici, trasferimenti di stile controllati.
Ritocco fotografico & flussi editoriali: prove realistiche di abbigliamento/acconciature, ritocchi selettivi che preservano identità e illuminazione.
Integrazione con strumenti di design: integrazione in piattaforme di design o CMS per varianti immagine on-demand (le regolazioni di fedeltà aiutano il controllo dei costi).
Pipeline di compositing multi-step: input multi-immagine consentono compositing e generazione basata su riferimento per scene complesse.

Come accedere alla GPT Image 1.5 API

Passaggio 1: Registrati per la chiave API

Passaggio 2: Invia richieste alla GPT Image 1.5 API

Inserisci la tua domanda o richiesta nel campo content — è a questo che il modello risponderà. Elabora la risposta dell’API per ottenere il risultato generato.

Passaggio 3: Recupera e verifica i risultati

Elabora la risposta dell’API per ottenere il risultato generato. Dopo l’elaborazione, l’API risponde con lo stato dell’attività e i dati di output.

Vedi anche Gemini 3 Pro Preview API

GPT Image 1.5

Playground per GPT Image 1.5

Che cos'è l'API GPT-Image-1.5?

Caratteristiche principali (pratiche)

Capacità tecniche

Prestazioni nei benchmark

Come GPT-Image-1.5 si confronta con i pari

Dove GPT-Image-1.5 è forte

Come accedere alla GPT Image 1.5 API

Passaggio 1: Registrati per la chiave API

Passaggio 2: Invia richieste alla GPT Image 1.5 API

Passaggio 3: Recupera e verifica i risultati

FAQ

Prezzi per GPT Image 1.5

Codice di esempio e API per GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Versioni di GPT Image 1.5

GPT Image 1.5

Playground per GPT Image 1.5

Che cos'è l'API GPT-Image-1.5?

Caratteristiche principali (pratiche)

Capacità tecniche

Prestazioni nei benchmark

Come GPT-Image-1.5 si confronta con i pari

Dove GPT-Image-1.5 è forte

Come accedere alla GPT Image 1.5 API

Passaggio 1: Registrati per la chiave API

Passaggio 2: Invia richieste alla GPT Image 1.5 API

Passaggio 3: Recupera e verifica i risultati

FAQ

Prezzi per GPT Image 1.5

Codice di esempio e API per GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Versioni di GPT Image 1.5