Caratteristiche principali
- Generazione testo→immagine: converte prompt in linguaggio naturale in immagini con una solida capacità di seguire le istruzioni.
- Modifica immagini / inpainting: accetta immagini di riferimento e maschere per eseguire modifiche mirate.
- Design ottimizzato per i costi (“mini”): impronta ridotta che OpenAI e osservatori descrivono come molto più economica per immagine rispetto al modello grande (la messaggistica OpenAI/DevDay e i primi report indicano un costo ~80% inferiore).
- Controlli di output flessibili: supporta dimensione, formato di output (JPEG/PNG/WEBP), compressione e un selettore di qualità (low/medium/high/auto nel cookbook).
Dettagli tecnici (architettura e capacità)
- Famiglia di modelli e input/output: membro della famiglia gpt-image-1; accetta prompt testuali e input immagine (per modifiche) e restituisce output di immagini generate. I parametri di qualità/dimensione controllano la risoluzione (massimo tipico ~1536×1024 in questa famiglia—vedi la documentazione per le dimensioni esatte supportate).
- Compromessi operativi: progettato come modello a impronta ridotta—scambia parte della fedeltà di fascia alta per miglioramenti in throughput e costi, mantenendo robuste capacità di aderenza ai prompt e di modifica.
- Sicurezza e metadati: segue i guardrail di sicurezza per le immagini di OpenAI e incorpora opzioni di metadati C2PA per la provenienza quando disponibili.
Input e output — l’uso canonico supporta:
- Prompt testuale (stringa) per generare una nuova immagine.
- Immagine + maschera per eseguire modifiche mirate/inpainting.
- Immagini di riferimento per controllare stile o composizione.
Questi sono esposti tramite la Images API (nome modellogpt-image-1-mini).
Limitazioni
- Fedeltà di picco inferiore: rispetto al grande modello gpt-image-1, la versione mini può perdere alcuni micro-dettagli e il fotorealismo di fascia alta (compromesso previsto per il costo).
- Rendering del testo e dettagli molto piccoli: come molti modelli di immagini, può avere difficoltà con testo piccolo leggibile, grafici densi o texture micro-fini; si preveda una post-elaborazione o l’uso di modelli di capacità superiore per tali esigenze.
- Ambito delle modifiche: le funzionalità di modifica/inpainting delle immagini sono disponibili ma suggeriscono alcune limitazioni di editing rispetto agli strumenti web interattivi di ChatGPT—le modifiche sono efficaci per molti compiti ma possono richiedere perfezionamenti iterativi.
- Sicurezza e vincoli di policy: gli output sono soggetti ai guardrail di moderazione/sicurezza di OpenAI (contenuti espliciti, restrizioni su contenuti protetti da copyright, output non consentiti). Gli sviluppatori possono controllare la sensibilità della moderazione tramite parametri dell’API laddove offerti.
Casi d’uso consigliati
- Generazione di contenuti ad alto volume (asset di marketing, miniature, concept art rapida) — dove il costo per immagine è prioritario.
- Modifica programmatica / templating — inpainting in bulk o generazione di varianti a partire da un asset base.
- Applicazioni interattive con vincoli di budget — interfacce chat o strumenti di design integrati in cui la velocità di risposta e il costo contano più della fedeltà massima assoluta.
- Prototipazione e generazione A/B di immagini — generare rapidamente molte immagini candidate e fare upscaling selettivo o rieseguire su modelli più grandi per i finalisti.
- Come accedere all’API gpt-image-1-mini
Passaggio 1: Registrati per la chiave API
Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla tua CometAPI console. Ottieni la chiave API di accesso dell’interfaccia. Fai clic su “Add Token” nella sezione del token API nell’area personale, ottieni la chiave del token: sk-xxxxx e invia.
Passaggio 2: Invia richieste all’API gpt-image-1-mini
Seleziona l’endpoint “\**gpt-image-1-mini \**” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo e il corpo della richiesta si ottengono dalla documentazione API sul nostro sito. Il nostro sito fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua chiave CometAPI effettiva del tuo account.
Inserisci la tua domanda o richiesta nel campo content—è a questo che il modello risponderà. Elabora la risposta dell’API per ottenere la risposta generata.
Passaggio 3: Recupera e verifica i risultati
Elabora la risposta dell’API per ottenere la risposta generata. Dopo l’elaborazione, l’API risponde con lo stato dell’attività e i dati di output.