Home/Models/OpenAI/GPT Image 1 mini
X

GPT Image 1 mini

Ingresso:$6.4/M
Uscita:$25.6/M
Contesto:2M
Uscita Massima:30K
Versione a costo ottimizzato di GPT Image 1. È un modello linguistico multimodale nativo che accetta input sia di testo sia di immagini e genera output di immagini.
Nuovo
Uso commerciale
Panoramica
Caratteristiche
Prezzi
API

Caratteristiche principali

  • Generazione testo→immagine: converte prompt in linguaggio naturale in immagini con una solida capacità di seguire le istruzioni.
  • Modifica immagini / inpainting: accetta immagini di riferimento e maschere per eseguire modifiche mirate.
  • Design ottimizzato per i costi (“mini”): impronta ridotta che OpenAI e osservatori descrivono come molto più economica per immagine rispetto al modello grande (la messaggistica OpenAI/DevDay e i primi report indicano un costo ~80% inferiore).
  • Controlli di output flessibili: supporta dimensione, formato di output (JPEG/PNG/WEBP), compressione e un selettore di qualità (low/medium/high/auto nel cookbook).

Dettagli tecnici (architettura e capacità)

  • Famiglia di modelli e input/output: membro della famiglia gpt-image-1; accetta prompt testuali e input immagine (per modifiche) e restituisce output di immagini generate. I parametri di qualità/dimensione controllano la risoluzione (massimo tipico ~1536×1024 in questa famiglia—vedi la documentazione per le dimensioni esatte supportate).
  • Compromessi operativi: progettato come modello a impronta ridotta—scambia parte della fedeltà di fascia alta per miglioramenti in throughput e costi, mantenendo robuste capacità di aderenza ai prompt e di modifica.
  • Sicurezza e metadati: segue i guardrail di sicurezza per le immagini di OpenAI e incorpora opzioni di metadati C2PA per la provenienza quando disponibili.

Input e output — l’uso canonico supporta:

  • Prompt testuale (stringa) per generare una nuova immagine.
  • Immagine + maschera per eseguire modifiche mirate/inpainting.
  • Immagini di riferimento per controllare stile o composizione.
    Questi sono esposti tramite la Images API (nome modello gpt-image-1-mini).

Limitazioni

  • Fedeltà di picco inferiore: rispetto al grande modello gpt-image-1, la versione mini può perdere alcuni micro-dettagli e il fotorealismo di fascia alta (compromesso previsto per il costo).
  • Rendering del testo e dettagli molto piccoli: come molti modelli di immagini, può avere difficoltà con testo piccolo leggibile, grafici densi o texture micro-fini; si preveda una post-elaborazione o l’uso di modelli di capacità superiore per tali esigenze.
  • Ambito delle modifiche: le funzionalità di modifica/inpainting delle immagini sono disponibili ma suggeriscono alcune limitazioni di editing rispetto agli strumenti web interattivi di ChatGPT—le modifiche sono efficaci per molti compiti ma possono richiedere perfezionamenti iterativi.
  • Sicurezza e vincoli di policy: gli output sono soggetti ai guardrail di moderazione/sicurezza di OpenAI (contenuti espliciti, restrizioni su contenuti protetti da copyright, output non consentiti). Gli sviluppatori possono controllare la sensibilità della moderazione tramite parametri dell’API laddove offerti.

Casi d’uso consigliati

  • Generazione di contenuti ad alto volume (asset di marketing, miniature, concept art rapida) — dove il costo per immagine è prioritario.
  • Modifica programmatica / templating — inpainting in bulk o generazione di varianti a partire da un asset base.
  • Applicazioni interattive con vincoli di budget — interfacce chat o strumenti di design integrati in cui la velocità di risposta e il costo contano più della fedeltà massima assoluta.
  • Prototipazione e generazione A/B di immagini — generare rapidamente molte immagini candidate e fare upscaling selettivo o rieseguire su modelli più grandi per i finalisti.
  • Come accedere all’API gpt-image-1-mini

Passaggio 1: Registrati per la chiave API

Accedi a cometapi.com. Se non sei ancora nostro utente, registrati prima. Accedi alla tua CometAPI console. Ottieni la chiave API di accesso dell’interfaccia. Fai clic su “Add Token” nella sezione del token API nell’area personale, ottieni la chiave del token: sk-xxxxx e invia.

Passaggio 2: Invia richieste all’API gpt-image-1-mini

Seleziona l’endpoint “\**gpt-image-1-mini \**” per inviare la richiesta API e imposta il corpo della richiesta. Il metodo e il corpo della richiesta si ottengono dalla documentazione API sul nostro sito. Il nostro sito fornisce anche test Apifox per tua comodità. Sostituisci <YOUR_API_KEY> con la tua chiave CometAPI effettiva del tuo account.

Inserisci la tua domanda o richiesta nel campo content—è a questo che il modello risponderà. Elabora la risposta dell’API per ottenere la risposta generata.

Passaggio 3: Recupera e verifica i risultati

Elabora la risposta dell’API per ottenere la risposta generata. Dopo l’elaborazione, l’API risponde con lo stato dell’attività e i dati di output.

Funzionalità per GPT Image 1 mini

Esplora le caratteristiche principali di GPT Image 1 mini, progettato per migliorare le prestazioni e l'usabilità. Scopri come queste funzionalità possono beneficiare i tuoi progetti e migliorare l'esperienza utente.

Prezzi per GPT Image 1 mini

Esplora i prezzi competitivi per GPT Image 1 mini, progettato per adattarsi a vari budget e necessità di utilizzo. I nostri piani flessibili garantiscono che paghi solo per quello che usi, rendendo facile scalare man mano che i tuoi requisiti crescono. Scopri come GPT Image 1 mini può migliorare i tuoi progetti mantenendo i costi gestibili.
Prezzo Comet (USD / M Tokens)Prezzo Ufficiale (USD / M Tokens)Sconto
Ingresso:$6.4/M
Uscita:$25.6/M
Ingresso:$8/M
Uscita:$32/M
-20%

Codice di esempio e API per GPT Image 1 mini

gpt-image-1-mini è un modello multimodale per immagini ottimizzato per i costi di OpenAI che accetta input di testo e di immagini e produce output di immagini. Si colloca come una variante più piccola e più economica della famiglia GPT-Image-1 completa di OpenAI — progettata per l’uso in produzione ad alto throughput, dove costo e latenza sono vincoli importanti. Il modello è destinato a attività come la generazione da testo a immagine, l’editing / inpainting di immagini e i flussi di lavoro che incorporano immagini di riferimento.
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI
from PIL import Image
from io import BytesIO

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

prompt = "A cute baby sea otter swimming in the ocean"

# Generate image using gpt-image-1-mini
result = client.images.generate(
    model="gpt-image-1-mini",
    prompt=prompt,
    size="1024x1024",
)

# Save the image
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

output_path = os.path.join(OUTPUT_DIR, "output.png")
image = Image.open(BytesIO(image_bytes))
image.save(output_path, format="PNG")

print(f"Image saved to: {output_path}")

Altri modelli