Home/Models/OpenAI/GPT Image 1 mini
X

GPT Image 1 mini

Entrada:$6.4/M
Salida:$25.6/M
Contexto:2M
Salida Máxima:30K
Versión optimizada en costos de GPT Image 1. Es un modelo de lenguaje multimodal nativo que admite como entrada tanto texto como imágenes y genera imágenes como salida.
Nuevo
Uso comercial
Resumen
Características
Precios
API

Funciones clave

  • Generación de texto a imagen: convierte indicaciones en lenguaje natural en imágenes con un sólido seguimiento de instrucciones.
  • Edición de imágenes / inpainting: acepta imágenes de referencia y máscaras para realizar ediciones específicas.
  • Diseño optimizado en costos (“mini”): una huella más pequeña que OpenAI y observadores describen como mucho más barata por imagen que el modelo grande (los mensajes de OpenAI/DevDay y los primeros informes indican ~80% menos costoso).
  • Controles de salida flexibles: admite tamaño, formato de salida (JPEG/PNG/WEBP), compresión y un control de calidad (low/medium/high/auto en el cookbook).

Detalles técnicos (arquitectura y capacidades)

  • Familia de modelos y entrada/salida: miembro de la familia gpt-image-1; acepta prompts de texto e imágenes de entrada (para ediciones) y devuelve imágenes generadas. Los parámetros de quality/size controlan la resolución (máximo típico ~1536×1024 en esta familia; consulte la documentación para ver los tamaños exactos compatibles).
  • Compromisos operativos: diseñado como un modelo de menor tamaño; sacrifica parte de la fidelidad máxima a cambio de mejoras en rendimiento y costo, manteniendo un sólido seguimiento de prompts y funciones de edición.
  • Seguridad y metadatos: sigue las barreras de seguridad de OpenAI para imágenes e incorpora opciones de metadatos C2PA para la procedencia cuando están disponibles.

Entradas y salidas — el uso canónico admite:

  • Prompt de texto (cadena) para generar una imagen nueva.
  • Imagen + máscara para realizar ediciones específicas/inpainting.
  • Imágenes de referencia para controlar el estilo o la composición.
    Estos se exponen a través de la Images API (nombre del modelo gpt-image-1-mini).

Limitaciones

  • Menor fidelidad máxima: en comparación con el modelo grande gpt-image-1, mini puede perder algo de microdetalle y fotorrealismo de máximo nivel (compromiso esperado a cambio del costo).
  • Renderizado de texto y detalles pequeños: como muchos modelos de imagen, puede tener dificultades con texto pequeño legible, gráficos densos o texturas extremadamente finas; espere posprocesar o usar modelos de mayor capacidad para esas necesidades.
  • Alcance de edición: las funciones de edición de imágenes/inpainting están disponibles, pero sugieren algunas limitaciones de edición en comparación con las herramientas web interactivas de ChatGPT; las ediciones son eficaces para muchas tareas, pero pueden requerir refinamiento iterativo.
  • Restricciones de seguridad y políticas: las salidas están sujetas a las barreras de moderación/seguridad de OpenAI (contenido explícito, restricciones sobre contenido con derechos de autor, salidas no permitidas). Los desarrolladores pueden controlar la sensibilidad de moderación mediante parámetros de API cuando se ofrezcan.

Casos de uso recomendados

  • Generación de contenido de alto volumen (recursos de marketing, miniaturas, arte conceptual rápido) — donde el costo por imagen es el factor principal.
  • Edición programática / plantillas — inpainting masivo o generación de variantes a partir de un recurso base.
  • Aplicaciones interactivas con restricciones de presupuesto — interfaces de chat o herramientas de diseño integradas donde la velocidad de respuesta y el costo importan más que la fidelidad absoluta máxima.
  • Prototipado y generación de imágenes para A/B testing — genere rápidamente muchas imágenes candidatas y amplíe selectivamente o vuelva a ejecutar en modelos más grandes para las versiones finales.
  • Cómo acceder a la API de gpt-image-1-mini

Paso 1: Regístrese para obtener una clave API

Inicie sesión en cometapi.com. Si aún no es usuario, regístrese primero. Inicie sesión en su consola de CometAPI. Obtenga la credencial de acceso, la clave API de la interfaz. Haga clic en “Add Token” en la sección de token API del centro personal, obtenga la clave del token: sk-xxxxx y envíela.

Paso 2: Envíe solicitudes a la API de gpt-image-1-mini

Seleccione el endpoint “\**gpt-image-1-mini \**” para enviar la solicitud API y configure el cuerpo de la solicitud. El método de solicitud y el cuerpo de la solicitud se obtienen de la documentación API de nuestro sitio web. Nuestro sitio web también proporciona pruebas con Apifox para su comodidad. Sustituya <YOUR_API_KEY> por su clave real de CometAPI de su cuenta.

Inserte su pregunta o solicitud en el campo content; esto es a lo que responderá el modelo. Procese la respuesta de la API para obtener la respuesta generada.

Paso 3: Recuperar y verificar resultados

Procese la respuesta de la API para obtener la respuesta generada. Después del procesamiento, la API responde con el estado de la tarea y los datos de salida.

Características para GPT Image 1 mini

Explora las características clave de GPT Image 1 mini, diseñado para mejorar el rendimiento y la usabilidad. Descubre cómo estas capacidades pueden beneficiar tus proyectos y mejorar la experiencia del usuario.

Precios para GPT Image 1 mini

Explora precios competitivos para GPT Image 1 mini, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo GPT Image 1 mini puede mejorar tus proyectos mientras mantienes los costos manejables.
Precio de Comet (USD / M Tokens)Precio Oficial (USD / M Tokens)Descuento
Entrada:$6.4/M
Salida:$25.6/M
Entrada:$8/M
Salida:$32/M
-20%

Código de ejemplo y API para GPT Image 1 mini

gpt-image-1-mini es un modelo multimodal de imágenes de OpenAI optimizado en costos que admite entradas de texto e imagen y produce salidas de imagen. Se posiciona como una versión más pequeña y económica de la familia completa GPT-Image-1 de OpenAI — diseñada para uso en producción de alto volumen, donde el costo y la latencia son restricciones importantes. El modelo está destinado a tareas como la generación de imágenes a partir de texto, la edición de imágenes/inpainting y flujos de trabajo que incorporan imágenes de referencia.
Python
JavaScript
Curl
import base64
import os
from openai import OpenAI
from PIL import Image
from io import BytesIO

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
client = OpenAI(api_key=COMETAPI_KEY, base_url="https://api.cometapi.com/v1")

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

prompt = "A cute baby sea otter swimming in the ocean"

# Generate image using gpt-image-1-mini
result = client.images.generate(
    model="gpt-image-1-mini",
    prompt=prompt,
    size="1024x1024",
)

# Save the image
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

output_path = os.path.join(OUTPUT_DIR, "output.png")
image = Image.open(BytesIO(image_bytes))
image.save(output_path, format="PNG")

print(f"Image saved to: {output_path}")

Más modelos