gpt-image-1-mini 是 OpenAI 推出的面向成本优化的多模态图像模型,接受 文本与图像输入 并生成 图像输出。它被定位为 OpenAI 完整 GPT-Image-1 家族的更小、更便宜的同系列模型——专为成本与延迟是重要约束的高吞吐生产使用场景而设计。该模型适用于 文本到图像生成、图像编辑/补画,以及包含参考图像的工作流。
主要特性
- 文本→图像生成: 将自然语言提示转换为图像,具备强指令遵循能力。
- 图像编辑/补画: 接收参考图像与掩膜以执行定向编辑。
- 成本优化(“mini”)设计: 体量更小,被 OpenAI 与观察者描述为每张图比大模型便宜许多(OpenAI/DevDay 信息与早期报告称约便宜 80%)。
- 灵活的输出控制: 支持大小、输出格式(JPEG/PNG/WEBP)、压缩以及质量调节(cookbook 中的 low/medium/high/auto)。
技术细节(架构与能力)
- 模型家族与输入/输出: 属于 gpt-image-1 家族;接受 文本提示 与 图像输入(用于编辑),并返回生成的图像输出。通过 质量/尺寸 参数控制分辨率(该家族典型最大约 ~1536×1024——具体支持尺寸见文档)。
- 运行取舍: 作为更小体量的模型——以牺牲部分顶级保真度来换取 吞吐与成本 的改善,同时保留稳健的指令遵循与编辑功能。
- 安全与元数据: 遵循 OpenAI 的图像安全护栏,并在可用时嵌入 C2PA 溯源元数据选项。
输入与输出 — 经典用法支持:
- 文本提示(字符串)用于生成新图像。
- 图像 + 掩膜 用于执行定向编辑/补画。
- 参考图像 用于控制风格或构图。
以上通过 Images API 暴露(模型名gpt-image-1-mini)。
限制
- 较低峰值保真度: 与大型 gpt-image-1 模型相比,mini 可能 丢失部分微小细节与顶级写实度(为成本取舍的预期表现)。
- 文本渲染与微小细节: 与许多图像模型类似,它在 小字号可读文本、密集图表或极细纹理方面可能 表现欠佳;如有此类需求,请考虑后处理或使用更高容量模型。
- 编辑范围: 虽具备图像编辑/补画功能,但相较交互式 ChatGPT 网页工具,编辑能力存在一定限制——多数任务有效,但可能需要迭代微调。
- 安全与政策约束: 输出受 OpenAI 审核/安全护栏(露骨内容、版权限制、禁止输出)约束。开发者可在提供此能力的情况下通过 API 参数调节审核敏感度。
推荐用例
- 高量内容生成(营销素材、缩略图、快速概念图)——以 单张成本 为优先。
- 程序化编辑/模板化处理 —— 基于底稿进行批量补画或变体生成。
- 预算受限的互动应用 —— 聊天界面或集成设计工具,注重响应速度与成本而非绝对顶级保真。
- 原型制作与 A/B 图像生成 —— 快速批量生成候选图像,并对入选者选择性升采样或在大型模型上重跑。
如何通过 CometAPI 调用 gpt-image-1-mini API
gpt-image-1-mini API Pricing in CometAPI,20% off the official price:
| Input Tokens | $2.00 |
| Output Tokens | $6.40 |
必需步骤
- 登录到 cometapi.com。如果你还不是我们的用户,请先注册。
- 登录你的 CometAPI console。
- 获取接口的访问凭据 API key。在个人中心的 API token 处点击“Add Token”,获取令牌密钥:sk-xxxxx 并提交。

使用方法
- 选择 “gpt-image-1-mini” 端点发送 API 请求并设置请求体。请求方法与请求体可从我们网站的 API 文档获取。我们的网站也提供 Apifox 测试以便使用。
- 将 <YOUR_API_KEY> 替换为你账户中的实际 CometAPI key。
- 将你的问题或请求插入 content 字段——模型会对此进行响应。
- . 处理 API 响应以获取生成的答案。
CometAPI 提供完全兼容的 REST API——实现无缝迁移。图像生成的关键细节见 image generation:
- Base URL: https://api.cometapi.com/v1/images/generations
- Model Names: gpt-image-1-mini
- Authentication:
Bearer YOUR_CometAPI_API_KEYheader - Content-Type:
application/json。
