gpt-image-1-mini - это оптимизированная по стоимости мультимодальная модель изображения от OpenAI, который принимает ввод текста и изображений и производит выходы изображений. Он позиционируется как меньший и более дешёвый аналог полного семейства GPT-Image-1 от OpenAI, предназначенный для высокопроизводительного производства, где стоимость и задержка являются важными ограничениями. Модель предназначена для таких задач, как генерация текста в изображение, редактирование изображений / инрисовкаи рабочие процессы, включающие эталонные изображения.
Ключевые характеристики
- Генерация текста → изображения: преобразует подсказки на естественном языке в изображения с четким выполнением инструкций.
- Редактирование изображений / инрисовка: принимает контрольные изображения и маски для выполнения целевых правок.
- Оптимизированная по стоимости («мини») конструкция: меньший размер, который OpenAI и наблюдатели описывают как гораздо более дешевый в расчете на одно изображение, чем большая модель (сообщения OpenAI/DevDay и первые отчеты говорят о том, что он обходится примерно на 80 % дешевле).
- Гибкое управление выходными данными: поддерживает размер, формат вывода (JPEG/PNG/WEBP), сжатие и ручку качества (низкое/среднее/высокое/авто в кулинарной книге).
Технические детали (архитектура и возможности)
- Семейство моделей и вход/выход: член gpt-image-1 семья; принимает текстовые подсказки и входные данные изображения (для редактирования) и возвращает сгенерированные выходные изображения. Качество/размер параметры управляют разрешением (типичное максимальное значение ~1536×1024 в этом семействе — точные поддерживаемые размеры см. в документации).
- Операционные компромиссы: разработанная как модель с меньшими габаритами — жертвует точностью воспроизведения в пользу пропускная способность и стоимость улучшения при сохранении надежных функций отслеживания и редактирования подсказок.
- Безопасность и метаданные: соблюдает правила безопасности изображений OpenAI и встраивает параметры метаданных C2PA для определения происхождения, если они доступны.
Входы и выходы — каноническое использование поддерживает:
- Текстовое приглашение (строка) для создания нового изображения.
- Изображение + маска для выполнения целевых правок/дорисовок.
- Эталонные изображения для управления стилем или композицией.
Они доступны через API изображений (название моделиgpt-image-1-mini).
ограничения
- Более низкая пиковая точность: по сравнению с большой моделью gpt-image-1, mini может теряют некоторые микродетали и топовый фотореализм (ожидаемый компромисс по стоимости).
- Рендеринг текста и мелких деталей: как и многие модели изображений, он может проблемы с мелким разборчивым текстом, плотные диаграммы или микротекстуры; для этих нужд следует выполнять постобработку или использовать модели с более высокой производительностью.
- Область редактирования: Функции редактирования и закрашивания изображений доступны, но предлагают некоторые ограничения редактирования относительно интерактивных веб-инструментов ChatGPT — редактирование эффективно для многих задач, но может потребовать итеративной доработки.
- Ограничения безопасности и политики: Выходные данные подлежат модерации/контролю безопасности OpenAI (контент для взрослых, ограничения на контент, защищенный авторским правом, запрещенные выходные данные). Разработчики могут контролировать степень модерации с помощью параметров API, если это предусмотрено.
Рекомендуемые варианты использования
- Генерация контента в больших объемах (маркетинговые материалы, миниатюры, быстрое концептуальное искусство) — где стоимость за изображение является первичным.
- Программное редактирование/шаблонирование — массовая закраска или генерация вариантов из базового актива.
- Интерактивные приложения с бюджетными ограничениями — чат-интерфейсы или интегрированные инструменты проектирования, где скорость ответа и стоимость важнее абсолютной точности.
- Создание прототипов и генерация A/B-изображений — быстро сгенерировать множество изображений-кандидатов и выборочно масштабировать их или повторно запустить на более крупных моделях для финалистов.
Как вызвать API gpt-image-1-mini из CometAPI
gpt-image-1-mini Цены на API в CometAPI, скидка 20% от официальной цены:
| Входные токены | $2.00 |
| Выходные токены | $6.40 |
Необходимые шаги
- Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
- Войдите в свой Консоль CometAPI.
- Получите ключ API-интерфейса для доступа к учетным данным. Нажмите «Добавить токен» в API-токене в персональном центре, получите ключ токена: sk-xxxxx и отправьте.

Используйте метод
- Выберите конечную точку «gpt-image-1-mini» для отправки API-запроса и задайте тело запроса. Метод запроса и тело запроса взяты из документации API на нашем сайте. Для вашего удобства на нашем сайте также доступен тест Apifox.
- Заменять с вашим реальным ключом CometAPI из вашей учетной записи.
- Введите свой вопрос или запрос в поле «Контент» — на него ответит модель.
- . Обработайте ответ API, чтобы получить сгенерированный ответ.
CometAPI предоставляет полностью совместимый REST API для беспроблемной миграции. Ключевые детали генерация изображения:
- Базовый URL: https://api.cometapi.com/v1/images/generations
- Название модели: gpt-image-1-mini
- Аутентификация:
Bearer YOUR_CometAPI_API_KEYзаголовок - Тип содержимого:
application/json.
Редактирование изображений (gpt-image-1): https://api.cometapi.com/v1/images/edits
См. также API GPT-image-1


