Ключевые возможности

Генерация «текст→изображение»: преобразует текстовые подсказки на естественном языке в изображения с точным следованием инструкциям.
Редактирование изображений / инпейтинг: принимает референсные изображения и маски для целевых правок.
Оптимизированная по стоимости («mini») архитектура: меньшая ресурсная нагрузка, которую OpenAI и наблюдатели описывают как существенно более дешёвую за изображение по сравнению с большой моделью (сообщения OpenAI/DevDay и ранние отчёты указывают на ~80% меньшую стоимость).
Гибкое управление выводом: поддерживает размер, формат вывода (JPEG/PNG/WEBP), сжатие и параметр качества (low/medium/high/auto в cookbook).

Технические детали (архитектура и возможности)

Семейство моделей и ввод/вывод: член семейства gpt-image-1; принимает текстовые подсказки и входные изображения (для правок) и возвращает сгенерированные изображения. Параметры качества/размера управляют разрешением (типичный максимум ~1536×1024 в этом семействе — см. документацию для точных поддерживаемых размеров).
Эксплуатационные компромиссы: спроектирована как модель с меньшей ресурсной нагрузкой — жертвует частью максимальной детализации ради улучшения пропускной способности и стоимости, при этом сохраняя надёжное следование инструкциям и функции редактирования.
Безопасность и метаданные: следует защитным мерам OpenAI для изображений и, при возможности, встраивает опции метаданных C2PA для подтверждения происхождения.

Ввод и вывод — канонические варианты использования включают:

Текстовая подсказка (строка) для генерации нового изображения.
Изображение + маска для выполнения целевых правок/инпейнтинга.
Референсные изображения для контроля стиля или композиции.
Доступно через Images API (имя модели gpt-image-1-mini).

Ограничения

Ниже пиковая точность: по сравнению с большой моделью gpt-image-1, версия mini может терять часть микро-деталей и максимальной фотореалистичности (ожидаемый компромисс ради стоимости).
Отрисовка текста и мелкие детали: как и многие модели изображений, может испытывать сложности с мелким разборчивым текстом, плотными диаграммами или микротонкими текстурами; ожидайте постобработку или использование более ёмких моделей для таких задач.
Объём редактирования: функции редактирования/инпейнтинга доступны, но предполагаются некоторые ограничения по сравнению с интерактивными веб-инструментами ChatGPT — правки эффективны для многих задач, но могут потребовать итеративной доводки.
Безопасность и политические ограничения: результаты подчиняются правилам модерации/безопасности OpenAI (ограничения на откровенный контент, защищённые авторским правом материалы, запрещённые выводы). Разработчики могут управлять чувствительностью модерации через параметры API, где это предусмотрено.

GPT Image 1 mini

Ключевые возможности

Технические детали (архитектура и возможности)

Ограничения

Рекомендуемые сценарии использования

Шаг 1: Зарегистрируйтесь, чтобы получить API-ключ

Шаг 2: Отправьте запросы к API gpt-image-1-mini

Шаг 3: Получите и проверьте результаты

Функции для GPT Image 1 mini

Цены для GPT Image 1 mini

Пример кода и API для GPT Image 1 mini

Больше моделей