How fast is GPT Image 1.5 compared to GPT Image 1?

GPT Image 1.5 обеспечивает до 4× увеличение скорости по сравнению с GPT Image 1, существенно снижая задержку в итеративных творческих рабочих процессах.

Does GPT Image 1.5 support multi-turn conversational editing?

Да, через Responses API GPT Image 1.5 поддерживает многошаговые сценарии редактирования, в которых вы можете итеративно улучшать изображения, добавляя последующие инструкции при сохранении контекста.

What resolutions and quality settings does GPT Image 1.5 support?

GPT Image 1.5 поддерживает 1024×1024 (квадратный), 1536×1024 (альбомная) и 1024×1536 (портретная). Параметры качества включают low, medium, high и auto.

Can GPT Image 1.5 use multiple reference images for compositing?

Да, GPT Image 1.5 принимает несколько входных изображений для композитинга и в качестве эталона стиля. Первые 5 изображений сохраняются с более высокой точностью при использовании режима high input_fidelity.

How does GPT Image 1.5 compare to Google's Nano Banana Pro?

GPT Image 1.5 делает упор на точность редактирования и скорость итераций, тогда как Nano Banana Pro от Google ценят за студийный реализм. Оба решения близки по возможностям — выбирайте исходя из потребностей вашего рабочего процесса.

Does GPT Image 1.5 support transparent backgrounds?

Да, установите параметр background в значение 'transparent' при использовании форматов PNG или WebP на выходе. Прозрачность работает лучше всего при параметрах качества medium или high.

What is the maximum text prompt length for GPT Image 1.5?

GPT Image 1.5 принимает подсказки длиной до 32,000 символов, что позволяет задавать очень детальные и строго заданные инструкции для сложных задач генерации изображений.

Доступный API GPT Image 1.5 | text-to-image

Что такое API GPT-Image-1.5?

GPT-Image-1.5 — это новейший представитель семейства GPT Image от OpenAI и модель, лежащая в основе обновленного опыта работы с разделом Images в ChatGPT. Модель призвана вывести генерацию изображений из стадии экспериментальных новинок в производственные креативные инструменты: более высокая фотореалистичность, более тонкий контроль для итеративных правок и более быстрое инференс-время для интерактивных и корпоративных рабочих процессов.

gpt-image-1.5 API — это мультимодальная конечная точка модели изображений, принимающая один или несколько входов-изображений (идентификаторы файлов или байты) плюс текстовый промпт и возвращающая сгенерированные или отредактированные изображения. Поддерживает:

Генерацию по тексту (создание из промпта),
Редактирование изображений / инпейтинг / композитинг (применение инструкций к существующим изображениям, поддерживается несколько входных изображений), и
Итеративные, многошаговые процессы редактирования через Responses API (позволяет интерфейсы «подкрутить и повторить»).

API обрабатывает промпты-изображения иначе, чем прежние ограничения DALL·E: модели GPT для изображений принимают существенно более длинные текстовые промпты (ориентир — 32k символов), что делает возможными сложные инструкции с большим числом ограничений.

Основные возможности (практически)

Улучшенная редактируемость / межитерационная согласованность: сохраняет внешность персонажей, освещение и ключевые визуальные атрибуты при итеративных правках. Это делает «одна и та же модель, повторяемые правки» более надежным подходом для задач вроде товарных каталогов или бренд-активов.
Более высокая пропускная способность — ускорение в 4× по сравнению с GPT Image 1, нацеленное на снижение задержки в итеративных креативных процессах.
Оптимизация стоимости — затраты на ввод/вывод изображений снижены примерно на 20% по сравнению с GPT Image 1, что уменьшает стоимость итераций на изображение для пользователей с высоким объемом.
Мульти-изображенческий композитинг и референс стиля — принимает несколько референсных изображений для компоновки сцен или переноса стиля/освещения.
Регулировка качества/верности — параметры API, позволяющие выбирать компромисс между скоростью и верностью (низкое качество для массовой генерации; высокое — для продакшн-активов).
Многошаговое редактирование / интеграция с Responses API — поддерживает пошаговые процессы (просите изменения, затем «вносите правки» с сохранением состояния).

Технические возможности

Лимит текста промпта (для моделей изображений): до 32,000 символов (примечание: OpenAI указывает это как ограничение длины текста для моделей изображений GPT). Используйте для длинных промптов с множеством ограничений.
Входы-изображения: принимает идентификаторы файлов (предпочтительно для многошаговых сценариев) или «сырые» байты; может быть несколько изображений для композитинга и референса.
Выходные данные: PNG/JPEG или артефакты изображений по умолчанию платформы, возвращаемые API (или как вложения в ChatGPT). Выход может включать несколько вариантов изображений и поддерживает итеративные запросы для уточнения результата.
Режимы генерации: текст-в-изображение, редактирование изображений (инпейтинг/расширение по инструкциям) и варианты. Многошаговое редактирование поддерживает инструкции в стиле «добавить/удалить/объединить».
Редактирование с учетом инструкций: модели оптимизированы на точность следования инструкциям (с сохранением заданных инвариантов, таких как «не менять логотип», «сохранить позу и освещение»). Шаблоны промпт-инжиниринга (явное повторение инвариантов на каждой итерации) уменьшают семантический дрейф.

Результаты в бенчмарках

Позиция в лидерборде: один сводный отчет указывает, что GPT Image 1.5 лидирует в рейтинге text-to-image с ~1264 баллами на лидерборде Artificial Analysis, опережая ближайшую модель на заметную величину.
Метрики на уровне задач (редактирование и сохранение): сводка Microsoft Foundry по метрикам оценки показывает, что GPT-Image-1.5 достигает почти идеального успеха бинарных модификаций (100% в одношаговом BinaryEval) и высоких показателей сохранения лица (около 90% по AuraFace) в их сравнительной таблице с конкурентами и предыдущими моделями OpenAI. Эти сравнительные метрики ставят GPT-Image-1.5 выше ряда соперников по сохранению и точности редактирования.

GPT Image 1.5

Сравнение GPT-Image-1.5 с аналогами

По сравнению с GPT Image 1 (предыдущее поколение OpenAI): быстрее (до 4×), дешевле (примерно на 20% ниже стоимость I/O изображений) и с более высокой точностью редактирования — нацелено на переход от «прототипа/демо» к «дружественным к продакшну» сценариям работы с изображениями.
По сравнению с Google Nano Banana Pro / Gemini image models: GPT-Image-1.5 и семейство Google Nano Banana Pro / Gemini — близкие конкуренты, каждый силен в своих классах промптов. Сообщения OpenAI подчеркивают точность редактирования и скорость итераций; предложения Google хвалят за студийный реализм в ряде примеров.
По сравнению с Qwen Image и другими открытыми/закрытыми моделями: GPT-Image-1.5 превосходит Qwen Image по ряду метрик редактирования и сохранения в одношаговых оценках, но различия сокращаются в многошаговых или иных предметных тестах.

Сильные стороны GPT-Image-1.5

Изображения для e-commerce: массовые варианты, замена фона, согласованные товарные каталоги из одного фото (с сохранением бренда/логотипа).
Создание креативов и маркетинговых активов: быстрые итерации концептов, фотореалистичные мокапы, управляемые перенесения стиля.
Ретушь фото и редакционные процессы: реалистичные примерки одежды/причесок, выборочная ретушь с сохранением идентичности и освещения.
Интеграция с дизайн-инструментами: подключение к платформам дизайна или CMS для генерации вариантов изображений по требованию (настройки верности помогают контролировать стоимость).
Многошаговые пайплайны композитинга: несколько входных изображений позволяют композитинг и генерацию на основе референсов для сложных сцен.

Как получить доступ к API GPT Image 1.5

Шаг 1: Зарегистрируйтесь и получите API-ключ

Войдите на cometapi.com. Если вы еще не являетесь пользователем, сначала зарегистрируйтесь. Авторизуйтесь в консоли CometAPI. Получите учетные данные — ключ API для интерфейса. Нажмите «Add Token» в разделе токенов API в личном кабинете, получите ключ токена: sk-xxxxx и отправьте.

Шаг 2: Отправляйте запросы к API GPT Image 1.5

Выберите конечную точку «gpt-image-1.5» для отправки запроса к API и задайте тело запроса. Метод запроса и тело запроса приведены в нашей документации по API на сайте. На нашем сайте также доступен тест в Apifox для вашего удобства. Замените <YOUR_API_KEY> на ваш фактический ключ CometAPI из аккаунта. базовый URL — Изображения (https://api.cometapi.com/v1/images/generations) и [Редактирование изображений]

Вставьте ваш вопрос или запрос в поле content — на него модель и ответит. Обработайте ответ API, чтобы получить сгенерированный результат.

Шаг 3: Получение и проверка результатов

Обработайте ответ API, чтобы получить сгенерированный результат. После обработки API отвечает статусом задачи и выходными данными.

См. также Предварительная версия API Gemini 3 Pro

Цена Comet (USD / M Tokens)	Официальная цена (USD / M Tokens)	Скидка
Ввод:$6.4/M Вывод:$25.6/M	Ввод:$8/M Вывод:$32/M	-20%

version
gpt-image-1.5
gpt-image-1.5-2025-12-16

Что такое API GPT-Image-1.5?

Генерацию по тексту (создание из промпта),
Редактирование изображений / инпейтинг / композитинг (применение инструкций к существующим изображениям, поддерживается несколько входных изображений), и
Итеративные, многошаговые процессы редактирования через Responses API (позволяет интерфейсы «подкрутить и повторить»).

Основные возможности (практически)

Улучшенная редактируемость / межитерационная согласованность: сохраняет внешность персонажей, освещение и ключевые визуальные атрибуты при итеративных правках. Это делает «одна и та же модель, повторяемые правки» более надежным подходом для задач вроде товарных каталогов или бренд-активов.
Более высокая пропускная способность — ускорение в 4× по сравнению с GPT Image 1, нацеленное на снижение задержки в итеративных креативных процессах.
Оптимизация стоимости — затраты на ввод/вывод изображений снижены примерно на 20% по сравнению с GPT Image 1, что уменьшает стоимость итераций на изображение для пользователей с высоким объемом.
Мульти-изображенческий композитинг и референс стиля — принимает несколько референсных изображений для компоновки сцен или переноса стиля/освещения.
Регулировка качества/верности — параметры API, позволяющие выбирать компромисс между скоростью и верностью (низкое качество для массовой генерации; высокое — для продакшн-активов).
Многошаговое редактирование / интеграция с Responses API — поддерживает пошаговые процессы (просите изменения, затем «вносите правки» с сохранением состояния).

Технические возможности

Лимит текста промпта (для моделей изображений): до 32,000 символов (примечание: OpenAI указывает это как ограничение длины текста для моделей изображений GPT). Используйте для длинных промптов с множеством ограничений.
Входы-изображения: принимает идентификаторы файлов (предпочтительно для многошаговых сценариев) или «сырые» байты; может быть несколько изображений для композитинга и референса.
Выходные данные: PNG/JPEG или артефакты изображений по умолчанию платформы, возвращаемые API (или как вложения в ChatGPT). Выход может включать несколько вариантов изображений и поддерживает итеративные запросы для уточнения результата.
Режимы генерации: текст-в-изображение, редактирование изображений (инпейтинг/расширение по инструкциям) и варианты. Многошаговое редактирование поддерживает инструкции в стиле «добавить/удалить/объединить».
Редактирование с учетом инструкций: модели оптимизированы на точность следования инструкциям (с сохранением заданных инвариантов, таких как «не менять логотип», «сохранить позу и освещение»). Шаблоны промпт-инжиниринга (явное повторение инвариантов на каждой итерации) уменьшают семантический дрейф.

Результаты в бенчмарках

Позиция в лидерборде: один сводный отчет указывает, что GPT Image 1.5 лидирует в рейтинге text-to-image с ~1264 баллами на лидерборде Artificial Analysis, опережая ближайшую модель на заметную величину.
Метрики на уровне задач (редактирование и сохранение): сводка Microsoft Foundry по метрикам оценки показывает, что GPT-Image-1.5 достигает почти идеального успеха бинарных модификаций (100% в одношаговом BinaryEval) и высоких показателей сохранения лица (около 90% по AuraFace) в их сравнительной таблице с конкурентами и предыдущими моделями OpenAI. Эти сравнительные метрики ставят GPT-Image-1.5 выше ряда соперников по сохранению и точности редактирования.

GPT Image 1.5

Сравнение GPT-Image-1.5 с аналогами

По сравнению с GPT Image 1 (предыдущее поколение OpenAI): быстрее (до 4×), дешевле (примерно на 20% ниже стоимость I/O изображений) и с более высокой точностью редактирования — нацелено на переход от «прототипа/демо» к «дружественным к продакшну» сценариям работы с изображениями.
По сравнению с Google Nano Banana Pro / Gemini image models: GPT-Image-1.5 и семейство Google Nano Banana Pro / Gemini — близкие конкуренты, каждый силен в своих классах промптов. Сообщения OpenAI подчеркивают точность редактирования и скорость итераций; предложения Google хвалят за студийный реализм в ряде примеров.
По сравнению с Qwen Image и другими открытыми/закрытыми моделями: GPT-Image-1.5 превосходит Qwen Image по ряду метрик редактирования и сохранения в одношаговых оценках, но различия сокращаются в многошаговых или иных предметных тестах.

Сильные стороны GPT-Image-1.5

Изображения для e-commerce: массовые варианты, замена фона, согласованные товарные каталоги из одного фото (с сохранением бренда/логотипа).
Создание креативов и маркетинговых активов: быстрые итерации концептов, фотореалистичные мокапы, управляемые перенесения стиля.
Ретушь фото и редакционные процессы: реалистичные примерки одежды/причесок, выборочная ретушь с сохранением идентичности и освещения.
Интеграция с дизайн-инструментами: подключение к платформам дизайна или CMS для генерации вариантов изображений по требованию (настройки верности помогают контролировать стоимость).
Многошаговые пайплайны композитинга: несколько входных изображений позволяют композитинг и генерацию на основе референсов для сложных сцен.

Как получить доступ к API GPT Image 1.5

Шаг 1: Зарегистрируйтесь и получите API-ключ

Шаг 2: Отправляйте запросы к API GPT Image 1.5

Шаг 3: Получение и проверка результатов

См. также Предварительная версия API Gemini 3 Pro

GPT Image 1.5

Playground для GPT Image 1.5

Что такое API GPT-Image-1.5?

Основные возможности (практически)

Технические возможности

Результаты в бенчмарках

Сравнение GPT-Image-1.5 с аналогами

Сильные стороны GPT-Image-1.5

Как получить доступ к API GPT Image 1.5

Шаг 1: Зарегистрируйтесь и получите API-ключ

Шаг 2: Отправляйте запросы к API GPT Image 1.5

Шаг 3: Получение и проверка результатов

ЧАВО

Цены для GPT Image 1.5

Пример кода и API для GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Версии GPT Image 1.5

GPT Image 1.5

Playground для GPT Image 1.5

Что такое API GPT-Image-1.5?

Основные возможности (практически)

Технические возможности

Результаты в бенчмарках

Сравнение GPT-Image-1.5 с аналогами

Сильные стороны GPT-Image-1.5

Как получить доступ к API GPT Image 1.5

Шаг 1: Зарегистрируйтесь и получите API-ключ

Шаг 2: Отправляйте запросы к API GPT Image 1.5

Шаг 3: Получение и проверка результатов

ЧАВО

Цены для GPT Image 1.5

Пример кода и API для GPT Image 1.5

Python Code Example

JavaScript Code Example

Curl Code Example

Версии GPT Image 1.5