OpenAI представила свое последнее достижение в области искусственного интеллекта с запуском API GPT-Image-1, мощной модели генерации изображений, которая теперь доступна разработчикам и компаниям. Основываясь на возможностях GPT-4o, GPT-Image-1 предлагает расширенную универсальность в создании изображений в различных стилях, точной визуализации текста и включении мировых знаний в визуальные результаты.
Adobe интегрировала GPT-Image-1 в свои приложения Firefly и Express, предоставляя пользователям расширенную творческую гибкость. Эта интеграция позволяет генерировать изображения в различных эстетических стилях, удовлетворяя потребности бизнес-профессионалов, потребителей и создателей. Figma также приняла эту модель, позволяя пользователям генерировать и редактировать изображения непосредственно на своей платформе дизайна с помощью простых подсказок, оптимизируя процесс проектирования и способствуя быстрому формированию идей.
Помимо Adobe и Figma, другие компании, такие как Canva, GoDaddy и Instacart, изучают приложения GPT-Image-1, что свидетельствует о более широком сдвиге отрасли в сторону генерации изображений на основе ИИ. В настоящее время модель доступна через API изображений OpenAI, а в ближайшем будущем планируется расширить поддержку API Responses.
Внедрение GPT-Image-1 последовало за недавним раундом финансирования OpenAI в размере 40 млрд, проведенным SoftBank, что увеличило оценку компании до 300 млрд. Эта финансовая поддержка подчеркивает растущую уверенность в инновациях OpenAI в области ИИ и их потенциале для преобразования различных секторов.
Поскольку изображения, созданные с помощью ИИ, становятся все более распространенными, на первый план выходят соображения, касающиеся этического использования и воздействия на окружающую среду. OpenAI ввела ограничения на создание изображений в стиле некоторых ныне живущих художников, чтобы решить проблемы с авторскими правами. Кроме того, энергетические потребности моделей ИИ, таких как GPT-Image-1, вызвали дискуссии об устойчивости и необходимости более эффективной работы центров обработки данных.
С помощью GPT-Image-1 компания OpenAI продолжает расширять границы возможностей креативности на основе искусственного интеллекта, предлагая инструменты, которые позволяют пользователям воплощать свои визуальные идеи в жизнь с беспрецедентной легкостью и точностью.

Структура ценообразования GPT-Image-1
API использует модель ценообразования на основе токенов:
- Токены ввода текста: 5 долларов за 1 миллион токенов.
- Токены ввода изображения: 10 долларов за 1 миллион токенов.
- Токены вывода изображения: 40 долларов за 1 миллион токенов.
На практике это означает примерно:
- Изображения низкого качества: 0.02 долл. США за изображение.
- Изображения среднего качества: 0.07 долл. США за изображение.
- Высококачественные изображения: 0.19 долл. США за изображение.
Первые шаги
Разработчики могут получить доступ API GPT-image-1 API через CometAPI. Для начала изучите возможности модели на игровой площадке и обратитесь к API-руководство (название модели: gpt-image-1) для получения подробных инструкций. Обратите внимание, что некоторым разработчикам может потребоваться проверить свою организацию перед использованием модели.



