OpenAI запускает модель GPT-Image-1 через API

OpenAI представила свое последнее достижение в области искусственного интеллекта с запуском API GPT-Image-1, мощной модели генерации изображений, которая теперь доступна разработчикам и компаниям. Основываясь на возможностях GPT-4o, GPT-Image-1 предлагает расширенную универсальность в создании изображений в различных стилях, точной визуализации текста и включении мировых знаний в визуальные результаты.

Adobe интегрировала GPT-Image-1 в свои приложения Firefly и Express, предоставляя пользователям расширенную творческую гибкость. Эта интеграция позволяет генерировать изображения в различных эстетических стилях, удовлетворяя потребности бизнес-профессионалов, потребителей и создателей. Figma также приняла эту модель, позволяя пользователям генерировать и редактировать изображения непосредственно на своей платформе дизайна с помощью простых подсказок, оптимизируя процесс проектирования и способствуя быстрому формированию идей.

Помимо Adobe и Figma, другие компании, такие как Canva, GoDaddy и Instacart, изучают приложения GPT-Image-1, что свидетельствует о более широком сдвиге отрасли в сторону генерации изображений на основе ИИ. В настоящее время модель доступна через API изображений OpenAI, а в ближайшем будущем планируется расширить поддержку API Responses.

Внедрение GPT-Image-1 последовало за недавним раундом финансирования OpenAI в размере $40 млрд, проведенным SoftBank, что увеличило оценку компании до $300 млрд. Эта финансовая поддержка подчеркивает растущую уверенность в инновациях OpenAI в области ИИ и их потенциале для преобразования различных секторов.

Поскольку изображения, созданные с помощью ИИ, становятся все более распространенными, на первый план выходят соображения, касающиеся этического использования и воздействия на окружающую среду. OpenAI ввела ограничения на создание изображений в стиле некоторых ныне живущих художников, чтобы решить проблемы с авторскими правами. Кроме того, энергетические потребности моделей ИИ, таких как GPT-Image-1, вызвали дискуссии об устойчивости и необходимости более эффективной работы центров обработки данных.

С помощью GPT-Image-1 компания OpenAI продолжает расширять границы возможностей креативности на основе искусственного интеллекта, предлагая инструменты, которые позволяют пользователям воплощать свои визуальные идеи в жизнь с беспрецедентной легкостью и точностью.

GPT-Image-1

Структура ценообразования GPT-Image-1

API использует модель ценообразования на основе токенов:

Токены ввода текста: 5 долларов за 1 миллион токенов.
Токены ввода изображения: 10 долларов за 1 миллион токенов.
Токены вывода изображения: 40 долларов за 1 миллион токенов.

На практике это означает примерно:

Изображения низкого качества: 0.02 долл. США за изображение.
Изображения среднего качества: 0.07 долл. США за изображение.
Высококачественные изображения: 0.19 долл. США за изображение.

Первые шаги

Разработчики могут получить доступ API GPT-image-1 API через CometAPI. Для начала изучите возможности модели на игровой площадке и обратитесь к API-руководство (название модели: gpt-image-1) для получения подробных инструкций. Обратите внимание, что некоторым разработчикам может потребоваться проверить свою организацию перед использованием модели.

Структура ценообразования GPT-Image-1

Первые шаги

Читать далее

500+ моделей в одном API