Негізгі мүмкіндіктер
- Мәтін→сурет генерациясы: табиғи тілдегі промпттарды нұсқауларды жақсы орындай отырып суреттерге түрлендіреді.
- Суретті өңдеу / инпейтинг: нысаналы өңдеулерді орындау үшін анықтамалық суреттер мен маскаларды қабылдайды.
- Шығынға оңтайландырылған (“mini”) дизайн: OpenAI және бақылаушылар үлкен модельмен салыстырғанда бір суретке шаққандағы құны әлдеқайда арзан деп сипаттайтын ықшам нұсқа (OpenAI/DevDay хабарламалары мен ерте есептерде шамамен ~80% арзан делінеді).
- Икемді шығыс басқарулары: өлшемді, шығыс пішімін (JPEG/PNG/WEBP), сығуды және сапа реттегішін қолдайды (cookbook-та low/medium/high/auto).
Техникалық мәліметтер (архитектура және мүмкіндіктер)
- Модель тобы және кіріс/шығыс: gpt-image-1 тобының мүшесі; мәтіндік промпттарды және сурет кірістерін (өңдеу үшін) қабылдайды және генерацияланған сурет шығыстарын қайтарады. Quality/size параметрлері ажыратымдылықты басқарады (осы топта әдеттегі максимум ~1536×1024 — нақты қолдайтын өлшемдер үшін құжаттарды қараңыз).
- Операциялық ымыралар: ықшам ізге ие модель ретінде жасалған — сенімді промптты орындау мен өңдеу мүмкіндіктерін сақтай отырып, ең жоғарғы деңгейдегі дәлдіктің бір бөлігін өткізу қабілеті мен құнды жақсарту үшін айырбастайды.
- Қауіпсіздік және метадеректер: OpenAI-дің сурет қауіпсіздігі шектеулерін ұстанады және қолжетімді болған кезде шығу тегін растау үшін C2PA метадерек опцияларын енгізеді.
Кірістер мен шығыстар — канондық қолдану мыналарды қолдайды:
- Мәтіндік промпт (жол) жаңа сурет жасау үшін.
- Сурет + маска нысаналы өңдеулерді/инпейтингті орындау үшін.
- Анықтамалық суреттер стильді немесе композицияны басқару үшін.
Бұлар Images API арқылы ұсынылады (модель атауыgpt-image-1-mini).
Шектеулер
- Төменірек шекті дәлдік: үлкен gpt-image-1 моделіне қарағанда, mini кейбір микро-детальдар мен ең жоғарғы деңгейдегі фотореализмді жоғалтуы мүмкін (шығын үшін күтілетін ымыра).
- Мәтінді бейнелеу және ұсақ детальдар: көптеген сурет модельдері сияқты, ол ұсақ оқылатын мәтінмен, тығыз диаграммалармен немесе өте нәзік текстуралармен қиналуы мүмкін; мұндай қажеттіліктер үшін кейінгі өңдеуді немесе жоғары қуатты модельдерді қолдануды күтіңіз.
- Өңдеу ауқымы: суретті өңдеу/инпейтинг мүмкіндіктері қолжетімді, бірақ интерактивті ChatGPT веб-құралдарымен салыстырғанда кейбір өңдеу шектеулері бар екенін көрсетеді — көптеген тапсырмалар үшін өңдеулер тиімді, бірақ итеративті нақтылауды қажет етуі мүмкін.
- Қауіпсіздік және саясат шектеулері: шығыстар OpenAI модерациясы/қауіпсіздік шектеулеріне бағынады (айқын контент, авторлық құқықпен қорғалған контент шектеулері, рұқсат етілмеген шығыстар). Әзірлеушілер API параметрлері ұсынылған жерде модерация сезімталдығын басқара алады.
Ұсынылатын қолдану жағдайлары
- Жоғары көлемді контент генерациясы (маркетинг материалдары, thumbnails, жылдам концепт-арт) — мұнда бір суретке шаққандағы құн негізгі фактор.
- Бағдарламалық өңдеу / үлгілеу — базалық активтен жаппай инпейтинг немесе нұсқа генерациясы.
- Бюджет шектеулері бар интерактивті қолданбалар — жауап беру жылдамдығы мен құны абсолютті ең жоғары дәлдіктен маңыздырақ болатын чат интерфейстері немесе біріктірілген дизайн құралдары.
- Прототиптеу және A/B сурет генерациясы — көптеген кандидат суреттерді жылдам жасап, финал нұсқалар үшін ірі модельдерде таңдаулы түрде upscale жасау немесе қайта іске қосу.
- gpt-image-1-mini API-ге қалай қол жеткізуге болады
1-қадам: API кілтіне тіркелу
cometapi.com сайтына кіріңіз. Егер сіз әлі біздің пайдаланушымыз болмасаңыз, алдымен тіркеліңіз. CometAPI console жүйесіне кіріңіз. Интерфейстің қол жеткізу дерегі API key-ді алыңыз. Жеке орталықтағы API token бөлімінде “Add Token” түймесін басып, token key алыңыз: sk-xxxxx және жіберіңіз.
2-қадам: gpt-image-1-mini API-ге сұраулар жіберу
API сұрауын жіберу және сұрау денесін орнату үшін “\**gpt-image-1-mini \**”endpoint-ін таңдаңыз. Сұрау әдісі мен сұрау денесі біздің веб-сайттағы API doc құжатынан алынады. Біздің веб-сайтта ыңғайлылығыңыз үшін Apifox тесті де ұсынылған. <YOUR_API_KEY> орнын тіркелгіңіздегі нақты CometAPI кілтімен ауыстырыңыз.
Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель дәл осыған жауап береді. Генерацияланған жауапты алу үшін API жауабын өңдеңіз.
3-қадам: Нәтижелерді алу және тексеру
Генерацияланған жауапты алу үшін API жауабын өңдеңіз. Өңдеуден кейін API тапсырма күйі мен шығыс деректерін қайтарады.