gen4_image қолдайтын Gen-4 жанұясындағы Runway флагмандық мультимодальды кескін жасау үлгісі болып табылады шақырылған ұрпақ плюс визуалды сілтемелер (анықтамалық кескіндерді «@acey» аласыз) кескін және кескін →бейне құбырлары үшін жоғары басқарылатын, стилистикалық сәйкес нәтижелерді шығару үшін.
Кіріспе - не 4-ші буын суреті is
gen4_image Бұл Runway-тің төртінші буындағы визуалды генеративті модельдер тобы, қабылдауға арналған мәтіндік шақырулар + көрнекі сілтемелер және сақтайтын жоғары дәлдіктегі қозғалыссыз кескіндерді немесе медиаға дайын кадрларды жасаңыз Сәйкестік және стиль бұрыштар мен жарықтандыру. Модель кеңірек Gen-4 жиынтығының бөлігі ретінде ұсынылған (оның ішінде бейне нұсқалары, мысалы gen4_turbo) және нақты арналған шығармашылық өндіріс — мысалы, дәйекті кейіпкерлерді көрсету, өнімді масштабта суретке түсіру, виртуалды сынап көру және ойын активтерін құру.
Басты ерекшеліктер
- Анықтамаға негізделген генерация (1–3 сілтеме). Үш анықтамалық кескінге дейін пайдаланыңыз, осылайша модель позаны, жарықтандыруды, фонды және т.б. түрлендіру кезінде сәйкестікті, стильді немесе орынды сақтай алады.
- Жоғары визуалды дәлдік (өндіріске дайын нәтижелер). Шығарулар күшті егжей-тегжейлі және стилистикалық бақылауы бар жоғары ажыратымдылықты (1080p опциялары қолжетімді) мақсат етеді.
- Сәйкестік және көрініс сәйкестігі. Бірдей таңба(лар)ды немесе ортаны бірнеше ұрпақтар арасында сәйкестендіру үшін жасалған — көп түсірілген көрнекі бейнелер немесе кейіпкерге бағытталған активтер үшін пайдалы.
- Мультимодальды (мәтін + кескіндер) шақырулар. Композицияны, көңіл-күйді, киімді, камера бұрышын және т.б. басқару үшін табиғи тілдегі нұсқауларды анықтамалық кескіндермен біріктіріңіз.
- Кескін → сурет плюс мәтін → кескін жұмыс үрдістері. Үздіксіздікті сақтау үшін сілтемелерді пайдаланып суреттен кескінге (өңдеу/түрлендіру) және мәтіннен кескінге ретінде жұмыс істейді.
- Өнімділік деңгейі (Turbo) қолжетімді. “Gen-4 Image Turbo” нұсқасы анықтамаға негізделген мүмкіндіктерді сақтай отырып, құны мен жылдамдығын (мысалы, ~2.5× жылдамырақ) сатады.
- Басқару және қайталану мүмкіндігі. Әдеттегі API опциялары арақатынасының алдын ала орнатуларын, ажыратымдылықты (720p/1080p), қайталануға арналған тұқымды және белгілі бір кірістерді көрсету үшін сілтеме тегтерін қамтиды.
Техникалық мәліметтер
Кіру: Мәтін/сурет
Шығарылымдар: бейне
жұмыс процесі:
- Пайдаланушы керек-жарақтары: мәтіндік шақыру + 0–3 анықтамалық кескіндер (және қосымша бетперделер, негізгі кадрлар, камера қозғалысы нұсқаулары).
- Алдын ала өңдеу: сілтемелер нормаланған және кодталған; мәтін таңбаланған. Сәйкестік/стиль ендірулері шығарылады және қайта пайдалану үшін кэштеледі.
- Кондиционерлеу: мәтін мен анықтамалық ендірулер мультимодальды жүйеде біріктірілген; қосымша басқару сигналдары (поза, тереңдік, маска) қоса беріледі.
- Сынама алу/деноизизация: дешифратор кескінді (немесе бейнеге арналған кадрлар тізбегін) шығаратын итерацияларды (диффузия қадамдарын) өшіреді.
gen4_image — нақты шектеулер
Уақытша/қозғалыс жиегі жағдайлары. Рецензенттер мен жасаушылар кездейсоқ қозғалыс артефактілері, тақ уақытша динамика (жасалған клиптердегі ақаулар ерте/кеш) және өте күрделі көп актерлі хореографиядағы сәтсіздіктер туралы хабарлайды — мақсатты көріністермен сынақ.
Есептеу, құн және кезек. Жоғары сапалы кескін→бейне генерациясы GPU ауыр; пайдаланушылар жаппай өндіріс үшін маңызды болуы мүмкін кезек уақыты мен құны/көрсету үшін есеп береді. Бюджетті/өткізу көлемін сәйкесінше жоспарлаңыз.
Шығармашылық келіссөздер мен таза көркемдік үлгілер. Gen-4 күші - консистенциясы; Егер сізге жоғары стильдендірілген, кескіндемелік немесе «таңқаларлық» эстетикалық нәтижелер қажет болса, Midjourney немесе бапталған SDXL бақылау нүктелері таңдаулы өнер бағыттарын бере алады.
Канондық қолдану жағдайлары
- Өндіріс алдындағы және сюжеттік тақта: анықтамалық фотосуреттерден стильге сәйкес келетін кейіпкер/көрініс нұсқаларын жылдам жасаңыз.
- Маркетинг және мазмұнды құру: кейіпкерлердің суреттерін, анимациялық әлеуметтік клиптерді және тұрақты бренд кейіпкерлері бар науқандық активтерді жылдам өндіру. (ҰҚЖ кәсіпорын мысалдарын, соның ішінде тікелей турлар мен музыкалық бейнелерді тізімдейді.)
- Ойын/актив прототипі және виртуалды сынап көру: шағын анықтамалар жиынтығынан бірнеше камера бұрыштарын, киім нұсқаларын және қоршаған орта тұжырымдамаларын жасаңыз.
Басқа модельдермен салыстыру
- gen4_image→ ең жақсы қажет кезде анықтамалық / сәйкестік (бір таңба немесе нысан суреттер бойынша бірдей сақталады) және қалаған кезде сурет→бейне және көп ату құбырлары.
- DALL·E 3 → ең жақсы кескінге жылдам дәлдік және сөйлесу ChatGPT басқаратын өңдеу ағыны және кірістірілген қауіпсіздік/тексеру жұмысы үшін.
- SDXL (Тұрақты диффузиялық отбасы) → ең жақсы ашық үлгілерді, жергілікті/теңшелетін дәл реттеуді және шығынды икемді орналастыруды қаласаңыз.
- Орташа сапар → ең жақсы жоғары стильдендірілген, көркемдік жағынан ұнамды рендерлер және қауымдастық басқаратын күшті алдын ала орнатулар / «стильдеу» басқару элементтері үшін.
- Runway Gen-4 және ByteDance Seedream 4.0 / Google "Nano Banana" үлгілері: бәсекелестердің соңғы шығарылымдары (мысалы, Seedream 4.0) атап өтіледі ультра жылдам көрсету және көп сілтемелерді өңдеу коммерциялық жасаушыларға бағытталған; ҰҚЖ-ның артықшылығы - тығыз біріктірілген кескін→бейне құбыры және өндіріске бағытталған басқару элементтері, сонымен қатар жетілген API және SDK экожүйесі.
Қалай қоңырау шалуға болады gen4_image CometAPI ұсынған API
| баға | $0.32000 |
Қажетті қадамдар
- Жүйеге кіріңіз cometapi.com. Егер сіз әлі біздің пайдаланушы болмасаңыз, алдымен тіркеліңіз
- Интерфейстің кіру тіркелгі деректерінің API кілтін алыңыз. Жеке орталықтағы API токеніндегі «Токенді қосу» түймесін басыңыз, таңбалауыш кілтін алыңыз: sk-xxxxx және жіберіңіз.
- Осы сайттың URL мекенжайын алыңыз: https://api.cometapi.com/
Пайдалану әдісі
- API сұрауын жіберу және сұрау мәтінін орнату үшін «gen4_image» соңғы нүктесін таңдаңыз. Сұраныс әдісі мен сұрау мәтіні API doc веб-сайтымыздан алынған. Біздің веб-сайт сізге ыңғайлы болу үшін Apifox тестін ұсынады.
- Ауыстыру тіркелгіңізден нақты CometAPI кілтімен.
- Мазмұн өрісіне сұрағыңызды немесе сұрауыңызды енгізіңіз — үлгі осыған жауап береді.
- . Жасалған жауапты алу үшін API жауабын өңдеңіз.
CometAPI үздіксіз тасымалдау үшін толық үйлесімді REST API қамтамасыз етеді. Негізгі мәліметтер API құжаты:
- Соңғы нүкте:
https://api.cometapi.com/runwayml/v1/text_to_image - Үлгі параметрі:
gen4_image - Түпнұсқалық растама:
Bearer YOUR_CometAPI_API_KEY - Мазмұн түрі:
application/json.
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \
--header 'X-Runway-Version: 2024-11-06' \
--header 'Authorization: {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{
"promptText": "cat",
"ratio": "1920:1080",
"seed": 4294967295,
"model": "gen4_image",
"referenceImages": ,
"contentModeration": {
"publicFigureThreshold": "auto"
}
}'
Сондай-ақ, қараңыз Ұшу жолағы/екінші акт
