gen4_billede er Runways flagskibsmodel inden for multimodal billedgenerering i Gen-4-familien, der understøtter anmodet generation plus visuelle referencer (du kan “@omtale” referencebilleder) for at producere yderst kontrollerbare, stilistisk ensartede output til billede- og billede→video-pipelines.
Introduktion — hvad Gen-4-billede is
gen4_billede er Runways fjerde generation af visuelle generative modeller, der er udviklet til at tage tekstprompts + visuelle referencer og producere stillbilleder i høj kvalitet eller medieklare billeder, der bevarer identitet og stil på tværs af vinkler og belysning. Modellen præsenteres som en del af en bredere Gen-4-suite (inklusive videovarianter som f.eks. gen4_turbo) og er eksplicit designet til kreativ produktion — f.eks. ensartet karaktergengivelse, produktfotografering i stor skala, virtuel prøvevisning og generering af spilaktiver.
Nøglefunktioner
- Referencebaseret generation (1-3 refs). Brug op til tre referencebilleder, så modellen kan bevare identitet, stil eller placering, mens den transformerer pose, belysning, baggrund osv.
- Høj visuel kvalitet (produktionsklare output). Outputtet er rettet mod høj opløsning (1080p-muligheder er tilgængelige) med stærke detaljer og stilistisk kontrol.
- Identitet og scenekonsistens. Designet til at holde den/de samme karakter(er) eller det samme miljø ensartet på tværs af flere generationer — nyttigt til grafik med flere optagelser eller karaktercentrerede elementer.
- Multimodale (tekst + billeder) prompts. Kombinér instruktioner i naturligt sprog med referencebilleder for at styre komposition, stemning, tøj, kameravinkel osv.
- Billede → billede plus tekst → billed-arbejdsgange. Fungerer som billede-til-billede (rediger/transformer) og som tekst-til-billede ved hjælp af referencer for at opretholde kontinuitet.
- Ydelsesniveau (Turbo) tilgængeligt. En "Gen-4 Image Turbo"-variant kombinerer pris og hastighed (f.eks. ~2.5 gange hurtigere), samtidig med at de referencedrevne funktioner bevares.
- Kontroller og reproducerbarhed. Typiske API-muligheder inkluderer forudindstillinger for billedformat, opløsning (720p/1080p), seed for reproducerbarhed og referencetags, der peger på specifikke input.
Tekniske detaljer
Input: Tekst/Billede
Udgange: Billede
workflow:
- Brugerforsyninger: tekstprompt + 0-3 referencebilleder (og valgfri masker, keyframes, kamerabevægelsesinstruktioner).
- ForbearbejdningReferencer normaliseres og kodes; tekst tokeniseres. Identitets-/stilindlejringer udtrækkes og cachelagres til genbrug.
- ConditioningTekst- og referenceindlejringer er integreret i den multimodale rygrad; valgfrie kontrolsignaler (positur, dybde, maske) er tilknyttet.
- Prøveudtagning / støjfjerningDekoderen kører støjreducerende iterationer (diffusionstrin), der producerer et billede (eller en sekvens af billeder til video).
gen4_image — konkrete grænser
Temporale / bevægelseskanttilfælde. Anmeldere og skabere rapporterer lejlighedsvise bevægelsesartefakter, mærkelig tidsmæssig dynamik (fejl tidligt/sent i genererede klip) og fejl i meget kompleks koreografi med flere skuespillere – test med dine målscener.
Beregning, omkostninger og kø. Generering af billeder og video i høj kvalitet kræver meget GPU; brugerne rapporterer køtider og omkostninger/per gengivelse, der kan være betydelige ved masseproduktion. Planlæg budget/gennemstrømning i overensstemmelse hermed.
Kreative afvejninger vs. rene kunstneriske modeller. Gen-4's styrke er konsistens; hvis du har brug for meget stiliserede, maleriske eller "overraskende" æstetiske resultater, kan Midjourney eller tunede SDXL-checkpoints give foretrukne kunstneriske retninger.
Kanoniske brugsscenarier
- Præproduktion og storyboarding: Opret hurtigt stilkonsistente karakter-/scenevarianter ud fra referencefotos.
- Marketing og indholdsgenerering: hurtig produktion af heltebilleder, animerede sociale klip og kampagnematerialer med ensartede brandkarakterer. (Runway viser eksempler på virksomheder, herunder live-ture og musikvideoer.)
- Prototyping af spil/aktiver og virtuel prøveudtagning: Generer flere kameravinkler, outfitvarianter og miljøkoncepter ud fra et lille sæt referencer.
Sammenligning med andre modeller
- gen4_billede→ bedst når du har brug for det reference-/identitetskonsistens (enkelt tegn eller objekt holdes det samme på tværs af optagelser) og når du vil billede → video og flerskudsrørledninger.
- DALL·E 3 → bedst for præcis prompt-til-billede-nøjagtighed og et konversationsbaseret ChatGPT-drevet redigeringsflow plus indbygget sikkerheds-/proveniensarbejde.
- SDXL (Stabil Diffusionsfamilie) → bedst når du ønsker åbne modeller, lokal/tilpasset finjustering og omkostningsfleksibel implementering.
- Midtvejs → bedst til meget stiliserede, kunstnerisk tiltalende gengivelser og stærke fællesskabsdrevne forudindstillinger / "stiliserings"-kontroller.
- Runway Gen-4 vs. ByteDance Seedream 4.0 / Google “Nano Banana”-modeller: nylige konkurrentlanceringer (f.eks. Seedream 4.0) understreger ultrahurtig rendering og håndtering af flere referencer rettet mod kommercielle skabere; Runways fordel er en tæt integreret billed-→video-pipeline og produktionsorienterede kontroller plus et modent API- og SDK-økosystem.
Sådan ringer du gen4_billede API fra CometAPI
| Pris | $0.32000 |
Påkrævede trin
- Log ind på cometapi.com. Hvis du ikke er vores bruger endnu, bedes du registrere dig først
- Få adgangslegitimations-API-nøglen til grænsefladen. Klik på "Tilføj token" ved API-tokenet i det personlige center, få token-nøglen: sk-xxxxx og send.
- Hent url'en til dette websted: https://api.cometapi.com/
Brug metoden
- Vælg "gen4_image"-slutpunktet for at sende API-anmodningen, og angiv anmodningsteksten. Anmodningsmetoden og anmodningsteksten kan hentes fra vores hjemmesides API-dokumentation. Vores hjemmeside tilbyder også en Apifox-test for din bekvemmelighed.
- Erstatte med din faktiske CometAPI-nøgle fra din konto.
- Indsæt dit spørgsmål eller din anmodning i indholdsfeltet – det er det, modellen vil reagere på.
- . Behandle API-svaret for at få det genererede svar.
CometAPI leverer en fuldt kompatibel REST API – til problemfri migrering. Vigtige detaljer til API-dok:
- Endpoint:
https://api.cometapi.com/runwayml/v1/text_to_image - Modelparameter:
gen4_image - Godkendelse:
Bearer YOUR_CometAPI_API_KEY - Indholdstype:
application/json.
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \
--header 'X-Runway-Version: 2024-11-06' \
--header 'Authorization: {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{
"promptText": "cat",
"ratio": "1920:1080",
"seed": 4294967295,
"model": "gen4_image",
"referenceImages": ,
"contentModeration": {
"publicFigureThreshold": "auto"
}
}'
Se også Landingsbane/Akt_to
