Runway/gen4_image API

gen4_billede er Runways flagskibsmodel inden for multimodal billedgenerering i Gen-4-familien, der understøtter anmodet generation plus visuelle referencer (du kan “@omtale” referencebilleder) for at producere yderst kontrollerbare, stilistisk ensartede output til billede- og billede→video-pipelines.

Introduktion — hvad Gen-4-billede is

gen4_billede er Runways fjerde generation af visuelle generative modeller, der er udviklet til at tage tekstprompts + visuelle referencer og producere stillbilleder i høj kvalitet eller medieklare billeder, der bevarer identitet og stil på tværs af vinkler og belysning. Modellen præsenteres som en del af en bredere Gen-4-suite (inklusive videovarianter som f.eks. gen4_turbo) og er eksplicit designet til kreativ produktion — f.eks. ensartet karaktergengivelse, produktfotografering i stor skala, virtuel prøvevisning og generering af spilaktiver.

Nøglefunktioner

Referencebaseret generation (1-3 refs). Brug op til tre referencebilleder, så modellen kan bevare identitet, stil eller placering, mens den transformerer pose, belysning, baggrund osv.
Høj visuel kvalitet (produktionsklare output). Outputtet er rettet mod høj opløsning (1080p-muligheder er tilgængelige) med stærke detaljer og stilistisk kontrol.
Identitet og scenekonsistens. Designet til at holde den/de samme karakter(er) eller det samme miljø ensartet på tværs af flere generationer — nyttigt til grafik med flere optagelser eller karaktercentrerede elementer.
Multimodale (tekst + billeder) prompts. Kombinér instruktioner i naturligt sprog med referencebilleder for at styre komposition, stemning, tøj, kameravinkel osv.
Billede → billede plus tekst → billed-arbejdsgange. Fungerer som billede-til-billede (rediger/transformer) og som tekst-til-billede ved hjælp af referencer for at opretholde kontinuitet.
Ydelsesniveau (Turbo) tilgængeligt. En "Gen-4 Image Turbo"-variant kombinerer pris og hastighed (f.eks. ~2.5 gange hurtigere), samtidig med at de referencedrevne funktioner bevares.
Kontroller og reproducerbarhed. Typiske API-muligheder inkluderer forudindstillinger for billedformat, opløsning (720p/1080p), seed for reproducerbarhed og referencetags, der peger på specifikke input.

Tekniske detaljer

Input: Tekst/Billede

Udgange: Billede

workflow:

Brugerforsyninger: tekstprompt + 0-3 referencebilleder (og valgfri masker, keyframes, kamerabevægelsesinstruktioner).
ForbearbejdningReferencer normaliseres og kodes; tekst tokeniseres. Identitets-/stilindlejringer udtrækkes og cachelagres til genbrug.
ConditioningTekst- og referenceindlejringer er integreret i den multimodale rygrad; valgfrie kontrolsignaler (positur, dybde, maske) er tilknyttet.
Prøveudtagning / støjfjerningDekoderen kører støjreducerende iterationer (diffusionstrin), der producerer et billede (eller en sekvens af billeder til video).

gen4_image — konkrete grænser

Temporale / bevægelseskanttilfælde. Anmeldere og skabere rapporterer lejlighedsvise bevægelsesartefakter, mærkelig tidsmæssig dynamik (fejl tidligt/sent i genererede klip) og fejl i meget kompleks koreografi med flere skuespillere – test med dine målscener.

Beregning, omkostninger og kø. Generering af billeder og video i høj kvalitet kræver meget GPU; brugerne rapporterer køtider og omkostninger/per gengivelse, der kan være betydelige ved masseproduktion. Planlæg budget/gennemstrømning i overensstemmelse hermed.

Kreative afvejninger vs. rene kunstneriske modeller. Gen-4's styrke er konsistens; hvis du har brug for meget stiliserede, maleriske eller "overraskende" æstetiske resultater, kan Midjourney eller tunede SDXL-checkpoints give foretrukne kunstneriske retninger.

Kanoniske brugsscenarier

Præproduktion og storyboarding: Opret hurtigt stilkonsistente karakter-/scenevarianter ud fra referencefotos.
Marketing og indholdsgenerering: hurtig produktion af heltebilleder, animerede sociale klip og kampagnematerialer med ensartede brandkarakterer. (Runway viser eksempler på virksomheder, herunder live-ture og musikvideoer.)
Prototyping af spil/aktiver og virtuel prøveudtagning: Generer flere kameravinkler, outfitvarianter og miljøkoncepter ud fra et lille sæt referencer.

Sammenligning med andre modeller

gen4_billede→ bedst når du har brug for det reference-/identitetskonsistens (enkelt tegn eller objekt holdes det samme på tværs af optagelser) og når du vil billede → video og flerskudsrørledninger.
DALL·E 3 → bedst for præcis prompt-til-billede-nøjagtighed og et konversationsbaseret ChatGPT-drevet redigeringsflow plus indbygget sikkerheds-/proveniensarbejde.
SDXL (Stabil Diffusionsfamilie) → bedst når du ønsker åbne modeller, lokal/tilpasset finjustering og omkostningsfleksibel implementering.
Midtvejs → bedst til meget stiliserede, kunstnerisk tiltalende gengivelser og stærke fællesskabsdrevne forudindstillinger / "stiliserings"-kontroller.
Runway Gen-4 vs. ByteDance Seedream 4.0 / Google “Nano Banana”-modeller: nylige konkurrentlanceringer (f.eks. Seedream 4.0) understreger ultrahurtig rendering og håndtering af flere referencer rettet mod kommercielle skabere; Runways fordel er en tæt integreret billed-→video-pipeline og produktionsorienterede kontroller plus et modent API- og SDK-økosystem.

Sådan ringer du gen4_billede API fra CometAPI


Pris	$0.32000

Påkrævede trin

Log ind på cometapi.com. Hvis du ikke er vores bruger endnu, bedes du registrere dig først
Få adgangslegitimations-API-nøglen til grænsefladen. Klik på "Tilføj token" ved API-tokenet i det personlige center, få token-nøglen: sk-xxxxx og send.
Hent url'en til dette websted: https://api.cometapi.com/

Brug metoden

Vælg "gen4_image"-slutpunktet for at sende API-anmodningen, og angiv anmodningsteksten. Anmodningsmetoden og anmodningsteksten kan hentes fra vores hjemmesides API-dokumentation. Vores hjemmeside tilbyder også en Apifox-test for din bekvemmelighed.
Erstatte med din faktiske CometAPI-nøgle fra din konto.
Indsæt dit spørgsmål eller din anmodning i indholdsfeltet – det er det, modellen vil reagere på.
. Behandle API-svaret for at få det genererede svar.

CometAPI leverer en fuldt kompatibel REST API – til problemfri migrering. Vigtige detaljer til API-dok:

Endpoint: https://api.cometapi.com/runwayml/v1/text_to_image
Modelparameter: gen4_image
Godkendelse: Bearer YOUR_CometAPI_API_KEY
Indholdstype: application/json .

curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \  
--header 'X-Runway-Version: 2024-11-06' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"promptText": "cat",  
"ratio": "1920:1080",  
"seed": 4294967295,  
"model": "gen4_image",  
"referenceImages": ,  
"contentModeration": {  
"publicFigureThreshold": "auto"  
}  
}'

Se også Landingsbane/Akt_to