Runway/gen4_image API

CometAPI
AnnaSep 13, 2025
Runway/gen4_image API

gen4_billede er Runways flagskibsmodel inden for multimodal billedgenerering i Gen-4-familien, der understøtter anmodet generation plus visuelle referencer (du kan “@omtale” referencebilleder) for at producere yderst kontrollerbare, stilistisk ensartede output til billede- og billede→video-pipelines.

Introduktion — hvad Gen-4-billede is

gen4_billede er Runways fjerde generation af visuelle generative modeller, der er udviklet til at tage tekstprompts + visuelle referencer og producere stillbilleder i høj kvalitet eller medieklare billeder, der bevarer identitet og stil på tværs af vinkler og belysning. Modellen præsenteres som en del af en bredere Gen-4-suite (inklusive videovarianter som f.eks. gen4_turbo) og er eksplicit designet til kreativ produktion — f.eks. ensartet karaktergengivelse, produktfotografering i stor skala, virtuel prøvevisning og generering af spilaktiver.

Nøglefunktioner

  • Referencebaseret generation (1-3 refs). Brug op til tre referencebilleder, så modellen kan bevare identitet, stil eller placering, mens den transformerer pose, belysning, baggrund osv.
  • Høj visuel kvalitet (produktionsklare output). Outputtet er rettet mod høj opløsning (1080p-muligheder er tilgængelige) med stærke detaljer og stilistisk kontrol.
  • Identitet og scenekonsistens. Designet til at holde den/de samme karakter(er) eller det samme miljø ensartet på tværs af flere generationer — nyttigt til grafik med flere optagelser eller karaktercentrerede elementer.
  • Multimodale (tekst + billeder) prompts. Kombinér instruktioner i naturligt sprog med referencebilleder for at styre komposition, stemning, tøj, kameravinkel osv.
  • Billede → billede plus tekst → billed-arbejdsgange. Fungerer som billede-til-billede (rediger/transformer) og som tekst-til-billede ved hjælp af referencer for at opretholde kontinuitet.
  • Ydelsesniveau (Turbo) tilgængeligt. En "Gen-4 Image Turbo"-variant kombinerer pris og hastighed (f.eks. ~2.5 gange hurtigere), samtidig med at de referencedrevne funktioner bevares.
  • Kontroller og reproducerbarhed. Typiske API-muligheder inkluderer forudindstillinger for billedformat, opløsning (720p/1080p), seed for reproducerbarhed og referencetags, der peger på specifikke input.

Tekniske detaljer

Input: Tekst/Billede

Udgange: Billede

workflow:

  1. Brugerforsyninger: tekstprompt + 0-3 referencebilleder (og valgfri masker, keyframes, kamerabevægelsesinstruktioner).
  2. ForbearbejdningReferencer normaliseres og kodes; tekst tokeniseres. Identitets-/stilindlejringer udtrækkes og cachelagres til genbrug.
  3. ConditioningTekst- og referenceindlejringer er integreret i den multimodale rygrad; valgfrie kontrolsignaler (positur, dybde, maske) er tilknyttet.
  4. Prøveudtagning / støjfjerningDekoderen kører støjreducerende iterationer (diffusionstrin), der producerer et billede (eller en sekvens af billeder til video).

gen4_image — konkrete grænser

Temporale / bevægelseskanttilfælde. Anmeldere og skabere rapporterer lejlighedsvise bevægelsesartefakter, mærkelig tidsmæssig dynamik (fejl tidligt/sent i genererede klip) og fejl i meget kompleks koreografi med flere skuespillere – test med dine målscener.

Beregning, omkostninger og kø. Generering af billeder og video i høj kvalitet kræver meget GPU; brugerne rapporterer køtider og omkostninger/per gengivelse, der kan være betydelige ved masseproduktion. Planlæg budget/gennemstrømning i overensstemmelse hermed.

Kreative afvejninger vs. rene kunstneriske modeller. Gen-4's styrke er konsistens; hvis du har brug for meget stiliserede, maleriske eller "overraskende" æstetiske resultater, kan Midjourney eller tunede SDXL-checkpoints give foretrukne kunstneriske retninger.

Kanoniske brugsscenarier

  • Præproduktion og storyboarding: Opret hurtigt stilkonsistente karakter-/scenevarianter ud fra referencefotos.
  • Marketing og indholdsgenerering: hurtig produktion af heltebilleder, animerede sociale klip og kampagnematerialer med ensartede brandkarakterer. (Runway viser eksempler på virksomheder, herunder live-ture og musikvideoer.)
  • Prototyping af spil/aktiver og virtuel prøveudtagning: Generer flere kameravinkler, outfitvarianter og miljøkoncepter ud fra et lille sæt referencer.

Sammenligning med andre modeller

  • gen4_billede→ bedst når du har brug for det reference-/identitetskonsistens (enkelt tegn eller objekt holdes det samme på tværs af optagelser) og når du vil billede → video og flerskudsrørledninger.
  • DALL·E 3 → bedst for præcis prompt-til-billede-nøjagtighed og et konversationsbaseret ChatGPT-drevet redigeringsflow plus indbygget sikkerheds-/proveniensarbejde.
  • SDXL (Stabil Diffusionsfamilie) → bedst når du ønsker åbne modeller, lokal/tilpasset finjustering og omkostningsfleksibel implementering.
  • Midtvejs → bedst til meget stiliserede, kunstnerisk tiltalende gengivelser og stærke fællesskabsdrevne forudindstillinger / "stiliserings"-kontroller.
  • Runway Gen-4 vs. ByteDance Seedream 4.0 / Google “Nano Banana”-modeller: nylige konkurrentlanceringer (f.eks. Seedream 4.0) understreger ultrahurtig rendering og håndtering af flere referencer rettet mod kommercielle skabere; Runways fordel er en tæt integreret billed-→video-pipeline og produktionsorienterede kontroller plus et modent API- og SDK-økosystem.

Sådan ringer du gen4_billede API fra CometAPI

Pris$0.32000

Påkrævede trin

  • Log ind på cometapi.com. Hvis du ikke er vores bruger endnu, bedes du registrere dig først
  • Få adgangslegitimations-API-nøglen til grænsefladen. Klik på "Tilføj token" ved API-tokenet i det personlige center, få token-nøglen: sk-xxxxx og send.
  • Hent url'en til dette websted: https://api.cometapi.com/

Brug metoden

  1. Vælg "gen4_image"-slutpunktet for at sende API-anmodningen, og angiv anmodningsteksten. Anmodningsmetoden og anmodningsteksten kan hentes fra vores hjemmesides API-dokumentation. Vores hjemmeside tilbyder også en Apifox-test for din bekvemmelighed.
  2. Erstatte med din faktiske CometAPI-nøgle fra din konto.
  3. Indsæt dit spørgsmål eller din anmodning i indholdsfeltet – det er det, modellen vil reagere på.
  4. . Behandle API-svaret for at få det genererede svar.

CometAPI leverer en fuldt kompatibel REST API – til problemfri migrering. Vigtige detaljer til  API-dok:

  • Endpoint: https://api.cometapi.com/runwayml/v1/text_to_image
  • Modelparameter: gen4_image
  • Godkendelse: Bearer YOUR_CometAPI_API_KEY
  • Indholdstype: application/json .
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \  
--header 'X-Runway-Version: 2024-11-06' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"promptText": "cat",  
"ratio": "1920:1080",  
"seed": 4294967295,  
"model": "gen4_image",  
"referenceImages": ,  
"contentModeration": {  
"publicFigureThreshold": "auto"  
}  
}'

Se også Landingsbane/Akt_to

Læs mere

500+ modeller i én API

Op til 20% rabat