Runway/gen4_image API

gen4_image ist Runways Flaggschiff-Modell für multimodale Bilderzeugung in der Gen-4-Familie, das unterstützt Angeleitete Generierung plus visuelle Referenzen (Sie können Referenzbilder mit „@erwähnen“), um hochgradig kontrollierbare, stilistisch konsistente Ausgaben für Bild- und Bild→Video-Pipelines zu erzeugen.

Einleitung – was Gen-4-Bild is

gen4_image ist Runways vierte Generation visueller generativer Modellfamilie, entwickelt, um Textaufforderungen + visuelle Referenzen und produzieren hochauflösende Standbilder oder medienfertige Bilder, die Identität kombiniert mit einem nachhaltigen Materialprofil. Stil über Winkel und Beleuchtung. Das Modell wird als Teil einer breiteren Gen-4-Suite präsentiert (einschließlich Videovarianten wie gen4_turbo) und ist ausdrücklich für kreative Produktion – z. B. konsistente Charakterdarstellung, maßstabsgetreue Produktfotografie, virtuelles Anprobieren und Generierung von Spiel-Assets.

Hauptmerkmale:

Referenzbasierte Generierung (1–3 Referenzen). Verwenden Sie bis zu drei Referenzbilder, damit das Modell seine Identität, seinen Stil oder seinen Standort beibehalten kann, während Pose, Beleuchtung, Hintergrund usw. verändert werden.
Hohe visuelle Wiedergabetreue (produktionsreife Ausgaben). Die Ausgabe zielt auf eine hohe Auflösung (1080p-Optionen verfügbar) mit starker Detailgenauigkeit und stilistischer Kontrolle ab.
Identität und Szenenkonsistenz. Entwickelt, um dieselben Charaktere oder Umgebungen über mehrere Generationen hinweg konsistent zu halten – nützlich für Multi-Shot-Visuals oder charakterzentrierte Assets.
Multimodale Eingabeaufforderungen (Text + Bilder). Kombinieren Sie Anweisungen in natürlicher Sprache mit Referenzbildern, um Komposition, Stimmung, Kleidung, Kamerawinkel usw. zu steuern.
Bild → Bild plus Text → Bild-Workflows. Funktioniert als Bild-zu-Bild (Bearbeiten/Transformieren) und als Text-zu-Bild unter Verwendung von Referenzen, um die Kontinuität zu wahren.
Leistungsstufe (Turbo) verfügbar. Bei einer „Gen-4 Image Turbo“-Variante werden Kosten und Geschwindigkeit getauscht (z. B. ~2.5-mal schneller), während die referenzgesteuerten Funktionen erhalten bleiben.
Kontrollen und Reproduzierbarkeit. Zu den typischen API-Optionen gehören Voreinstellungen für das Seitenverhältnis, die Auflösung (720p/1080p), ein Seed für die Reproduzierbarkeit und Referenz-Tags zum Verweisen auf bestimmte Eingaben.

Technische Details

Eingang: Text/Bild

Ausgänge: Bild

Arbeitsablauf:

Benutzerbedarf: Textaufforderung + 0–3 Referenzbilder (und optionale Masken, Keyframes, Anweisungen zur Kamerabewegung).
Vorverarbeitung: Referenzen werden normalisiert und codiert; Text wird tokenisiert. Identitäts-/Stileinbettungen werden extrahiert und zur Wiederverwendung zwischengespeichert.
Conditioning: Text- und Referenzeinbettungen werden im multimodalen Backbone zusammengeführt; optionale Steuersignale (Pose, Tiefe, Maske) werden angehängt.
Sampling / Rauschunterdrückung: Der Decoder führt Entrauschungsiterationen (Diffusionsschritte) aus und erzeugt ein Bild (oder eine Bildsequenz für ein Video).

gen4_image – konkrete Grenzen

Zeitliche/Bewegungs-Randfälle. Rezensenten und Entwickler berichten von gelegentlichen Bewegungsartefakten, merkwürdiger zeitlicher Dynamik (Störungen am Anfang/Ende der generierten Clips) und Fehlern bei sehr komplexen Choreografien mit mehreren Schauspielern – testen Sie dies mit Ihren Zielszenen.

Berechnung, Kosten und Warteschlangen. Die Generierung hochwertiger Bilder und Videos erfordert viel GPU-Leistung. Benutzer berichten von Wartezeiten und Kosten pro Rendering, die bei Massenproduktionen erheblich sein können. Planen Sie Budget und Durchsatz entsprechend.

Kreative Kompromisse vs. reine Kunstmodelle. Die Stärke von Gen-4 liegt in der Konsistenz. Wenn Sie stark stilisierte, malerische oder „überraschende“ ästhetische Ergebnisse benötigen, können Midjourney oder abgestimmte SDXL-Checkpoints bevorzugte künstlerische Richtungen hervorbringen.

Kanonische Anwendungsfälle

Vorproduktion und Storyboarding: Erstellen Sie schnell stilkonsistente Charakter-/Szenenvarianten aus Referenzfotos.
Marketing & Content-Erstellung: Schnelle Produktion von Hero Images, animierten Social Clips und Kampagnen-Assets mit konsistenten Markencharakteren. (Runway listet Unternehmensbeispiele auf, darunter Live-Touren und Musikvideos.)
Spiel-/Asset-Prototyping und virtuelles Anprobieren: Generieren Sie aus einer kleinen Menge an Referenzen mehrere Kamerawinkel, Outfitvarianten und Umgebungskonzepte.

Vergleich mit anderen Modellen

gen4_image→ am besten wenn du brauchst Referenz-/Identitätskonsistenz (einzelne Figur oder Objekt bleibt über mehrere Aufnahmen hinweg gleich) und wenn Sie möchten Bild→Video und Multi-Shot-Pipelines.
DALL·E 3 → am besten für eine hohe Wiedergabetreue von der Eingabeaufforderung zum Bild und einen dialogorientierten, ChatGPT-gesteuerten Bearbeitungsfluss sowie integrierte Sicherheits-/Herkunftsfunktionen.
SDXL (Stable Diffusion-Familie) → am besten wenn Sie offene Modelle, lokale/benutzerdefinierte Feinabstimmung und kostenflexible Bereitstellung wünschen.
Midtravel → am besten für stark stilisierte, künstlerisch ansprechende Renderings und leistungsstarke, von der Community gesteuerte Voreinstellungen/„Stilisierungs“-Steuerelemente.
Runway Gen-4 vs. ByteDance Seedream 4.0 / Google-Modelle vom Typ „Nano Banana“: Aktuelle Produkteinführungen von Wettbewerbern (z. B. Seedream 4.0) betonen ultraschnelles Rendering und Multi-Referenz-Handling richtet sich an kommerzielle Entwickler; der Vorteil von Runway liegt in einer eng integrierten Bild-Video-Pipeline und produktionsorientierten Steuerelementen sowie einem ausgereiften API- und SDK-Ökosystem.

Wie man anruft gen4_image API von CometAPI


Preis	$0.32000

Erforderliche Schritte

Einloggen in cometapi.comWenn Sie noch nicht unser Benutzer sind, registrieren Sie sich bitte zuerst
Holen Sie sich den API-Schlüssel für die Zugangsdaten der Schnittstelle. Klicken Sie im persönlichen Bereich beim API-Token auf „Token hinzufügen“, holen Sie sich den Token-Schlüssel: sk-xxxxx und senden Sie ihn ab.
Holen Sie sich die URL dieser Site: https://api.cometapi.com/

Methode verwenden

Wählen Sie den Endpunkt „gen4_image“, um die API-Anfrage zu senden und den Anfragetext festzulegen. Die Anfragemethode und der Anfragetext finden Sie in der API-Dokumentation unserer Website. Unsere Website bietet außerdem einen Apifox-Test für Ihren Komfort.
Ersetzen mit Ihrem aktuellen CometAPI-Schlüssel aus Ihrem Konto.
Geben Sie Ihre Frage oder Anfrage in das Inhaltsfeld ein – das Modell antwortet darauf.
. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.

CometAPI bietet eine vollständig kompatible REST-API für eine nahtlose Migration. Wichtige Details zu API-Dokument:

Endpunkt: https://api.cometapi.com/runwayml/v1/text_to_image
Modellparameter: gen4_image
Authentifizierung: Bearer YOUR_CometAPI_API_KEY
Content-Type: application/json .

curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \  
--header 'X-Runway-Version: 2024-11-06' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"promptText": "cat",  
"ratio": "1920:1080",  
"seed": 4294967295,  
"model": "gen4_image",  
"referenceImages": ,  
"contentModeration": {  
"publicFigureThreshold": "auto"  
}  
}'

Web Link Laufsteg/Akt_zwei