gen4_圖像 是 Runway Gen-4 系列中的旗艦多模態影像生成模型,支援 提示生成加上視覺參考 (您可以「@mention」參考影像)為影像和影像→視訊管道產生高度可控、風格一致的輸出。
簡介 — 什麼 Gen-4 影像 is
gen4_圖像 是 Runway 的第四代視覺生成模型系列,旨在 文字提示+視覺參考 並製作高保真靜態圖像或媒體就緒幀,以保存 身分 樣式 跨角度和光照。該模型是更廣泛的 Gen-4 套件的一部分(包括視頻變體,例如 gen4_turbo)並且明確設計用於 創意製作 — 例如,一致的角色渲染、大規模產品攝影、虛擬試穿和遊戲資產生成。
主要特徵
- 基於參考的生成(1-3 個參考)。 使用最多三張參考影像,以便模型在改變姿勢、燈光、背景等時可以保留身份、風格或位置。
- 高視覺保真度(可用於生產的輸出)。 輸出目標為高解析度(可用 1080p 選項),具有強大的細節和風格控制。
- 身份和場景的一致性。 旨在使相同的角色或環境在多代中保持一致 - 適用於多鏡頭視覺效果或以角色為中心的資產。
- 多模式(文字+圖像)提示。 將自然語言指令與參考影像結合,以控制構圖、情緒、服裝、拍攝角度等。
- 圖片→圖像加上文字→圖像工作流程。 以圖像到圖像(編輯/轉換)和文字到圖像的形式使用引用來保持連續性。
- 性能層(Turbo)可用。 「Gen-4 Image Turbo」變體在保留參考驅動功能的同時,犧牲了成本和速度(例如,速度提高了約 2.5 倍)。
- 控制和可重複性。 典型的 API 選項包括寬高比預設、解析度(720p/1080p)、可重複性的種子以及指向特定輸入的參考標籤。
技術細節
輸入: 文字/圖像
輸出: 圖片
工作流程:
- 用戶供給:文字提示+0-3張參考影像(以及選購的遮罩、關鍵影格、攝影機運動指令)。
- 預處理:引用被規範化並編碼;文本被標記化。身份/樣式嵌入被提取並緩存以供重用。
- 空調:文字和參考嵌入在多模態主幹中融合;附加可選的控制訊號(姿勢、深度、掩模)。
- 採樣/去噪:解碼器運行去噪迭代(擴散步驟)產生影像(或影片的幀序列)。
gen4_image — 具體限制
時間/運動邊緣情況。 審查者和創作者報告了偶爾出現的運動偽影、奇怪的時間動態(生成的剪輯中早期/晚期的故障)以及非常複雜的多演員編排的失敗 - 使用目標場景進行測試。
計算、成本和排隊。 高品質影像→影片產生對 GPU 的需求很大;使用者反映排隊時間和每次渲染的成本對於量產來說可能非常高。請相應地規劃預算/吞吐量。
創造性的權衡與純粹的藝術模型。 Gen-4 的優點在於一致性;如果您需要高度風格化、繪畫性或「令人驚訝」的美學產出,Midjourney 或調整後的 SDXL 檢查點可能會產生首選的藝術方向。
規範用例
- 前期製作和故事板: 根據參考照片快速建立風格一致的角色/場景變體。
- 行銷和內容生成: 快速製作具有一致品牌特徵的英雄形象、動畫社群媒體短片和宣傳素材。 (Runway 列舉了包括現場巡迴演出和音樂錄影帶在內的企業案例。)
- 遊戲/資產原型設計與虛擬試用: 從一小組參考資料中產生多個攝影機角度、服裝變體和環境概念。
與其他模型的比較
- gen4_image→最佳 當你需要的時候 引用/身分一致性 (單一角色或物體在各個鏡頭中保持不變)當你想 圖片→影片 以及多鏡頭管道。
- DALL·E 3 → 最佳 實現從提示到影像的嚴格保真度和對話式 ChatGPT 驅動的編輯流程以及內建的安全/出處工作。
- SDXL(穩定擴散家族)→最佳 當您想要開放模型、本地/自訂微調和成本靈活的部署。
- 旅途中 → 最佳 具有高度風格化、藝術感十足的渲染和強大的社群驅動預設/「風格化」控制。
- Runway Gen-4 與位元組跳動 Seedream 4.0 / Google「奈米香蕉」類型模型: 最近競爭對手推出的產品(例如 Seedream 4.0)強調 超快速渲染和多參考處理 針對商業創作者;Runway 的優點在於緊密整合的影像→視訊管道和麵向生產的控制以及成熟的 API 和 SDK 生態系統。
如何致電 gen4_圖像 來自 CometAPI 的 API
| 價格 | $0.32000 |
所需步驟
- 登錄到 cometapi.com。如果您還不是我們的用戶,請先註冊
- 取得介面的存取憑證API key。在個人中心的API token處點選“新增Token”,取得Token金鑰:sk-xxxxx並提交。
- 取得此網站的 URL: https://api.cometapi.com/
使用方法
- 選擇“gen4_image”端點發送 API 請求並設定請求體。請求方法和請求體可從我們網站的 API 文件取得。為了方便您使用,我們網站也提供了 Apifox 測試。
- 代替使用您帳戶中的實際 CometAPI 金鑰。
- 將您的問題或請求插入內容欄位 - 這是模型將會回應的內容。
- 。處理 API 回應以取得產生的答案。
CometAPI 提供完全相容的 REST API,以實現無縫遷移。關鍵細節如下: API 文件:
- 終點:
https://api.cometapi.com/runwayml/v1/text_to_image - 模型參數:
gen4_image - 驗證:
Bearer YOUR_CometAPI_API_KEY - 內容類型:
application/json.
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \
--header 'X-Runway-Version: 2024-11-06' \
--header 'Authorization: {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{
"promptText": "cat",
"ratio": "1920:1080",
"seed": 4294967295,
"model": "gen4_image",
"referenceImages": ,
"contentModeration": {
"publicFigureThreshold": "auto"
}
}'
也可以看看 跑道/第二幕
