API Runway/gen4_image

CometAPI
AnnaSep 13, 2025
API Runway/gen4_image

gen4_image là mô hình tạo hình ảnh đa phương thức hàng đầu của Runway trong gia đình Gen-4 hỗ trợ thế hệ được nhắc nhở cộng với tài liệu tham khảo trực quan (bạn có thể “@mention” tham chiếu hình ảnh) để tạo ra các đầu ra có khả năng kiểm soát cao, nhất quán về mặt phong cách cho các đường ống hình ảnh và hình ảnh→video.

Giới thiệu — cái gì Hình ảnh Gen-4 is

gen4_image là dòng mô hình tạo hình ảnh thế hệ thứ tư của Runway, được thiết kế để thực hiện lời nhắc văn bản + tài liệu tham khảo trực quan và tạo ra hình ảnh tĩnh có độ trung thực cao hoặc khung hình sẵn sàng cho phương tiện truyền thông giúp bảo quản bản sắcphong cách trên các góc độ và ánh sáng. Mô hình được trình bày như một phần của bộ Gen-4 rộng hơn (bao gồm các biến thể video như gen4_turbo) và được thiết kế rõ ràng cho sản xuất sáng tạo — ví dụ, kết xuất nhân vật nhất quán, chụp ảnh sản phẩm theo tỷ lệ, thử đồ ảo và tạo nội dung trò chơi.

Đặc tính nổi bật

  • Tạo dựa trên tài liệu tham khảo (1–3 tài liệu tham khảo). Sử dụng tối đa ba hình ảnh tham chiếu để người mẫu có thể giữ nguyên danh tính, phong cách hoặc địa điểm trong khi thay đổi tư thế, ánh sáng, nền, v.v.
  • Độ trung thực hình ảnh cao (đầu ra sẵn sàng để sản xuất). Đầu ra hướng đến độ phân giải cao (có sẵn tùy chọn 1080p) với độ chi tiết mạnh mẽ và khả năng kiểm soát phong cách.
  • Tính nhất quán của bản sắc và bối cảnh. Được thiết kế để giữ nguyên nhân vật hoặc môi trường qua nhiều thế hệ — hữu ích cho hình ảnh nhiều cảnh quay hoặc nội dung tập trung vào nhân vật.
  • Lời nhắc đa phương thức (văn bản + hình ảnh). Kết hợp hướng dẫn bằng ngôn ngữ tự nhiên với hình ảnh tham khảo để định hướng bố cục, tâm trạng, trang phục, góc máy ảnh, v.v.
  • Quy trình làm việc Hình ảnh → hình ảnh cộng với văn bản → hình ảnh. Hoạt động như chuyển đổi hình ảnh sang hình ảnh (chỉnh sửa/chuyển đổi) và chuyển đổi văn bản sang hình ảnh bằng cách sử dụng tham chiếu để duy trì tính liên tục.
  • Có sẵn phiên bản hiệu suất cao (Turbo). Biến thể “Gen-4 Image Turbo” cân bằng giữa chi phí và tốc độ (ví dụ: nhanh hơn ~2.5 lần) trong khi vẫn giữ nguyên các tính năng tham chiếu.
  • Kiểm soát và khả năng tái tạo. Các tùy chọn API điển hình bao gồm cài đặt trước tỷ lệ khung hình, độ phân giải (720p/1080p), hạt giống để tái tạo và thẻ tham chiếu để trỏ đến các đầu vào cụ thể.

Chi tiết kỹ thuật

Đầu vào: Văn bản/Hình ảnh

Kết quả đầu ra: Hình ảnh

quy trình làm việc:

  1. Vật tư người dùng: lời nhắc văn bản + 0–3 hình ảnh tham chiếu (và mặt nạ tùy chọn, khung hình chính, hướng dẫn chuyển động camera).
  2. Tiền xử lý: tham chiếu được chuẩn hóa và mã hóa; văn bản được mã hóa. Nhúng danh tính/kiểu được trích xuất và lưu vào bộ nhớ đệm để sử dụng lại.
  3. Điều: nhúng văn bản và tham chiếu được hợp nhất trong xương sống đa phương thức; các tín hiệu điều khiển tùy chọn (tư thế, độ sâu, mặt nạ) được đính kèm.
  4. Lấy mẫu / khử nhiễu: bộ giải mã chạy các bước lặp khử nhiễu (các bước khuếch tán) tạo ra hình ảnh (hoặc chuỗi khung hình cho video).

gen4_image — giới hạn cụ thể

Các trường hợp ngoại lệ về thời gian/chuyển động. Người đánh giá và người sáng tạo báo cáo về hiện tượng chuyển động bất thường, động lực thời gian kỳ lạ (lỗi ở đầu/cuối clip được tạo) và lỗi trong vũ đạo phức tạp của nhiều diễn viên — hãy thử nghiệm với các cảnh mục tiêu của bạn.

Tính toán, chi phí và xếp hàng. Việc tạo hình ảnh→video chất lượng cao đòi hỏi nhiều GPU; người dùng báo cáo thời gian chờ và chi phí/mỗi lần render có thể đáng kể đối với sản xuất hàng loạt. Hãy lập kế hoạch ngân sách/thông lượng phù hợp.

Sự đánh đổi mang tính sáng tạo so với mô hình nghệ thuật thuần túy. Điểm mạnh của Gen-4 là tính nhất quán; nếu bạn cần sản phẩm có phong cách nghệ thuật cao, mang tính hội họa hoặc mang tính thẩm mỹ "gây ngạc nhiên", Midjourney hoặc các điểm kiểm tra SDXL được điều chỉnh có thể tạo ra các chỉ dẫn nghệ thuật ưa thích.

Các trường hợp sử dụng chuẩn

  • Tiền sản xuất và lên kịch bản: nhanh chóng tạo ra các biến thể nhân vật/cảnh có phong cách nhất quán từ ảnh tham khảo.
  • Tiếp thị và tạo nội dung: sản xuất nhanh chóng hình ảnh nổi bật, clip hoạt hình xã hội và nội dung chiến dịch với các đặc điểm thương hiệu nhất quán. (Runway liệt kê các ví dụ về doanh nghiệp bao gồm các chuyến lưu diễn trực tiếp và video âm nhạc.)
  • Tạo mẫu trò chơi/tài sản & thử nghiệm ảo: tạo ra nhiều góc máy quay, nhiều biến thể trang phục và khái niệm môi trường từ một tập hợp nhỏ các tài liệu tham khảo.

So sánh với các mô hình khác

  • gen4_image→ tốt nhất khi bạn cần tham chiếu / tính nhất quán danh tính (nhân vật đơn lẻ hoặc đối tượng được giữ nguyên trong suốt các cảnh quay) và khi bạn muốn hình ảnh→video và đường ống nhiều tia.
  • DALL·E 3 → tốt nhất để có độ trung thực cao giữa lời nhắc và hình ảnh và luồng chỉnh sửa được điều khiển bởi ChatGPT cùng tính năng an toàn/nguồn gốc tích hợp.
  • SDXL (Họ khuếch tán ổn định) → tốt nhất khi bạn muốn các mô hình mở, tinh chỉnh cục bộ/tùy chỉnh và triển khai linh hoạt về chi phí.
  • Giữa hành trình → tốt nhất để có những bản kết xuất nghệ thuật, được cách điệu cao và các cài đặt trước/điều khiển "cách điệu" mạnh mẽ do cộng đồng thúc đẩy.
  • Các mẫu Runway Gen-4 so với ByteDance Seedream 4.0 / Google "Nano Banana": các sản phẩm mới ra mắt của đối thủ cạnh tranh (ví dụ: Seedream 4.0) nhấn mạnh kết xuất cực nhanh và xử lý nhiều tham chiếu nhắm đến những người sáng tạo thương mại; Ưu điểm của Runway là quy trình hình ảnh→video được tích hợp chặt chẽ và các biện pháp kiểm soát hướng đến sản xuất cùng hệ sinh thái API và SDK hoàn thiện.

Cách gọi gen4_image API từ CometAPI

Giá$0.32000

Các bước cần thiết

  • Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước
  • Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Thêm mã thông báo” tại mã thông báo API trong trung tâm cá nhân, nhận khóa mã thông báo: sk-xxxxx và gửi.
  • Lấy url của trang web này: https://api.cometapi.com/

Phương pháp sử dụng

  1. Chọn điểm cuối "gen4_image" để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn.
  2. Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
  3. Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi.
  4. . Xử lý phản hồi API để nhận được câu trả lời đã tạo.

CometAPI cung cấp một API REST hoàn toàn tương thích—cho việc di chuyển liền mạch. Chi tiết chính để  Tài liệu API:

  • Điểm cuối: https://api.cometapi.com/runwayml/v1/text_to_image
  • Thông số mô hình: gen4_image
  • Xác thực: Bearer YOUR_CometAPI_API_KEY
  • Loại-Nội dung: application/json .
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \  
--header 'X-Runway-Version: 2024-11-06' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"promptText": "cat",  
"ratio": "1920:1080",  
"seed": 4294967295,  
"model": "gen4_image",  
"referenceImages": ,  
"contentModeration": {  
"publicFigureThreshold": "auto"  
}  
}'

Xem thêm Đường băng/Màn_hai

Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%