Màn_hai là thế hệ tiếp theo của Runway Ghi lại hiệu suất AI và hoạt hình nhân vật công cụ: nó hấp thụ một lượng nhỏ Lái xe hiệu suất (video từ webcam hoặc điện thoại của một ai đó đang diễn một cảnh) cộng với tham chiếu nhân vật (hình ảnh hoặc video) và tạo ra hiệu ứng hoạt hình chuyển tải cơ thể, biểu cảm khuôn mặt và chuyển động tay cho nhân vật. Act-Two được cung cấp trong sản phẩm web của Runway và dưới dạng mô hình có sẵn thông qua hệ sinh thái API.
Giới thiệu về mô hình Act-Two
màn_hai được thiết kế để dân chủ hóa hoạt hình độ trung thực cao bằng cách chuyển các clip "hiệu suất lái xe" ngắn thành các chuỗi nhân vật hoạt hình hoàn chỉnh. Mô hình tập trung vào sự trung thực biểu cảm — chuyển các biểu cảm nhỏ trên khuôn mặt, chuyển động của môi và miệng, cử chỉ ngón tay/bàn tay và tư thế toàn thân — đồng thời cũng thêm vào các chi tiết hợp lý chuyển động môi trường khi ký tự đầu vào là một hình ảnh. màn_hai được định vị là sự phát triển của các mô hình Act trước đó của Runway và được tích hợp chặt chẽ vào bộ công cụ video và API Gen-4 của Runway.
màn hai làm gì
- Chuyển giao hiệu suất toàn thân: ánh xạ đầu, mặt, thân và tay từ một video lái xe duy nhất thành một nhân vật tham chiếu.
- Tính linh hoạt khi nhập ký tự: chấp nhận một ký tự hình ảnh hoặc một video tham khảo như mục tiêu.
- Kiểm soát cử chỉ: khi sử dụng hình ảnh nhân vật, bạn có thể điều khiển cử chỉ tay/cơ thể thông qua clip điều khiển và điều chỉnh ảnh hưởng của cử chỉ.
- Chuyển động tự động của môi trường: thêm chuyển động nền/môi trường tinh tế cho các nhân vật dựa trên hình ảnh để tránh kết quả "nổi".
Chi tiết kỹ thuật và ràng buộc nhiệm vụ
Đầu vào
- Hiệu suất lái xe: một video có chứa hoạt động diễn xuất (chuyển động, cử chỉ, âm thanh).
- Tham chiếu nhân vật: hoặc hình ảnh tĩnh hoặc video về nhân vật bạn muốn hoạt hình hóa. ()
Đầu ra & định dạng
Tỷ lệ khung hình và độ phân giải được hỗ trợ bao gồm 1280×720 (16:9), 720×1280 (9:16), 960×960 (1:1) và một số cài đặt trước nhỏ khác; 24 FPS là tốc độ khung hình tiêu chuẩn cho đầu ra. Có tự động cắt xén để phù hợp với mục tiêu về tỷ lệ khung hình.
Ghi chú xử lý: Kết quả tốt nhất khi hiệu suất lái xe và nhân vật hướng về cùng một hướng chung và chiếm cùng không gian màn hình; các yếu tố đầu vào có sự chênh lệch phối cảnh cực lớn hoặc chủ thể ở rất xa/độ phân giải thấp có thể tạo ra kết quả kém hơn. Bộ lọc nội dung và kiểm duyệt của Runway áp dụng cho các tài sản được tải lên; các tác vụ có thể bị từ chối nếu nội dung vi phạm chính sách.
Các hạn chế và chế độ lỗi đã biết
- Tập trung trong thời gian ngắn: màn_hai được tối ưu hóa cho clip ngắn (Tối thiểu 3 giây; quy trình làm việc thông thường sử dụng dưới 30 giây). Đối với mocap dài tập, bạn vẫn cần quy trình ghi hình truyền thống hoặc quy trình chia nhỏ.
- Kiểm duyệt / an toàn nội dung: Hệ thống kiểm duyệt của Runway có thể chặn hoặc hủy tác vụ đối với các đầu vào được gắn cờ; các tài khoản có quá nhiều lỗi kiểm duyệt có thể bị giới hạn tốc độ hoặc tạm ngừng. Lập kế hoạch tuân thủ chính sách nội dung vào quy trình tự động hóa.
- Các trường hợp ngoại lệ: Các màn trình diễn đa người cực kỳ phức tạp, bàn tay bị che khuất nhiều, hoặc các tham chiếu quá cách điệu có thể tạo ra hiện tượng nhiễu (rung, tư thế tay không chính xác hoặc biểu cảm không khớp). Việc dọn dẹp thủ công hoặc các quy trình kết hợp (sửa rotoscoping nhẹ/khung hình chính) vẫn có thể cần thiết.
- Không phải trường hợp nào cũng có thể thay thế hoàn toàn tính năng ghi hình chuyển động: trong khi Act-Two có thể thay thế nhiều thiết lập truyền thống cho các cảnh ngắn và tạo mẫu, các quy trình làm phim/CGI cao cấp đòi hỏi độ chính xác dưới milimet, nhiều diễn viên tương tác vật lý hoặc đồng bộ thời gian trên phim trường vẫn sẽ dựa vào hệ thống đánh dấu/giai đoạn ghi lại hiệu suất.
Các trường hợp sử dụng điển hình
- Sản xuất ảo & previs — thử nghiệm chặn và tác động nhanh mà không cần giai đoạn mocap.
- Nguyên mẫu trò chơi và hoạt hình độc lập — tạo chuyển động nhân vật nhanh cho các cảnh ngắn.
- Quảng cáo và nội dung xã hội — sản xuất các quảng cáo về nhân vật và tài năng hoạt hình một cách nhanh chóng và tiết kiệm.
- Chèn VFX và thay thế chuyển động — bổ sung cảnh quay hiện có bằng cách đưa một nhân vật cách điệu vào cảnh quay của diễn viên.
So sánh với các giải pháp hiện tại khác
màn_hai vs Pika Labs / Kaiber / Sora (cấp cao)
- Màn hai (Đường băng): xuất sắc tại độ trung thực của hiệu suất cho các nhân vật (đầu/mặt/cơ thể/tay) với một kẹp lái đơn mô hình và tích hợp API đơn giản cho các video ngắn; giá tín dụng có thể dự đoán được cho từng giây đầu ra.
- Phòng thí nghiệm Pika: thường được nhấn mạnh để chuyển đổi linh hoạt sang video và phong cách; có thể tập trung nhiều hơn vào việc tạo video chung và phong cách hơn là chuyển đổi hiệu suất có mục tiêu.
- Kaiber: mạnh mẽ ở phong cách chuyển đổi, hình ảnh lấy cảm hứng từ âm nhạc và tạo ra bối cảnh chungnhưng không nhất thiết phải chuyên biệt về độ trung thực của mocap trên từng nhân vật.
- Sora (và các quy trình VFX cao cấp tương tự): hướng tới chất lượng điện ảnh và tạo cảnh mở rộng; mạnh hơn đối với các chuỗi dài và VFX phim nhưng tốn nhiều tài nguyên hơn và có thể khó tiếp cận hơn đối với các nguyên mẫu nhanh.
Cách gọi Màn hai API từ CometAPI
Các bước cần thiết
- Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước
- Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Thêm mã thông báo” tại mã thông báo API trong trung tâm cá nhân, nhận khóa mã thông báo: sk-xxxxx và gửi.
- Lấy url của trang web này: https://api.cometapi.com/
Phương pháp sử dụng
- Chọn hàng
act_two” điểm cuối để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API của trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn. - Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
- Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi.
- . Xử lý phản hồi API để nhận được câu trả lời đã tạo.
CometAPI cung cấp một API REST hoàn toàn tương thích—cho việc di chuyển liền mạch. Chi tiết chính để Tài liệu API:
- Điểm cuối:
https://api.cometapi.com/runwayml/v1/character_performance - Thông số mô hình:
act_two - Xác thực:
Bearer YOUR_CometAPI_API_KEY - Loại-Nội dung:
application/json.
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/character_performance' \
--header 'X-Runway-Version: 2024-11-06' \
--header 'Authorization: {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{
"character": {
"type": "video",
"uri": "https://filesystem.site/cdn/20250818/wAKbHUoj5EHyqZvEdJbFXn10wXBMUn.mp4"
},
"reference": {
"type": "video",
"uri": "https://filesystem.site/cdn/20250818/wAKbHUoj5EHyqZvEdJbFXn10wXBMUn.mp4"
},
"bodyControl": true,
"expressionIntensity": 3,
"seed": 4294967295,
"model": "act_two",
"ratio": "1280:720",
"contentModeration": {
"publicFigureThreshold": "auto"
}
}'