บทที่สอง คือเจเนอเรชั่นถัดไปของรันเวย์ การจับภาพประสิทธิภาพ AI และ แอนิเมชั่นตัวละคร เครื่องมือ: มันกินระยะสั้น ประสิทธิภาพการขับขี่ (วิดีโอจากเว็บแคมหรือโทรศัพท์ของบุคคลกำลังแสดงฉาก) บวกกับ การอ้างอิงตัวละคร (ภาพหรือวิดีโอ) และสร้างการแสดงตัวละครแบบเคลื่อนไหวที่ถ่ายทอดร่างกาย สีหน้า และการเคลื่อนไหวของมือไปยังตัวละคร ฉากที่สองนำเสนอในผลิตภัณฑ์เว็บของ Runway และเป็นแบบจำลองที่พร้อมใช้งานผ่านระบบนิเวศ API
การแนะนำโมเดล Act-Two
สองฉาก ได้รับการออกแบบมาเพื่อให้แอนิเมชั่นคุณภาพสูงเป็นประชาธิปไตย โดยการเปลี่ยนคลิปสั้นๆ เกี่ยวกับ “สมรรถนะการขับขี่” ให้กลายเป็นลำดับตัวละครที่เคลื่อนไหวได้อย่างสมบูรณ์ โมเดลนี้มุ่งเน้นไปที่ ความเที่ยงตรงในการแสดงออก — ถ่ายทอดการแสดงออกทางสีหน้า การเคลื่อนไหวของริมฝีปากและปาก ท่าทางนิ้ว/มือ และท่าทางของร่างกายทั้งหมด — ขณะเดียวกันก็เพิ่มความน่าเชื่อถือ การเคลื่อนไหวด้านสิ่งแวดล้อม เมื่อตัวอักษรที่ป้อนเป็นรูปภาพ สองฉาก ถูกวางตำแหน่งให้เป็นวิวัฒนาการของโมเดล Act ก่อนหน้าของ Runway และผสานรวมอย่างแน่นหนาเข้ากับชุดเครื่องมือวิดีโอ Gen-4 และ API ของ Runway
การกระทำที่สองทำอะไร
- การถ่ายโอนประสิทธิภาพทั้งร่างกาย: แผนที่แสดงศีรษะ ใบหน้า ลำตัว และมือจากวิดีโอการขับขี่ตัวเดียวไปจนถึงการอ้างอิงตัวละคร
- ความยืดหยุ่นในการป้อนตัวอักษร: ยอมรับทั้งอักขระ ภาพ หรือ วิดีโออ้างอิง เป็นเป้าหมาย
- การควบคุมท่าทาง: เมื่อใช้ภาพตัวละคร คุณสามารถควบคุมการเคลื่อนไหวของมือหรือร่างกายผ่านคลิปควบคุมและปรับอิทธิพลของการเคลื่อนไหวได้
- การเคลื่อนไหวสิ่งแวดล้อมอัตโนมัติ: เพิ่มการเคลื่อนไหวพื้นหลัง/สภาพแวดล้อมที่ละเอียดอ่อนสำหรับตัวละครที่อิงตามภาพเพื่อหลีกเลี่ยงผลลัพธ์ที่ "ลอย"
รายละเอียดทางเทคนิคและข้อจำกัดของงาน
ปัจจัยการผลิต
- สมรรถนะการขับขี่: วิดีโอที่มีการแสดง (การเคลื่อนไหว ท่าทาง เสียง)
- อ้างอิงตัวละคร: ภาพนิ่งหรือวิดีโอของตัวละครที่คุณต้องการให้เคลื่อนไหว ()
เอาท์พุตและรูปแบบ
อัตราส่วนภาพและความละเอียดที่รองรับ ได้แก่ 1280×720 (16:9), 720×1280 (9:16), 960×960 (1:1) และชุดพรีเซ็ตเล็กๆ น้อยๆ อื่นๆ FPS 24 เป็นอัตราเฟรมมาตรฐานสำหรับเอาต์พุต มี การครอบตัดอัตโนมัติ เพื่อให้ตรงกับเป้าหมายอัตราส่วนภาพ
บันทึกการประมวลผล: ผลลัพธ์ที่ดีที่สุดเมื่อประสิทธิภาพการขับขี่และตัวละครหันหน้าไปในทิศทางเดียวกันและใช้พื้นที่หน้าจอใกล้เคียงกัน อินพุตที่มีมุมมองที่ไม่ตรงกันอย่างมากหรือวัตถุที่อยู่ไกลมาก/ความละเอียดต่ำอาจทำให้ผลลัพธ์ออกมาไม่ดี ตัวกรองเนื้อหาและการตรวจสอบของ Runway จะใช้กับเนื้อหาที่อัปโหลด งานอาจถูกปฏิเสธหากเนื้อหาละเมิดนโยบาย
ข้อจำกัดและโหมดความล้มเหลวที่ทราบ
- โฟกัสระยะสั้น: สองฉาก เหมาะสำหรับ คลิปสั้น ๆ (ขั้นต่ำ 3 วินาที เวิร์กโฟลว์ทั่วไปใช้เวลาไม่เกิน 30 วินาที) สำหรับโมแคปความยาวฟีเจอร์ คุณยังคงต้องใช้การจับภาพแบบดั้งเดิมหรือเวิร์กโฟลว์แบบแบ่งส่วน
- การควบคุมดูแล / ความปลอดภัยของเนื้อหา: การควบคุมดูแลของ Runway สามารถบล็อกหรือทำให้งานล้มเหลวสำหรับอินพุตที่ถูกตั้งค่าสถานะไว้ได้ บัญชีที่มีการควบคุมดูแลที่ล้มเหลวมากเกินไปอาจถูกจำกัดอัตราหรือระงับการใช้งาน วางแผนการปฏิบัติตามนโยบายเนื้อหาให้เป็นระบบอัตโนมัติ
- กรณีขอบ: การแสดงหลายบุคคลที่มีความซับซ้อนสูง มือที่ถูกบดบังอย่างมาก หรือการอ้างอิงที่มีลักษณะเฉพาะตัวสูง อาจทำให้เกิดสิ่งแปลกปลอม (เช่น การสั่นไหว ท่าทางมือที่ไม่ถูกต้อง หรือการแสดงออกที่ไม่ตรงกัน) อาจยังจำเป็นต้องทำความสะอาดด้วยมือหรือใช้กระบวนการแบบไฮบริด (เช่น โรโตสโคปแบบมือเบา/การซ่อมคีย์เฟรม)
- ไม่ใช่การทดแทนการจับภาพเคลื่อนไหวแบบเต็มรูปแบบในทุกกรณี: ในขณะที่ฉากที่สองสามารถทดแทนฉากสั้นๆ และการสร้างต้นแบบในรูปแบบดั้งเดิมได้ แต่กระบวนการสร้างภาพยนตร์/CGI ระดับไฮเอนด์ที่ต้องการความแม่นยำในระดับต่ำกว่ามิลลิเมตร นักแสดงหลายคนโต้ตอบกันทางกายภาพ หรือการซิงค์เวลาในกองถ่าย จะยังคงต้องอาศัยระบบมาร์กเกอร์หรือขั้นตอนการจับภาพการแสดง
กรณีใช้งานทั่วไป
- การผลิตเสมือนจริงและการเตรียมงาน — การทดสอบการบล็อคและการดำเนินการอย่างรวดเร็วโดยไม่ต้องใช้ขั้นตอน MOCAP
- การสร้างต้นแบบเกมและแอนิเมชันอินดี้ — การสร้างการเคลื่อนไหวของตัวละครอย่างรวดเร็วสำหรับฉากสั้นๆ
- โฆษณาและเนื้อหาโซเชียล — ผลิตตัวละครและความสามารถแอนิเมชันได้ในราคาถูกและรวดเร็ว
- การแทรก VFX และการเปลี่ยนการเคลื่อนไหว — เพิ่มเนื้อหาที่มีอยู่โดยนำตัวละครที่มีสไตล์มาจากมุมมองของนักแสดง
การเปรียบเทียบกับโซลูชั่นอื่น ๆ ในปัจจุบัน
สองฉาก vs Pika Labs / Kaiber / Sora (เลเวลสูง)
- องก์สอง (รันเวย์): เก่งที่ ความเที่ยงตรงของการแสดงสำหรับตัวละคร (ศีรษะ/ใบหน้า/ลำตัว/มือ) ด้วย คลิปการขับขี่แบบเดี่ยว รูปแบบและการรวม API ที่ตรงไปตรงมาสำหรับวิดีโอสั้น ๆ การกำหนดราคาเครดิตที่คาดเดาได้สำหรับเอาต์พุตไม่กี่วินาที
- พิก้าแล็บส์: มักเน้นไปที่ความยืดหยุ่นในการถ่ายโอนคำแนะนำไปยังวิดีโอและรูปแบบ อาจเน้นไปที่การสร้างวิดีโอทั่วไปและรูปแบบมากกว่าการถ่ายโอนประสิทธิภาพที่กำหนดเป้าหมาย
- ไคเบอร์ : แข็งแกร่งที่ การเปลี่ยนแปลงสไตล์ ภาพที่ขับเคลื่อนด้วยดนตรี และการสร้างฉากโดยทั่วไปแต่ไม่จำเป็นต้องเชี่ยวชาญในด้านความเที่ยงตรงของโมแคปแต่ละตัวละคร
- Sora (และโปรแกรม VFX พรีเมียมอื่นๆ ที่คล้ายคลึงกัน): มุ่งเน้นไปที่คุณภาพระดับภาพยนตร์และการสร้างฉากที่ขยายออกไป แข็งแกร่งกว่าสำหรับลำดับยาวๆ และเอฟเฟกต์ภาพยนต์ แต่ใช้ทรัพยากรมากขึ้นและอาจเข้าถึงได้น้อยกว่าสำหรับต้นแบบที่รวดเร็ว
วิธีการโทร บทที่สอง API จาก CometAPI
ขั้นตอนที่ต้องดำเนินการ
- เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
- รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง
- รับ url ของเว็บไซต์นี้: https://api.cometapi.com/
ใช้วิธีการ
- เลือก“
act_two” จุดสิ้นสุดในการส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย - แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
- แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
- ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น
CometAPI มอบ REST API ที่เข้ากันได้อย่างสมบูรณ์ เพื่อการย้ายข้อมูลที่ราบรื่น รายละเอียดสำคัญ เอกสาร API:
- ปลายทาง:
https://api.cometapi.com/runwayml/v1/character_performance - พารามิเตอร์รุ่น:
act_two - รับรองความถูกต้อง:
Bearer YOUR_CometAPI_API_KEY - ชนิดของเนื้อหา:
application/json.
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/character_performance' \
--header 'X-Runway-Version: 2024-11-06' \
--header 'Authorization: {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{
"character": {
"type": "video",
"uri": "https://filesystem.site/cdn/20250818/wAKbHUoj5EHyqZvEdJbFXn10wXBMUn.mp4"
},
"reference": {
"type": "video",
"uri": "https://filesystem.site/cdn/20250818/wAKbHUoj5EHyqZvEdJbFXn10wXBMUn.mp4"
},
"bodyControl": true,
"expressionIntensity": 3,
"seed": 4294967295,
"model": "act_two",
"ratio": "1280:720",
"contentModeration": {
"publicFigureThreshold": "auto"
}
}'