Luma AI เปิดตัว Ray3: โมเดลวิดีโอ “ที่สามารถอนุมานได้” รุ่นแรกของโลก

Luma AI เปิดตัวแล้ว Ray3ซึ่งเป็นโมเดลวิดีโอเชิงสร้างสรรค์รุ่นใหม่ที่บริษัทเรียกว่าโมเดลวิดีโอที่มีความสามารถในการอนุมานตัวแรกของอุตสาหกรรม (ซึ่ง Luma เรียกว่า "การใช้เหตุผล") และเป็นตัวแรกที่ผลิตวิดีโอช่วงไดนามิกสูง (HDR) ระดับสตูดิโอโดยตรง รวมถึงมาสเตอร์ ACES/EXR 10, 12 และ 16 บิตที่สามารถส่งออกได้สำหรับขั้นตอนการผลิตระดับมืออาชีพ

Ray3 ไม่เพียงแต่เข้าใจภาษาและข้อมูลภาพเท่านั้น แต่ยังประเมินผลการสร้างภาพของตัวเองเพื่อให้มั่นใจว่าการสร้างสรรค์ผลงานจะแม่นยำยิ่งขึ้น นอกจากนี้ยังเป็นโมเดล AI รุ่นแรกที่สามารถสร้างวิดีโอ HDR คุณภาพระดับสตูดิโอ รองรับเอาต์พุตช่วงไดนามิกสูงสูงสุด 16 บิต เพื่อรายละเอียดและสีสันที่คมชัดยิ่งขึ้น

สิ่งที่ Ray3 สัญญา

Ray3 ออกแบบมาเพื่อเชื่อมโยงแนวคิดและการผลิต แทนที่จะแมปคำสั่งไปยังพิกเซลโดยตรง Luma อธิบายว่า Ray3 แบ่งงานครีเอทีฟบรีฟออกเป็นขั้นตอนต่างๆ (แนวคิด → ช็อต → การเคลื่อนไหว → แสง → เรนเดอร์) สร้างบันทึกย่อ/คำอธิบายประกอบระหว่างขั้นตอน และตรวจสอบความสอดคล้องของพื้นที่และเวลาในแต่ละขั้นตอน ซึ่งทำงานได้อย่างมีประสิทธิภาพเสมือนเป็นพันธมิตรด้านครีเอทีฟอัตโนมัติในระหว่างการสร้างภาพจำลองเบื้องต้นและการเรนเดอร์ เลเยอร์ "การให้เหตุผล" นี้เป็นหัวใจสำคัญของการนำเสนอของ Luma ช่วยให้โมเดลสามารถแก้ไขปัญหา ปรับแต่งแบบร่าง และให้ผลลัพธ์ที่คาดการณ์ได้และพร้อมสำหรับการผลิตมากขึ้น

ข้อเรียกร้องทางเทคนิคที่สำคัญ ได้แก่:

HDR ดั้งเดิมสูงถึง 16 บิต (รองรับเวิร์กโฟลว์ 10 และ 12 บิตด้วยการส่งออก EXR สำหรับ VFX/โพสต์ไพล์ไลน์
AI ตัวแรกที่จะสร้างวิดีโอ HDR ระดับมืออาชีพพร้อมสีสันที่สดใส
Ray3 คือโมเดลวิดีโอ "การใช้เหตุผล" ตัวแรกของโลก ที่สามารถเข้าใจและคิดได้
การส่งผ่านการกระจายเสียงแบบ Hi-Fi:กระบวนการสองขั้นตอนที่สำรวจฉบับร่างที่รวดเร็วและต้นทุนต่ำ และอัปเกรดเทคที่ดีที่สุดให้เป็นมาสเตอร์ 4K HDR "Hi-Fi"
โหมดร่าง เพื่อการสร้างแนวคิดอย่างรวดเร็ว: ลูมากล่าวว่าร่างมีถึง เร็วกว่า 5 เท่า และถูกกว่า 5 เท่าทำให้สามารถทำซ้ำได้อีกหลายครั้งก่อนที่จะทำการเรนเดอร์แบบความเที่ยงตรงสูง
คำอธิบายภาพ:ผู้สร้างสามารถวาดภาพลงบนเฟรม (ลูกศร ภาพร่าง เครื่องหมาย) โดยตรง และ Ray3 จะตีความภาพเขียนเหล่านั้นให้เป็นการเคลื่อนไหว การบล็อกกล้อง และการออกแบบท่าเต้น โดยไม่ต้องใช้ข้อความช่วย
การสนับสนุนขั้นสูงสำหรับ การจำลองทางกายภาพ ความสอดคล้องของฝูงชน/ตัวละคร การเบลอภาพเคลื่อนไหวที่สมจริง แสงและการสะท้อนแบบโต้ตอบมุ่งเน้นไปที่เวิร์กโฟลว์ของสตูดิโอ

Ray3 สามารถเข้าใจเจตนาของผู้สร้างและสร้างฉากและการกระทำที่ซับซ้อนได้ทีละขั้นตอน Ray3 ผสานการใช้เหตุผลแบบหลายโหมดเข้ากับรูปแบบเอาต์พุตระดับโปรดักชั่น แทนที่จะเพียงแค่จับคู่พรอมต์กับพิกเซล โมเดลนี้สามารถวางแผนฉากที่สอดคล้องกัน ร่างแบบร่างสามารถประเมินและปรับปรุงได้ด้วยตนเอง และปรับแต่งผลลัพธ์ในระหว่างการสร้างจนกว่าจะได้มาตรฐานคุณภาพ ซึ่งเป็นฟังก์ชันที่ Luma กำหนดกรอบการทำงานไว้ว่าเป็น "การใช้เหตุผล" หรือการสร้างวิดีโอที่สามารถอนุมานได้

Ray3 มอบความเที่ยงตรงที่พร้อมสำหรับการผลิต รองรับการเคลื่อนไหวความเร็วสูง การรักษาโครงสร้าง การจำลองฟิสิกส์ การสำรวจฉาก แอนิเมชั่นฝูงชนที่ซับซ้อน แสงสว่างแบบโต้ตอบ คอสติก การเบลอภาพเคลื่อนไหว กราฟิกที่สมจริง และการแสดงรายละเอียด โดยมอบเอาต์พุตวิดีโอที่พร้อมสำหรับขั้นตอนการผลิตเชิงสร้างสรรค์ระดับไฮเอนด์

มันเข้ากับเวิร์กโฟลว์จริงอย่างไร

Luma วางตำแหน่ง Ray3 ให้พร้อมสำหรับสตูดิโอ: การส่งออก HDR และ EXR แบบเนทีฟ หมายถึงฟุตเทจที่สร้างขึ้นสามารถนำไปใส่ในไทม์ไลน์ของ Nuke/Resolve/After Effects เพื่อปรับระดับสีและประกอบภาพ ในขณะที่โหมดร่าง (Draft Mode) จะช่วยเร่งการสำรวจเชิงสร้างสรรค์ก่อนที่จะทุ่มงบประมาณการเรนเดอร์ให้กับมาสเตอร์ Hi-Fi โมเดลนี้มีให้ใช้งานบนเว็บและแอป Dream Machine ของ Luma และ Luma ได้ประกาศความร่วมมือที่นำ Ray3 เข้าสู่ทีมสร้างสรรค์อื่นๆ (มีการประกาศการผสานรวม Adobe Firefly ควบคู่ไปกับการเปิดตัว Luma) รายงานข่าวเบื้องต้นระบุว่าคลิปวิดีโอมีความยาวสูงสุด ~วินาที 10 คือความยาวเอาต์พุตจริงที่ใช้ในการสาธิตในปัจจุบัน

บริษัทยังมี Ray3 API และฟีเจอร์สำหรับทีม/พื้นที่ทำงานสำหรับสตูดิโอที่ต้องการสร้างชุดข้อมูล การทำงานร่วมกัน และการผสานรวมเข้ากับกระบวนการจัดการทรัพยากร ระดับราคา (รวมถึงระดับฟรีที่มีแบบร่างจำกัด) ระบุไว้ในหน้าราคาของ Luma

ข้อจำกัดในทางปฏิบัติและคำถามที่ต้องระวัง

ความยาวและความซับซ้อนของคลิป:เดโมปัจจุบันและการเขียนของพันธมิตรมุ่งเน้นไปที่คลิปภาพยนตร์สั้นมาก (ประมาณ 10 วินาทีในการผสานรวมบางส่วน) ดังนั้นฉากที่ยาวกว่าและบรรยายเรื่องราวยังคงต้องมีการเย็บต่อและแก้ไขงาน
การบูรณาการกับการควบคุม:แม้ว่าเอาต์พุต EXR/16 บิตของ Ray3 จะออกแบบมาสำหรับเวิร์กโฟลว์หลังการถ่ายทำ แต่สตูดิโอต้องการระบบป้องกันที่ชัดเจนและการควบคุมสินทรัพย์อย่างแม่นยำ (ความสอดคล้องของตัวกล้อง/ใบหน้าในทุกเทค การใช้ IP และแหล่งที่มาของวัสดุ) การรายงานข่าวที่ผ่านมาเน้นย้ำถึงความสามารถที่น่าประทับใจ แต่ยังขาดคุณสมบัติที่มักพบในข้อกำหนดด้าน QA ของฝ่ายผลิต
ข้อควรพิจารณาทางจริยธรรมและกฎหมาย:เช่นเดียวกับเครื่องมือสร้างอื่นๆ การนำไปใช้ทำให้เกิดคำถามเกี่ยวกับข้อมูลการฝึกอบรม ลิขสิทธิ์ และวิธีการให้เครดิตและอนุญาตสิทธิ์สินทรัพย์ที่สร้างโดย AI โดยทั่วไปแล้ว การถกเถียงเหล่านี้จะเกิดขึ้นหลังจากการเปิดตัวครั้งใหญ่ และจะส่งผลต่อวิธีที่สตูดิโอนำ Ray3 ไปใช้ (สื่อในอุตสาหกรรมได้รายงานเกี่ยวกับเงื่อนไขความร่วมมือทางการค้าและช่วงเวลาวางจำหน่ายแล้ว)

เหตุใดสิ่งนี้จึงสำคัญ — ความก้าวหน้าทางเทคนิคและความคิดสร้างสรรค์

ความสามารถสองประการที่ทำให้ Ray3 แตกต่างจากโมเดลการแปลงข้อความเป็นวิดีโอและการสร้างวิดีโอแบบเดิม:

เอาท์พุต HDR ระดับสตูดิโอ: รุ่นก่อนหน้ามักผลิตภาพ SDR หรือภาพประมาณที่แปลงแล้ว การสร้าง HDR แบบเนทีฟ 10/12/16 บิต และการส่งออก EXR ของ Ray3 ช่วยขจัดอุปสรรคสำคัญต่อการนำไปใช้งานในระดับมืออาชีพ โดยรักษาข้อมูลสีและความสว่างที่ขยายออกไป ซึ่งจำเป็นสำหรับการปรับระดับสีและ VFX ความเข้ากันได้นี้เองที่ทำให้เอาต์พุตสามารถส่งไปยังโพสต์ไปป์ไลน์ระดับไฮเอนด์ได้โดยตรง
การอนุมาน/การใช้เหตุผลสำหรับการเล่าเรื่องด้วยภาพ: Luma วางตำแหน่ง Ray3 เป็นโมเดลที่สามารถ เหตุผล เกี่ยวกับฉากต่างๆ (การวางแผนการเคลื่อนไหว การรักษาความสอดคล้องของตัวละครและฟิสิกส์ การตัดสินแบบร่าง และการลองใหม่) ซึ่งเพิ่มโอกาสที่รุ่นเดียวจะสามารถใช้งานได้จริง วิธีนี้ช่วยลดการล้างข้อมูลด้วยตนเองและเร่งกระบวนการวนซ้ำสำหรับฉากที่ซับซ้อนและมีหลายขั้นตอน

ผู้สังเกตการณ์ในอุตสาหกรรมต่างมองว่าความร่วมมือของ Adobe เป็นสัญญาณที่มีความหมายว่าแพลตฟอร์มสร้างสรรค์จากภายนอกพร้อมที่จะใช้งานและนำเสนอโมเดลวิดีโอคุณภาพสูงที่สร้างสรรค์ขึ้นให้กับฐานผู้ใช้ขนาดใหญ่ การผสานรวมใน Firefly ในช่วงแรกช่วยให้ชุมชนครีเอทีฟในวงกว้างสามารถทดลองใช้ Ray3 ได้โดยตรงภายในเวิร์กโฟลว์การออกแบบที่ได้รับการยอมรับ

เริ่มต้นใช้งาน

CometAPI คือแพลตฟอร์ม API แบบรวมที่รวบรวมโมเดล AI กว่า 500 โมเดลจากผู้ให้บริการชั้นนำ เช่น ซีรีส์ของ OpenAI, Gemini ของ Google, Claude ของ Anthropic, Midjourney, Suno และอื่นๆ ไว้ในอินเทอร์เฟซเดียวที่ใช้งานง่ายสำหรับนักพัฒนา ด้วยการนำเสนอการตรวจสอบสิทธิ์ การจัดรูปแบบคำขอ และการจัดการการตอบกลับที่สอดคล้องกัน CometAPI จึงช่วยลดความยุ่งยากในการผสานรวมความสามารถของ AI เข้ากับแอปพลิเคชันของคุณอย่างมาก ไม่ว่าคุณจะกำลังสร้างแชทบอท โปรแกรมสร้างภาพ นักแต่งเพลง หรือกระบวนการวิเคราะห์ข้อมูล CometAPI จะช่วยให้คุณทำงานซ้ำได้เร็วขึ้น ควบคุมต้นทุน และไม่ยึดติดกับผู้ขาย ทั้งหมดนี้ควบคู่ไปกับการใช้ประโยชน์จากความก้าวหน้าล่าสุดในระบบนิเวศ AI

เริ่มต้นด้วยการสำรวจ ลูมาเรย์2 ศักยภาพของใน สนามเด็กเล่น และปรึกษา คู่มือ API สำหรับคำแนะนำโดยละเอียด ก่อนเข้าใช้งาน โปรดตรวจสอบให้แน่ใจว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับรหัส API แล้ว โคเมทเอพีไอ เสนอราคาที่ต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยคุณบูรณาการ

การผสานรวม Ray3 ล่าสุดจะปรากฏบน CometAPI เร็วๆ นี้ โปรดติดตาม! ระหว่างที่เรากำลังอัปโหลด Ray3 ให้เสร็จสิ้น ลองสำรวจโมเดลอื่นๆ ของเราในหน้าโมเดล หรือลองใช้ใน AI Playground ได้เลย พร้อมแล้วหรือยัง? → ลงทะเบียน CometAPI วันนี้ !

สรุป

Ray3 แสดงให้เห็นถึงการผลักดันที่ชัดเจนของ Luma AI ในการย้ายวิดีโอเชิงสร้างสรรค์จากการสาธิตใหม่ๆ ไปสู่เครื่องมือในสตูดิโอ โดยผสมผสานสถาปัตยกรรม "การใช้เหตุผล" แบบใหม่ (การวางแผนแบบวนซ้ำและการแก้ไขด้วยตนเอง) เวิร์กโฟลว์การร่างอย่างรวดเร็ว และ เอาต์พุต HDR 16 บิตดั้งเดิม มุ่งเป้าไปที่การผลิตหลังการถ่ายทำ ความพร้อมในการใช้งานบน Dream Machine ทันที และการผสานรวมอย่าง Adobe Firefly ทำให้เป็นหนึ่งในการเปิดตัววิดีโอที่สร้างสรรค์และมีความสำคัญมากที่สุดในปี 2025 การที่วิดีโอนี้จะช่วยปรับเปลี่ยนรูปแบบการผลิตหรือไม่นั้น ขึ้นอยู่กับการปรับขนาดความยาวของคลิป ความน่าเชื่อถือของลำดับภาพที่ยาวขึ้น และความเร็วที่สตูดิโอต่างๆ จะรวมวิดีโอนี้เข้ากับกระบวนการ VFX และการตัดต่อที่มีอยู่