Veo3.1 ใหม่: ความสม่ำเสมอมากขึ้น, ผลลัพธ์ที่หลากหลายขึ้น และความสมบูรณ์ยิ่งขึ้น

Google 的 Veo 3.1 ได้รับการอัปเดตในเดือนมกราคม โดยมาพร้อมการปรับปรุงที่ตรงจุดซึ่งทำให้เวิร์กโฟลว์แปลงภาพเป็นวิดีโอเข้าใกล้คุณภาพระดับโปรดักชันมากขึ้น การอัปเดต 3.1 มุ่งเน้นไปที่การอัปเกรดเชิงปฏิบัติ 4 ด้านที่ทำให้เวิร์กโฟลว์ image→video ใช้งานได้จริงมากขึ้นอย่างชัดเจนสำหรับครีเอเตอร์และนักพัฒนา ได้แก่ ไปป์ไลน์ “Ingredients to Video” ที่ทรงพลังยิ่งขึ้นสำหรับการสร้างคลิปแบบไดนามิกจากภาพอ้างอิง, ความสม่ำเสมอที่ดียิ่งขึ้นระหว่างตัวละครและฉาก, เอาต์พุตแนวตั้งแบบเนทีฟ (9:16) สำหรับแพลตฟอร์มที่เน้นมือถือเป็นหลัก และตัวเลือกเอาต์พุตความคมชัดสูงใหม่ ๆ รวมถึง 1080p ที่ดีขึ้นและการอัปสเกลเป็น 4K สำหรับครีเอเตอร์และนักพัฒนาที่เคยต้องแก้ปัญหาด้วยเวิร์กโฟลว์ “crop-then-edit” สำหรับฟอร์แมตโซเชียลแนวตั้ง เอาต์พุต 9:16 แบบเนทีฟและการอัปสเกลที่ดีขึ้นของ Veo 3.1 สัญญาว่าจะช่วยลดความยุ่งยากและมอบคลิปที่ขัดเกลามากขึ้นพร้อมใช้งานบนแพลตฟอร์มได้ทันที

สำหรับนักพัฒนาและผู้เชี่ยวชาญด้านสื่อ Veo 3.1 ไม่ได้เป็นเพียงเรื่องของจำนวนพิกเซลที่มากขึ้นเท่านั้น แต่เป็นเรื่องของ ความสม่ำเสมอ การอัปเดตนี้แก้ปัญหา "flicker" และการสูญเสียอัตลักษณ์ที่เคยเป็นปัญหาของวิดีโอ AI โดยตรง พร้อมมอบชุดเครื่องมือที่สามารถรักษาความเที่ยงตรงของตัวละครและสไตล์ตลอดหลายช็อตได้อย่างมีประสิทธิภาพ จนกลายเป็นผู้ท้าชิง OpenAI's Sora 2.0 ในการแข่งขันเพื่อครองตลาดสื่อสร้างสรรค์เชิงกำเนิดระดับไฮเอนด์

อะไรคือนิยามของสถาปัตยกรรม Veo 3.1?

Veo 3.1 สร้างขึ้นบนสถาปัตยกรรม diffusion แบบ transformer ที่ได้รับการปรับปรุงและ fine-tune สำหรับความเข้าใจแบบมัลติโหมด ต่างจากรุ่นก่อนหน้าที่เน้นการแมปข้อความเป็นวิดีโอเป็นหลัก Veo 3.1 ปฏิบัติต่ออินพุตภาพ (images) ในฐานะองค์ประกอบหลักเทียบเท่ากับข้อความ prompt

การเปลี่ยนแปลงเชิงสถาปัตยกรรมนี้ทำให้โมเดลสามารถ "มองเห็น" แอสเซ็ตที่ผู้ใช้ให้มาได้ เช่น ภาพสินค้า ภาพอ้างอิงตัวละคร หรือฉากหลังเฉพาะ และทำให้สิ่งเหล่านั้นเคลื่อนไหวได้ด้วยความเข้าใจเชิงลึกเกี่ยวกับเรขาคณิต 3 มิติและแสง ผลลัพธ์คือระบบที่ให้ความรู้สึกเหมือนเอนจินเรนเดอร์ดิจิทัลมากกว่าเครื่องสุ่มผลลัพธ์

มีอะไรเปลี่ยนแปลงใน 3.1 เมื่อเทียบกับเวอร์ชันก่อนหน้า?

การสังเคราะห์ข้อมูลอ้างอิงที่สมบูรณ์ยิ่งขึ้น: โมเดลดึงลักษณะต่าง ๆ (ใบหน้า เสื้อผ้า พื้นผิว องค์ประกอบฉากหลัง) ได้ดีขึ้นและนำกลับมาใช้ซ้ำได้อย่างน่าเชื่อถือในหลายเฟรม ทำให้ตัวละครดูเป็นตัวละครเดียวกันตลอดทั้งคลิป
การจัดองค์ประกอบที่ชาญฉลาดขึ้น: แทนที่จะครอปเฟรมแนวนอนให้พอดีกับผืนผ้าใบแนวตั้ง (หรือในทางกลับกัน) Veo 3.1 สร้างองค์ประกอบแนวตั้งแบบเนทีฟ (9:16) ทำให้ตำแหน่งวัตถุหลัก มิติความลึก และการเคลื่อนไหวดูเหมาะกับฟอร์แมตตั้งแต่ต้น (สำคัญอย่างยิ่งสำหรับงานสร้างสรรค์บน TikTok/Shorts/Reels)
การทำซ้ำที่รวดเร็วขึ้นสำหรับคอนเทนต์แบบสั้น: UX และตัวโมเดลได้รับการปรับจูนสำหรับเอาต์พุต “social-first” ความยาว 8 วินาทีในหลายบริบทของผลิตภัณฑ์ (Gemini app, Flow) ช่วยให้ครีเอเตอร์ทดลองได้รวดเร็ว

“Ingredients to Video” ทำงานอย่างไร และมีอะไรใหม่ใน 3.1?

ฟีเจอร์เด่นที่สุดของการเปิดตัวครั้งนี้คือความสามารถ "Ingredients to Video" ที่ได้รับการปรับปรุงใหม่ทั้งหมด ฟีเจอร์นี้ช่วยให้ผู้ใช้ส่ง "ส่วนผสม" ทางภาพที่แตกต่างกันเข้ามา เพื่อให้โมเดลต้องนำไปใช้ในเอาต์พุตสุดท้ายอย่างแท้จริง ซึ่งช่วยเชื่อมช่องว่างระหว่างการจัดการแอสเซ็ตกับการสร้างวิดีโอ

แนวคิด “Ingredients to Video” คืออะไร?

ในเวอร์ชันก่อนหน้า "Image-to-Video" โดยมากเป็นงานแอนิเมตจากภาพเดี่ยว Veo 3.1 ขยายความสามารถนี้ด้วยการอนุญาตให้ผู้ใช้อัปโหลด ภาพอ้างอิงหลายภาพ (สูงสุดสามภาพ) เพื่อกำหนดฉาก แอสเซ็ตเหล่านี้ทำหน้าที่เป็นตัวแบบ (บุคคล วัตถุ พื้นผิว หรือฉากหลัง) และโมเดลจะจัดองค์ประกอบการเคลื่อนไหว เฟรมกล้อง และทรานซิชันรอบ ๆ สิ่งเหล่านี้เพื่อสร้างวิดีโอสั้นที่ยังคงอัตลักษณ์ทางภาพที่ป้อนไว้ให้คงอยู่ สิ่งนี้แตกต่างจาก text-to-video แบบล้วน เพราะมีการกำหนดข้อจำกัดด้านรูปลักษณ์และความต่อเนื่องทางภาพที่เข้มงวดกว่าตั้งแต่ต้น

Contextual Blending: คุณสามารถอัปโหลดภาพบุคคลหนึ่งภาพ (Character A), ภาพสถานที่หนึ่งภาพ (Background B) และภาพอ้างอิงสไตล์ (Style C) Veo 3.1 จะสังเคราะห์องค์ประกอบที่แตกต่างกันเหล่านี้ให้เป็นวิดีโอที่กลมกลืน โดย Character A กำลังแสดงอยู่ใน Environment B และเรนเดอร์ด้วย Style C
Multimodal Prompting: อินพุตภาพนี้ทำงานร่วมกับข้อความได้ คุณสามารถให้ภาพสินค้าและข้อความ prompt ว่า "explode into particles" แล้วโมเดลจะยึดรายละเอียดทางภาพของสินค้านั้นอย่างเคร่งครัด ขณะเดียวกันก็ดำเนินฟิสิกส์ตามข้อความ prompt

มีอะไรใหม่ในโหมด Ingredients ของ Veo 3.1?

Veo 3.1 นำเสนอการปรับปรุงที่เป็นรูปธรรมหลายประการในเวิร์กโฟลว์ Ingredients:

แสดงออกได้มากขึ้นจาก prompt ที่สั้น: แม้ใช้ข้อความ prompt สั้น ๆ ก็ยังได้การเคลื่อนไหวที่มีเรื่องราวและอารมณ์สมบูรณ์ขึ้นเมื่อจับคู่กับภาพ ingredient ทำให้ได้ผลลัพธ์ที่ใช้งานได้ด้วยจำนวนรอบการลองน้อยลง
การคงอัตลักษณ์ของตัวแบบที่แข็งแกร่งขึ้น: โมเดลรักษาอัตลักษณ์ทางภาพของตัวแบบ (ใบหน้า เครื่องแต่งกาย เครื่องหมายบนสินค้า) ได้ดีขึ้นตลอดหลายช็อตและการเปลี่ยนฉาก ลดความจำเป็นในการส่งแอสเซ็ตซ้ำเพื่อคงความต่อเนื่อง
ความสม่ำเสมอของวัตถุและฉากหลัง: วัตถุและองค์ประกอบฉากสามารถคงอยู่ต่อเนื่องข้ามคัตได้ ช่วยให้การเล่าเรื่องมีความสอดคล้อง และเอื้อต่อการใช้พร็อพหรือพื้นผิวซ้ำ
เพิ่มแอ็กชันแบบไดนามิกและจังหวะการเล่าเรื่องให้กับฉากโดยอัตโนมัติ;
วิดีโอเอาต์พุตมีความสมบูรณ์ยิ่งขึ้นในด้าน "การเล่าเรื่อง" และ "รายละเอียดใบหน้า" ช่วยเพิ่มความเป็นธรรมชาติในการรับรู้ด้วยสายตามนุษย์

การปรับปรุงเหล่านี้ออกแบบมาเพื่อลดปัญหาที่พบบ่อยที่สุดของการสร้างวิดีโอจากภาพ: การหลุดของตัวแบบ ความไม่สม่ำเสมอของฉากหลัง และการสูญเสียสไตล์เมื่อเปลี่ยนผ่านระหว่างเฟรม

กรณีใช้งานจริงของ Ingredients to Video

ทำให้มาสคอตแบรนด์เคลื่อนไหวจากแอสเซ็ตงานออกแบบ
เปลี่ยนภาพพอร์ตเทรตของนักแสดงให้เป็นโมชั่นคลิปสำหรับโฆษณาโซเชียล
สร้างต้นแบบแนวทางภาพอย่างรวดเร็ว (แสง พื้นผิว) ก่อนเข้าสู่ขั้นตอนโปรดักชันเต็มรูปแบบ

Veo 3.1 เพิ่มความสม่ำเสมออะไรบ้าง?

ในลำดับภาพที่สร้างขึ้นซึ่งมีหลายช็อตหรือหลายฉาก การรักษาอัตลักษณ์ของตัวแบบ (ใบหน้า เสื้อผ้า ฉลากสินค้า) ตำแหน่งวัตถุ และความต่อเนื่องของฉากหลัง เป็นสิ่งสำคัญต่อความน่าเชื่อถือของการเล่าเรื่อง ความไม่สอดคล้องกัน—ไม่ว่าจะเป็นการเปลี่ยนแปลงเล็กน้อยของโครงหน้า รูปร่างวัตถุ หรือพื้นผิว—จะทำลายความรู้สึกสมจริงของผู้ชม และต้องอาศัยการแก้ไขด้วยมือหรือการสร้างใหม่ โมเดลวิดีโอรุ่นก่อน ๆ มักต้องแลกความยืดหยุ่นกับความกลมกลืน Veo 3.1 พยายามลดการแลกเปลี่ยนนั้นให้แคบลง

Veo 3.1 ทำให้การสร้างลำดับสั้น ๆ และจังหวะเรื่องราวที่ดูเป็นเรื่องเล่าต่อเนื่อง แทนที่จะเป็นชุดภาพสั้นแยกกัน เป็นสิ่งที่ทำได้จริง การปรับปรุงนี้เป็นแกนกลางของประสบการณ์ 3.1:

Temporal Stability: โมเดลลดเอฟเฟกต์ "morphing" ที่ใบหน้าหรือวัตถุค่อย ๆ เปลี่ยนรูปร่างไปตามเวลาได้อย่างชัดเจน
Shot-to-Shot Coherence: ด้วยการใช้ภาพ "ingredient" ชุดเดิมกับ prompt ที่ต่างกัน ครีเอเตอร์สามารถสร้างหลายคลิปของตัวละครเดียวกันในสถานการณ์ต่าง ๆ ได้โดยไม่ทำให้ดูเหมือนเป็นคนละคน นี่คือก้าวกระโดดครั้งใหญ่สำหรับแนวทางแบรนด์และการสร้างคอนเทนต์แบบเป็นตอน
Texture Blending: ช่วยให้ตัวละคร วัตถุ และฉากหลังที่มีสไตล์กลมกลืนกันอย่างเป็นธรรมชาติ สร้างวิดีโอคุณภาพสูงที่มีสไตล์เป็นเอกภาพ

ผลกระทบในทางปฏิบัติ

สำหรับบรรณาธิการและครีเอเตอร์สายโซเชียล นี่หมายถึงการแก้ไขน้อยลงและงาน rotoscoping ที่ลดลง; สำหรับนักพัฒนาและสตูดิโอ มันช่วยลดความติดขัดเมื่อทำระบบอัตโนมัติสำหรับลำดับหลายช็อต และลดงานคัดเลือกด้วยมือที่จำเป็นต่อการรักษาความต่อเนื่องทางภาพระหว่างแอสเซ็ตต่าง ๆ

Veo-3.1

การอัปเกรดเอาต์พุตของ Veo 3.1: เอาต์พุตแนวตั้งและความคมชัดสูง

เอาต์พุตแนวตั้งแบบเนทีฟ

ด้วยการครองความนิยมของ TikTok, YouTube Shorts และ Instagram Reels ความต้องการวิดีโอแนวตั้งคุณภาพสูงจึงไม่มีที่สิ้นสุด ในที่สุด Veo 3.1 ก็ให้ความสำคัญกับฟอร์แมตนี้อย่างจริงจังตามที่ควรจะเป็น

Veo 3.1 เปิดตัว การสร้างอัตราส่วนภาพ 9:16 แบบเนทีฟ

ไม่ต้องครอป: แตกต่างจากเวิร์กโฟลว์ก่อนหน้าที่สร้างวิดีโอสี่เหลี่ยมหรือแนวนอนแล้วค่อยครอป (ทำให้สูญเสียความละเอียดและเฟรมมิง) Veo 3.1 จัดองค์ประกอบช็อตเป็นแนวตั้งตั้งแต่ต้น
Framing Intelligence: โมเดลเข้าใจกฎการจัดองค์ประกอบแนวตั้ง ทำให้มั่นใจได้ว่าวัตถุหลักอยู่กึ่งกลางและมีการใช้โครงสร้างแนวสูงได้อย่างมีประสิทธิภาพ แทนที่จะสร้างเส้นขอบฟ้ากว้างที่ดูแปลกเมื่อถูกบีบลงบนหน้าจอโทรศัพท์

การสร้างแนวตั้งแบบเนทีฟเปลี่ยนเวิร์กโฟลว์อย่างไร

เผยแพร่ได้เร็วขึ้น: ไม่ต้องครอปและจัดเฟรมใหม่หลังการสร้าง
การจัดองค์ประกอบดีกว่า: โมเดลจัดฉากโดยคำนึงถึงเฟรมแนวตั้ง (headroom, เส้นทางการเคลื่อนไหว)
พร้อมลงแพลตฟอร์ม: ส่งออกได้เหมาะสำหรับ TikTok และ Shorts โดยแทบไม่ต้องแก้ไขเพิ่ม

เอาต์พุตความคมชัดสูง

ความละเอียดเป็นคอขวดสำคัญของวิดีโอ AI มาโดยตลอด Veo 3.1 ทำลายข้อจำกัด 720p/1080p ด้วย การรองรับ 4K แบบเนทีฟ

Integrated Upscaling: ไปป์ไลน์ประกอบด้วยโมดูล super-resolution ใหม่ที่อัปสเกลคอนเทนต์ที่สร้างขึ้นเป็น 4K (3840x2160) หรือ 1080p ด้วยคุณภาพบิตเรตสูง
Artifact Reduction: ตัวอัปสเกลได้รับการฝึกมาโดยเฉพาะกับอาร์ติแฟกต์จากงาน generative ทำให้สามารถลด "shimmer" ที่มักพบในพื้นผิวของวิดีโอ AI พร้อมเพิ่มความคมของขอบ ส่งผลให้เอาต์พุตเหมาะกับไทม์ไลน์การตัดต่อระดับมืออาชีพ

Veo 3.1 เทียบกับ Sora 2.0 เป็นอย่างไร?

การเปรียบเทียบระหว่าง Google's Veo 3.1 และ OpenAI's Sora 2.0 เป็นตัวกำหนดภูมิทัศน์ปัจจุบันของวิดีโอ AI แม้ว่าทั้งสองจะทรงพลัง แต่ก็รับใช้เป้าหมายที่ต่างกัน

Feature	Google Veo 3.1	OpenAI Sora 2.0
Primary Philosophy	การควบคุมและความสม่ำเสมอ ออกแบบมาสำหรับเวิร์กโฟลว์โปรดักชันที่ต้องเคารพแอสเซ็ตเฉพาะ (สินค้า ตัวละคร)	การจำลองและฟิสิกส์ ออกแบบมาเพื่อจำลองโลกจริงด้วยความเที่ยงตรงสูง โดยมุ่งเน้นความมหัศจรรย์ของการสร้างแบบ "one-shot" Text-to-video และ image-to-video โดยเน้นความสมจริงระดับภาพถ่าย ความแม่นยำทางกายภาพ และเสียงที่ซิงก์กัน
Input Flexibility	สูง "Ingredients to Video" อนุญาตให้ใส่หลายภาพเพื่อควบคุมแอสเซ็ตได้อย่างแม่นยำ	ปานกลาง มีจุดแข็งด้าน text-to-video และภาพเริ่มต้นเดี่ยว แต่ควบคุมองค์ประกอบเฉพาะต่าง ๆ ได้ละเอียดน้อยกว่า
Vertical Video	9:16 แบบเนทีฟ ปรับองค์ประกอบให้เหมาะกับฟอร์แมตมือถือ	รองรับ แต่ข้อมูลฝึกมักเอนเอียงไปทางภาพไวด์สกรีน 16:9 แบบภาพยนตร์
Resolution	4K (ผ่านการอัปสเกล) คมชัด พร้อมใช้งานระดับออกอากาศ	1080p แบบเนทีฟ คุณภาพสูง แต่ต้องใช้อัปสเกลภายนอกสำหรับเวิร์กโฟลว์ 4K
Brand Safety	สูง มาตรการป้องกันที่เข้มงวดและความเที่ยงตรงของแอสเซ็ตทำให้ปลอดภัยกว่าสำหรับการใช้งานเชิงพาณิชย์	แปรผัน อาจสร้างฟิสิกส์หรือรายละเอียดที่หลุดจาก prompt เพื่อเพิ่ม "ความสร้างสรรค์"
Identity/consistency	ปรับปรุงความสม่ำเสมอของตัวแบบและวัตถุโดยยึดกับภาพอ้างอิง (Ingredients)	Sora 2 ให้ความสำคัญกับความสม่ำเสมอข้ามหลายช็อตและความสามารถในการควบคุมเช่นกัน

ความแตกต่างในทางปฏิบัติ

เวิร์กโฟลว์มือถือและแนวตั้ง: Veo 3.1 มุ่งเป้าไปที่ครีเอเตอร์สายมือถืออย่างชัดเจนด้วยการเรนเดอร์แนวตั้งแบบเนทีฟและการผสาน YouTube Shorts โดยตรง ซึ่งเป็นข้อได้เปรียบต่อประสิทธิภาพของไปป์ไลน์คอนเทนต์แบบสั้น
เสียงและซาวด์ที่ซิงก์กัน: Sora 2 เน้นบทสนทนาและเอฟเฟกต์เสียงที่ซิงก์กันเป็นความสามารถหลัก ซึ่งอาจเป็นปัจจัยตัดสินใจสำหรับครีเอเตอร์ที่ต้องการการสร้างเสียงรวมกับภาพเคลื่อนไหวในตัว

กล่าวโดยสรุป: Veo 3.1 ลดช่องว่างเชิงปฏิบัติที่สำคัญในด้านการจัดรูปแบบสำหรับมือถือและการอัปสเกลระดับโปรดักชัน ขณะที่ Sora 2 ยังคงนำหน้าในด้านเสียงแบบบูรณาการและตัวชี้วัดความสมจริงบางประการ การเลือกใช้งานขึ้นอยู่กับลำดับความสำคัญของเวิร์กโฟลว์: การเล่าเรื่องที่เน้นมือถือและยึดภาพอ้างอิงเป็นหลัก (Veo) เทียบกับความสมจริงแบบภาพยนตร์พร้อมเสียง (Sora 2)

เหตุใดจึงสำคัญ: หากคุณเป็นครีเอเตอร์โซเชียลมีเดียที่ต้องการคลิปไวรัลสมจริงจัดของแมมมอธขนฟูที่กำลังเดินผ่าน NYC Sora 2.0 มักสร้าง "wow" factor ต่อวินาทีได้มากกว่า อย่างไรก็ตาม หากคุณเป็นเอเจนซีโฆษณาที่ต้องการทำให้กระป๋องน้ำอัดลมเฉพาะรุ่นหนึ่ง (Ingredient A) เคลื่อนไหวอยู่บนชายหาดเฉพาะแห่งหนึ่ง (Ingredient B) สำหรับโฆษณา Instagram แนวตั้ง Veo 3.1 คือเครื่องมือที่เหนือกว่า

นักพัฒนาและครีเอเตอร์จะเริ่มใช้ Veo 3.1 ได้อย่างไรวันนี้?

Veo 3.1 ใช้งานได้ที่ไหน?

Veo 3.1 พร้อมใช้งานใน Gemini API ผ่าน CometAPI ทำไมฉันจึงแนะนำ CometAPI ให้คุณ? เพราะมันถูกที่สุดและใช้งานง่าย และคุณยังสามารถหา sora 2 API เป็นต้น ได้ในนั้นด้วย

รูปแบบการใช้งานตัวอย่างและตัวอย่างโค้ด

import osimport timeimport requests# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it hereCOMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"BASE_URL = "https://api.cometapi.com/veo/v1/video"# Create video generation taskcreate_response = requests.post(    f"{BASE_URL}/create",    headers={        "Authorization": COMETAPI_KEY,        "Content-Type": "application/json",    },    json={        "prompt": "An orange cat flying in the blue sky with white clouds, sunlight pouring onto its fur, creating a beautiful and dreamlike scene",        "model": "veo3.1",        "enhance_prompt": True,    },)task = create_response.json()task_id = task["id"]print(f"Task created: {task_id}")print(f"Status: {task['status']}")# Poll until video is readywhile True:    query_response = requests.get(        f"{BASE_URL}/query/{task_id}",        headers={            "Authorization": f"Bearer {COMETAPI_KEY}",        },    )    result = query_response.json()    status = result["data"]["status"]    progress = result["data"].get("progress", "")    print(f"Checking status... {status} {progress}")    if status == "SUCCESS" or result["data"]["data"]["status"] == "completed":        video_url = result["data"]["data"]["video_url"]        print(f"Video URL: {video_url}")        break    elif status == "FAILED":        print(f"Failed: {result['data'].get('fail_reason', 'Unknown error')}")        break    time.sleep(10)

บทสรุป

Veo 3.1 แสดงให้เห็นถึงความสุกงอมของวิดีโอเชิงกำเนิด ด้วยการก้าวข้ามการหลอนภาพจากข้อความสู่พิกเซลแบบง่าย ๆ และนำเสนอเครื่องมือที่แข็งแกร่งสำหรับการควบคุมแอสเซ็ต ("Ingredients"), การปรับให้เหมาะกับฟอร์แมต (Native Vertical) และคุณภาพการส่งมอบ (4K) ทำให้ Google มอบ API วิดีโอเชิงกำเนิด "ระดับสตูดิโอ" ที่แท้จริงเป็นครั้งแรก สำหรับองค์กรที่ต้องการทำระบบอัตโนมัติในการผลิตคอนเทนต์ในระดับขนาดใหญ่ การรอคอยโมเดลวิดีโอที่ควบคุมได้และมีความคมชัดสูงได้สิ้นสุดลงแล้ว

นักพัฒนาสามารถเข้าถึง Veo 3.1 API ผ่าน CometAPI หากต้องการเริ่มต้น ให้สำรวจความสามารถของโมเดลใน Playground ของ CometAPI และดู API guide สำหรับคำแนะนำโดยละเอียด ก่อนเข้าถึง โปรดตรวจสอบว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับ API key แล้ว CometAPI เสนอราคาที่ต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยให้คุณผสานรวมได้ง่ายขึ้น

พร้อมลุยหรือยัง?→ สมัครใช้งาน CometAPI วันนี้ !

หากคุณต้องการทราบเคล็ดลับ คู่มือ และข่าวสารเกี่ยวกับ AI เพิ่มเติม ติดตามเราได้ที่ VK, X และ Discord!