Veo 3.1 กำลังจะมา (และมีข่าวลืออะไรบ้าง): เรารู้อะไรแล้วบ้าง และจะนำอะไรมาให้บ้าง?

CometAPI
AnnaOct 1, 2025
Veo 3.1 กำลังจะมา (และมีข่าวลืออะไรบ้าง): เรารู้อะไรแล้วบ้าง และจะนำอะไรมาให้บ้าง?

Veo 3.1 is Coming: Veo is Google’s family of AI video-generation models (Veo 3 / Veo 3 Fast are current). Google has recently shipped big Veo 3 improvements (vertical 9:16, 1080p, Veo 3 Fast, lower pricing) and there are rumors / social posts that Veo 3.1 is imminent — but Google has not published an official Veo 3.1 release bulletin yet. I’ll list confirmed facts, likely/expected changes, and a direct comparison to OpenAI’s Sora 2.

Veo คืออะไร

Veo คือสายผลิตภัณฑ์โมเดลสร้างวิดีโอของ Google (DeepMind / Google Cloud / ตระกูล Gemini) ที่แปลงข้อความหรือภาพให้เป็นวิดีโอสั้น — และ (ใน Veo 3) สร้างเสียงแบบเนทีฟ (เอฟเฟ็กต์เสียง เสียงบรรยากาศ และบทสนทนา) มีให้ใช้งานบน Google Cloud (Vertex AI / Gemini API) สำหรับนักพัฒนาและองค์กร และมีการฝังสัญลักษณ์ยืนยันแหล่งที่มา / ลายน้ำ SynthID ในผลลัพธ์

สิ่งที่ Veo 3 นำมาแล้ว

  • ความสามารถ Text → video และ image → video (รวมถึงพรีวิวการแปลงภาพเป็นวิดีโอ)
  • การสร้างเสียงแบบเนทีฟ (ดนตรี เสียงบรรยากาศ บทสนทนา) — Veo 3 ยกระดับเสียงเป็นความสามารถหลัก
  • สองรุ่น: Veo 3 คุณภาพสูง และ Veo 3 Fast (ปรับแต่งเพื่อความเร็ว/การวนรอบ)
  • แพลตฟอร์มที่รองรับ: ใช้งานได้ใน Vertex AI / Gemini API (จาก paid preview → อัปเดตสู่การเปิดให้ใช้ทั่วไปช่วงกลางปี 2025)
  • ความปลอดภัย/แหล่งที่มา: ลายน้ำ SynthID และการควบคุม/การอนุมัติการใช้งานสำหรับการสร้างบุคคล/เด็กบางกรณี

แล้ว Veo 3.1 คาดว่าจะมีอะไรบ้าง?

สถานะ: ขณะนี้ยังไม่มีหน้าโปรดักต์อย่างเป็นทางการของ Veo 3.1 จาก Google ที่อธิบายหมายเหตุประจำรุ่นอย่างครบถ้วน อย่างไรก็ตาม โพสต์จากนักพัฒนา/ชุมชนของ Google และทวีตหลายแหล่งบ่งชี้ถึงการอัปเดตแบบเพิ่มพูนระยะใกล้ (ติดป้ายว่า “Veo 3.1”) ที่คาดว่าจะเน้นปรับปรุงแบบวนรอบในด้านเสียง คุณภาพ และการรองรับฟอร์แมต มากกว่าการเขียนใหม่ทั้งรุ่น

นี่คือข้อสรุปที่ฉันอนุมานจากโพสต์ของ x และลักษณะของ Veo 3:

  • ปรับปรุงเสียงแบบเนทีฟ (บทสนทนา การซิงก์ริมฝีปากหลายเสียง) — บทสนทนาสะอาดขึ้น การมิกซ์ SFX และการกระจายเชิงพื้นที่ดีขึ้น). Veo 3 สร้างเสียงแบบเนทีฟได้อยู่แล้ว; Veo 3.1 อาจยกระดับความสมจริงของบทสนทนาและการรองรับภาษาต่างๆ ให้ทัดเทียมการอัปเดตล่าสุดของคู่แข่ง
  • เส้นทางที่เร็ว/ประหยัดขึ้น สำหรับเอาต์พุตที่พบบ่อยบางประเภท (เพิ่มความเท่าเทียมกับ Veo 3 Fast และการปรับแต่งประสิทธิภาพ)
  • ความเที่ยงตรง image→video ที่ดีขึ้น และความสม่ำเสมอของตัวละคร/ท่าทางที่ดีขึ้น ในคลิปหลายเฟรม
  • การควบคุมอัตราส่วนภาพ/ความละเอียดที่ขยายเพิ่ม (ยืดหยุ่นขึ้นกับ 9:16/16:9 และ 1080p ในหลายคอนฟิก) Google เพิ่มแนวตั้ง + 1080p แล้ว; Veo 3.1 อาจขยายการควบคุมเหล่านี้
  • คลิปที่ยาวขึ้น / ผ่อนคลายเพดาน 8 วินาที — ความต้องการของชุมชนและโรดแมปก่อนหน้าของ Google บ่งชี้ว่าอาจเพิ่มระยะเวลา (Veo 3 วันนี้ถูกปรับให้เหมาะกับคลิป 8 วินาที)
  • ความเที่ยงตรง image→video ที่ดีขึ้นและการรองรับการแปลงภาพเป็นวิดีโอที่ขยายเพิ่ม (ปรับปรุงความสมจริงและความต่อเนื่องของการเคลื่อนไหว) ต่อยอดจากพรีวิว image→video ใน Veo 3

Veo 3.1 กำลังจะมา (และมีข่าวลืออะไรบ้าง): เรารู้อะไรแล้วบ้าง และจะนำอะไรมาให้บ้าง?

เปรียบเทียบ Veo 3 / (คาดว่า) Veo 3.1 → OpenAI Sora 2

โฟกัสหลัก

  • Veo 3 (Google): วิดีโอสั้นคุณภาพสูงความยาว 8 วินาทีจากพรอมป์ข้อความ/ภาพ; เสียงแบบเนทีฟ; ผสานกับ Gemini/Gemini API และ Vertex AI; ปรับแต่งเพื่อใช้งานจริงในโปรดักชันและการผสาน API สำหรับนักพัฒนา
  • Sora 2 (OpenAI): โมเดลวิดีโอ+เสียงระดับเรือธงของ OpenAI ที่เน้นความสมจริงทางกายภาพ การเคลื่อนไหวที่สอดคล้องกัน การซิงก์บทสนทนาและเสียง พร้อมแอปโซเชียล (Sora) ที่มีระบบแคเมโอ/ความยินยอมสำหรับผสานภาพเหมือนผู้ใช้ และให้ความสำคัญกับความสมจริงและระบบควบคุมความปลอดภัย

จุดเด่น

  • Veo (ปัจจุบัน): การผสานสำหรับนักพัฒนา/องค์กรที่แข็งแกร่ง (Vertex AI, Gemini API) ตัวเลือกการตั้งราคาสำหรับโปรดักชัน เส้นทางชัดเจนสำหรับลูกค้าคลาวด์ รองรับแนวตั้ง/1080p และรุ่น fast เหมาะกับธุรกิจที่ต้องการต่อท่อเข้ากระบวนการทำงาน
  • Sora 2: ความแม่นยำทางกายภาพโดดเด่นและการซิงก์แบบมัลติโหมด (บทสนทนา + ภาพ) พร้อมแอปสำหรับผู้ใช้ทั่วไปที่ผสานเวิร์กโฟลว์โซเชียล (ฟีเจอร์แคเมโอ การกลั่นกรอง) เหมาะสำหรับครีเอเตอร์ที่ต้องการซีนเล่าเรื่องสมจริงและระบบนิเวศของแอป

วิธีเข้าถึง Veo ตอนนี้ — และการเตรียมพร้อมสำหรับ Veo 3.1

  • ลองใน Gemini (ผู้ใช้งานทั่วไป / เว็บ / มือถือ): ฟีเจอร์สร้าง Veo มีให้ใช้ในแอป Gemini (แตะตัวเลือก “video” ในแถบพรอมป์) ระดับการเข้าถึง (Pro / Ultra) จะมีผลต่อรุ่นของ Veo ที่คุณใช้ได้
  • เชิงโปรแกรม / องค์กร: ใช้ API บน CometAPI (มีรหัสโมเดล Veo ในเอกสารของโมเดล) CometAPI มี veo3-pro, veo3-fast และ veo3 สำหรับรายละเอียด โปรดดู Veo 3 และเอกสาร

เคล็ดลับเชิงปฏิบัติ (นักพัฒนา): หากต้องการผลลัพธ์แนวตั้ง ให้ตั้งพารามิเตอร์ aspectRatio (เช่น "9:16") และตรวจสอบการกำหนดค่าของโมเดล (Veo 3 เทียบกับ Veo 3 Fast) รวมถึงแผนของคุณเกี่ยวกับขีดจำกัดความละเอียด (720p เทียบกับ 1080p)

วิธีเข้าถึง Sora 2 (วันนี้)

แอป Sora: Sora 2 เปิดตัวมาพร้อมแอป Sora (เริ่มปล่อยแบบเชิญเฉพาะในสหรัฐฯ และแคนาดา) OpenAI ระบุว่าจะขยายการเข้าถึงและ API ภายหลัง หากคุณอยากลอง Sora 2 ตอนนี้ โปรดดูหน้า Sora 2 ของ CpmetAPI CometAPI รองรับ sora 2 API แล้ว และสามารถสร้างคลิปเพื่อโซเชียลความยาวประมาณ ~10 วินาที โดยเน้นความสมจริงของการเคลื่อนไหวสำหรับบุคคล

เริ่มต้นใช้งาน

CometAPI คือแพลตฟอร์ม API แบบรวมศูนย์ที่รวบรวมโมเดล AI กว่า 500 รายการจากผู้ให้บริการชั้นนำ—เช่น OpenAI’s GPT series, Google’s Gemini, Anthropic’s Claude, Midjourney, Suno และอื่นๆ—เข้าสู่อินเทอร์เฟซเดียวที่เป็นมิตรกับนักพัฒนา ด้วยการมอบการพิสูจน์ตัวตนที่สอดคล้อง รูปแบบคำขอ และการจัดการการตอบกลับที่เป็นมาตรฐาน CometAPI ทำให้การผสานความสามารถ AI เข้ากับแอปของคุณง่ายขึ้นอย่างมาก ไม่ว่าคุณจะสร้างแชตบอท ตัวสร้างภาพ นักประพันธ์เพลง หรือท่อวิเคราะห์ข้อมูลแบบขับเคลื่อนด้วยข้อมูล CometAPI ช่วยให้คุณวนรอบได้เร็ว คุมต้นทุน และไม่ผูกกับผู้ขาย—พร้อมเข้าถึงความก้าวหน้าล่าสุดทั่วระบบนิเวศ AI

นักพัฒนาสามารถเข้าถึง Veo 3.1 API ผ่าน CometAPI โดยเวอร์ชันโมเดลล่าสุด จะอัปเดตตามเว็บไซต์ทางการเสมอ เพื่อเริ่มต้น ลองสำรวจความสามารถของโมเดลใน Playground และดู คู่มือ API สำหรับคำแนะนำโดยละเอียด ก่อนใช้งาน โปรดตรวจสอบว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับ API key แล้ว CometAPI มีราคาที่ต่ำกว่าราคาทางการอย่างมากเพื่อช่วยการผสานของคุณ

พร้อมเริ่มหรือยัง?→ สมัคร CometAPI วันนี้ !

พร้อมลดต้นทุนการพัฒนา AI ลง 20% แล้วหรือยัง?

เริ่มต้นฟรีภายในไม่กี่นาที มีเครดิตทดลองใช้ฟรี ไม่ต้องใช้บัตรเครดิต

อ่านเพิ่มเติม