API ของ Veo 3 คือจุดสิ้นสุดแบบ RESTful บน Google Vertex AI ที่ช่วยให้นักพัฒนาสามารถสร้างวิดีโอและคลิปเสียงที่ซิงโครไนซ์และมีความละเอียดสูงจากข้อความหรือข้อความพร้อมท์รูปภาพ พร้อมด้วยฟิลเตอร์ความปลอดภัยในตัวและลายน้ำที่มองไม่เห็นในคำขอเดียว
Google DeepMind ของ วีโอ 3 เป็นตัวแทนของความทันสมัยของ การสร้างข้อความเป็นวิดีโอซึ่งถือเป็นครั้งแรกที่มีการนำ AI เชิงสร้างสรรค์ขนาดใหญ่มาซิงโครไนซ์กันอย่างราบรื่น วิดีโอที่มีความเที่ยงตรงสูง สีสดสวย เสียงประกอบ—รวมถึงบทสนทนา เอฟเฟกต์เสียง และเสียงแวดล้อม
แกน คุณสมบัติ และความสามารถ
- คลิปวิดีโอความยาว 8 วินาที:สร้างลำดับภาพได้สูงสุดแปดวินาทีพร้อมการเปลี่ยนภาพและการเย็บภาพอย่างราบรื่น
- การสร้างเสียงแบบบูรณาการ:สร้างบทสนทนา เสียงรอบข้าง เอฟเฟกต์เสียง และดนตรีประกอบในครั้งเดียว
- เอาต์พุตความละเอียดสูง: รองรับความละเอียดสูงสุดถึง 4K (3840 × 2160) โดยมีแสงที่สม่ำเสมอ ฟิสิกส์ที่สมจริง และพื้นผิวฉากที่ละเอียด
- อินพุตแบบหลายโหมด: ยอมรับทั้งสอง ข้อความเป็นวิดีโอ และ ภาพเป็นวิดีโอ แจ้งเตือนให้เปิดใช้งานเวิร์กโฟลว์สร้างสรรค์ที่หลากหลาย
ความสามารถเหล่านี้ช่วยให้ผู้สร้างสามารถสร้างเรื่องราวที่แทบจะเหมือนภาพยนตร์ได้โดยไม่ต้องมีขั้นตอนหลังการผลิตเสียงแยกต่างหากหรือขั้นตอนการตัดต่อที่ซับซ้อน
รายละเอียดทางเทคนิค
สถาปัตยกรรมของ Veo 3 ใช้ประโยชน์จาก หม้อแปลงมัลติโหมด ฝึกหัด วิดีโอ YouTube หลายล้านรายการด้วย กรอบงานตัวเข้ารหัส-ตัวถอดรหัส ประมวลผลข้อความแจ้งเตือนผ่าน เลเยอร์โทเค็นไนซ์วิดีโอ, สร้างคุณลักษณะเชิงปริภูมิและเวลาซึ่งขับเคลื่อน โมดูลการสังเคราะห์ภาพ. ในเวลาเดียวกัน สาขาการสังเคราะห์เสียง สร้างเอาต์พุตเสียงที่ตรงกัน กลไกการใส่ใจแบบข้ามโหมด รับรองว่า ภาพ และ เสียง โหมดต่างๆ ยังคงเชื่อมโยงกันอย่างแน่นหนา ช่วยลดอาตีแฟกต์จากการไม่ซิงโครไนซ์ การฝึกอบรมที่เกี่ยวข้อง อัปเดตพารามิเตอร์นับพันล้าน, เพิ่มประสิทธิภาพผ่าน คลัสเตอร์ GPU ความแม่นยำแบบผสม บน Google Cloud เวอร์เท็กซ์ เอไอ แพลตฟอร์ม .
ประสิทธิภาพมาตรฐาน
ในการทดสอบประสิทธิภาพภายใน Veo 3 แสดงให้เห็น:
- พี.เอส.เอ็น (อัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงสุด) ของ 38 เดซิเบล บนชุดข้อมูลวิดีโอมาตรฐาน มีประสิทธิภาพเหนือกว่า Veo 2 4 เดซิเบล.
- เอสซิม คะแนน (ดัชนีความคล้ายคลึงเชิงโครงสร้าง) ของ 0.92แสดงถึงความสมจริงทางภาพสูง
- ข้อผิดพลาดการซิงค์เสียงและวิดีโอ ด้านล่าง 15 มิลลิวินาทีเพื่อให้แน่ใจว่าไม่มีความล่าช้าระหว่างเสียงและการเคลื่อนไหว
- ความเร็วในการอนุมาน:~12 เฟรมต่อวินาที บน GPU NVIDIA A100 ช่วยให้สร้างคลิปสั้นๆ ได้แบบเกือบเรียลไทม์
ตัวชี้วัดเหล่านี้ทำให้ Veo 3 อยู่ในตำแหน่งแนวหน้าของ AI วิดีโอเชิงสร้างสรรค์ แซงหน้าผู้ร่วมสมัยอย่าง Sora และโมเดลวิดีโอล่าสุดของ Meta ในทั้งสอง คุณภาพ และ การประสาน.
รุ่นรุ่นและวิวัฒนาการ
- วีโอ 1 (พฤษภาคม 2024): เปิดตัวที่ Google I/O 2024 แนะนำ วิดีโอเงียบ 1080p รุ่นที่มีอายุมากกว่าหนึ่งนาที
- วีโอ 2 (ธันวาคม 2024): อัปเกรดเป็น สนับสนุน 4K และปรับปรุง พลวัตทางกายภาพ ความเข้าใจ .
- วีโอ 3 (พฤษภาคม 2025): เพิ่ม การสังเคราะห์เสียง, เพิ่มความสมจริงและ เอาต์พุต 4Kซึ่งถือเป็นก้าวกระโดดที่สำคัญใน การผลิตแบบหลายโหมด.
วิธีการเรียกใช้งาน Veo 3 API จาก CometAPI
Veo 3 ราคา API ใน CometAPI ต่ำกว่าราคาอย่างเป็นทางการ:
| ชื่อรุ่น | ราคา |
|---|---|
| วีโอ3โปร | $2 |
| วีโอ3 ฟาสต์ | $0.4 |
| veo3 | $2 |
| วีโอ3โปรเฟรม | $0.4 |
veo3,veo3-pro,veo3-fast,veo3-pro-frames:เป็นโมเดลการสร้างวิดีโอล่าสุดที่เปิดตัวอย่างเป็นทางการโดย Google วิดีโอที่สร้างมีเสียง เป็นโมเดลวิดีโอเดียวในโลกที่มีเสียง veo3-pro-frames รองรับโหมดเฟรมแรก รุ่นนี้ปฏิบัติตามรูปแบบการโทรมาตรฐานแชท openai
ขั้นตอนที่ต้องดำเนินการ
- เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
- รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง
- รับ url ของเว็บไซต์นี้: https://api.cometapi.com/
ตัวอย่างรหัส
- เลือก“
veo3-pro”etc endpoint เพื่อส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย - ปรับเปลี่ยน ฐาน_URL ในแอปพลิเคชันของคุณไปยังที่อยู่อินเทอร์เฟซของเราURL จะถูกกำหนดโดยความต้องการเฉพาะของแอปพลิเคชันของคุณ
- แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
หากคุณมีคำถามใด ๆ เกี่ยวกับการโทรหรือมีข้อเสนอแนะใด ๆ สำหรับเราโปรดติดต่อเราผ่านโซเชียลมีเดียและที่อยู่อีเมล การสนับสนุน@cometapi.com.
กรณีการใช้งาน:
ส่งงานสร้างวิดีโอ (เอกสาร: สามารถใช้ได้ที่นี่): https://api.cometapi.com/veo/v1/video/สร้าง
สอบถามสถานะการสร้างวิดีโอ: https://api.cometapi.com/veo/v1/video/query/{taskId}
ตัวอย่างการใช้งานโค้ด API CometAPI
import requests
def main():
url = " https://api.cometapi.com/veo/v1/video/create"
payload = {
"model": "veo3-pro",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if name == "main":
main()
ดูเพิ่มเติม 3 วิธีในการใช้ Google Veo 3 ในปี 2025



