Veo 3.1 là bản cập nhật gia tăng nhưng quan trọng của Google cho gia đình văn bản và hình ảnh → video Veo, bổ sung thêm nhiều tính năng phong phú hơn âm thanh gốc, đầu ra video dài hơn và có thể kiểm soát được nhiều hơn, và tốt hơn chỉnh sửa và cảnh cấp độ điều khiển.
Thông tin cơ bản — tính năng cốt lõi
Veo 3.1 tập trung vào thực tế sáng tạo nội dung tính năng:
- Tạo âm thanh gốc (đối thoại, âm thanh xung quanh, SFX) được tích hợp trong đầu ra. Veo 3.1 tạo ra âm thanh gốc (đối thoại + không khí xung quanh + SFX) được căn chỉnh theo dòng thời gian trực quan; mô hình này nhằm mục đích duy trì sự đồng bộ hóa môi và sự liên kết âm thanh-hình ảnh cho đối thoại và tín hiệu cảnh.
- Đầu ra dài hơn (hỗ trợ lên đến ~60 giây / 1080p so với các clip rất ngắn của Veo 3, 8 giây) và nhiều lời nhắc bắn nhiều phát trình tự cho tính liên tục của câu chuyện.
- Mở rộng cảnh và Khung hình đầu tiên/cuối cùng chế độ mở rộng hoặc nội suy cảnh quay giữa các khung hình chính.
- Chèn đối tượng và loại bỏ đối tượng (sắp tới) và chỉnh sửa các nguyên mẫu bên trong Flow.
Mỗi dấu đầu dòng ở trên được thiết kế để giảm bớt công việc VFX thủ công: âm thanh và tính liên tục của cảnh bây giờ là những kết quả đầu ra hạng nhất chứ không phải là những suy nghĩ sau này.
Chi tiết kỹ thuật (hành vi và đầu vào của mô hình)
Dòng sản phẩm và các biến thể: Veo thuộc họ Veo-3 của Google; ID mô hình xem trước thường là veo3.1-pro; veo3.1 (Tài liệu CometAPI). Nó chấp nhận lời nhắc văn bản, tài liệu tham khảo hình ảnh (khung hình đơn hoặc chuỗi), và bố cục nhiều dấu nhắc có cấu trúc để tạo nhiều cảnh quay.
Độ phân giải và thời lượng: Tài liệu xem trước mô tả các đầu ra tại 720p / 1080p với các tùy chọn thời lượng dài hơn (lên đến ~60 giây trong một số cài đặt xem trước) và độ trung thực cao hơn so với các phiên bản Veo trước đó.
Tỷ lệ khía cạnh: 16:9 (được hỗ trợ) và 9:16 (được hỗ trợ ngoại trừ một số luồng hình ảnh tham chiếu).
Ngôn ngữ nhắc nhở: Tiếng Anh (xem trước).
Giới hạn API: giới hạn xem trước điển hình bao gồm tối đa 10 yêu cầu API/phút cho mỗi dự án, tối đa 4 video cho mỗi yêu cầuvà độ dài video có thể lựa chọn giữa 4, 6 hoặc 8 giây (các luồng hình ảnh tham chiếu hỗ trợ 8 giây).
Hiệu suất điểm chuẩn
Báo cáo đánh giá nội bộ và tóm tắt công khai của Google sở thích mạnh mẽ đối với đầu ra Veo 3.1 trên các so sánh của người đánh giá về các số liệu như căn chỉnh văn bản, chất lượng hình ảnhvà sự nhất quán về âm thanh-hình ảnh (nhiệm vụ văn bản→video và hình ảnh→video).
Đã đạt được Veo 3.1 nhà nước-of-the-art kết quả so sánh giữa người đánh giá và con người trên nhiều trục khách quan — sở thích chung, sự liên kết nhanh chóng (văn bản → video và hình ảnh → video), chất lượng hình ảnh, sự liên kết âm thanh-video và "vật lý thực tế về mặt hình ảnh" trên các tập dữ liệu chuẩn như MovieGenBench và VBench.
Những hạn chế và cân nhắc về an toàn
Hạn chế:
- Hiện vật và sự không nhất quán: bất chấp những cải tiến, một số ánh sáng, vật lý chi tiết và hiện tượng che khuất phức tạp vẫn có thể tạo ra hiện tượng nhiễu; tính nhất quán của hình ảnh→video (đặc biệt là trong thời gian dài) được cải thiện nhưng chưa hoàn hảo.
- Rủi ro thông tin sai lệch/deepfake: Âm thanh phong phú hơn + chèn/xóa đối tượng làm tăng nguy cơ sử dụng sai mục đích (âm thanh giả và clip mở rộng chân thực). Google ghi nhận các biện pháp giảm thiểu (chính sách, biện pháp bảo vệ) và các bản phát hành trước đó của Veo đã tham chiếu đến watermarking/SynthID để hỗ trợ nguồn gốc; tuy nhiên, các biện pháp bảo vệ kỹ thuật không loại bỏ được nguy cơ sử dụng sai mục đích.
- Ràng buộc về chi phí và thông lượng: Video độ phân giải cao, thời lượng dài tốn kém về mặt tính toán và hiện đang bị giới hạn trong bản xem trước trả phí—dự kiến độ trễ và chi phí sẽ cao hơn so với mô hình hình ảnh. Các bài đăng trong cộng đồng và chủ đề thảo luận trên diễn đàn Google sẽ thảo luận về các khung thời gian khả dụng và các chiến lược dự phòng.
Kiểm soát an toàn: Veo3.1 đã tích hợp các chính sách nội dung, tín hiệu watermark/synthID trong các bản phát hành Veo trước đó và kiểm soát quyền truy cập xem trước; khách hàng được khuyên nên tuân theo chính sách nền tảng và triển khai đánh giá thủ công đối với các đầu ra có rủi ro cao.
Các trường hợp sử dụng thực tế
- Tạo mẫu nhanh cho người sáng tạo: bảng phân cảnh → clip nhiều cảnh quay và hoạt hình với đối thoại bản địa để xem xét sáng tạo sớm.
- Tiếp thị và nội dung ngắn gọn: Quảng cáo sản phẩm, clip xã hội và video giới thiệu ý tưởng từ những năm 15–60, trong đó tốc độ quan trọng hơn tính chân thực hoàn hảo.
- Chuyển thể hình ảnh → video: biến hình minh họa, nhân vật hoặc hai khung hình thành các chuyển tiếp mượt mà hoặc các cảnh hoạt hình thông qua Khung hình đầu tiên/cuối cùng và Mở rộng cảnh.
- Tăng cường công cụ: được tích hợp vào Flow để chỉnh sửa lặp đi lặp lại (chèn/xóa đối tượng, cài đặt ánh sáng trước) giúp giảm số lần chỉnh sửa VFX thủ công.
So sánh với các mô hình hàng đầu khác
Veo 3.1 vs Veo 3 (tiền nhiệm): Veo 3.1 tập trung vào cải thiện sự tuân thủ nhanh chóng, chất lượng âm thanhvà tính nhất quán của nhiều lần bắn — các bản cập nhật gia tăng nhưng có tác động lớn nhằm mục đích giảm thiểu hiện tượng nhiễu và cải thiện khả năng chỉnh sửa.
Veo 3.1 so với OpenAI Sora 2: sự đánh đổi được báo chí đưa tin: Veo 3.1 nhấn mạnh kiểm soát tường thuật dạng dài hơn, tích hợp âm thanhvà tích hợp chỉnh sửa Flow; Sora 2 (khi so sánh trên báo chí) tập trung vào các điểm mạnh khác nhau (tốc độ, quy trình chỉnh sửa khác nhau). TechRadar và các trang tin khác coi Veo 3.1 là đối thủ cạnh tranh mục tiêu của Google với Sora 2 về khả năng hỗ trợ tường thuật và video dài hơn. Việc thử nghiệm độc lập song song vẫn còn hạn chế.
Cách gọi Phiên bản 3.1 API từ CometAPI
Phiên bản mô hình: veo3.1; veo3.1-pro
Veo 3.1 Giá API trong CometAPI,giảm giá 20% so với giá chính thức:
| vèo3.1 | 0.4000 |
| veo3.1-pro | 2.0000 |
Các bước cần thiết
- Đăng nhập vào " cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước
- Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp vào “Thêm mã thông báo” tại mã thông báo API trong trung tâm cá nhân, nhận khóa mã thông báo: sk-xxxxx và gửi.
- Lấy url của trang web này: https://api.cometapi.com/
Phương pháp sử dụng
- Chọn hàng
veo3.1; veo3.1-pro” điểm cuối để gửi yêu cầu API và thiết lập nội dung yêu cầu. Phương thức yêu cầu và nội dung yêu cầu được lấy từ tài liệu API của trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp thử nghiệm Apifox để thuận tiện cho bạn. - Thay thế bằng khóa CometAPI thực tế từ tài khoản của bạn.
- Chèn câu hỏi hoặc yêu cầu của bạn vào trường nội dung—đây là nội dung mà mô hình sẽ phản hồi.
- . Xử lý phản hồi API để nhận được câu trả lời đã tạo.
CometAPI cung cấp REST API hoàn toàn tương thích—để di chuyển liền mạch. Chi tiết chính:
- URL cơ sở: https://api.cometapi.com/v1/chat/completions
- Tên Model: veo3.1; veo3.1-pro
- Xác thực:
Bearer YOUR_CometAPI_API_KEYcú đội đầu - Loại-Nội dung:
application/json.
Xem thêm Sora 2


